pycaret_predict: feature_importance.py comparison

planemo upload for repository https://github.com/goeckslab/gleam commit b430f8b466655878c3bf63b053655fdbf039ddb0

comparison

equal deleted inserted replaced

-:a32ff7201629
+:f4cb41f458fd
 # Ensure feature alignment
 if hasattr(model, "feature_name_"):
 used_features = model.feature_name_
 elif hasattr(model, "booster_") and hasattr(model.booster_, "feature_name"):
 used_features = model.booster_.feature_name()
+elif hasattr(model, "feature_names_in_"):
+# scikit‐learn's standard attribute for the names of features used during fit
+used_features = list(model.feature_names_in_)
 else:
 used_features = X_transformed.columns
 if any(tc in model_class_name for tc in tree_classes):
 explainer = shap.TreeExplainer(model)
 X_shap = X_transformed[used_features]
 shap_values = explainer.shap_values(X_shap)
 plot_X = X_shap
 plot_title = f"SHAP Summary for {model_class_name} (TreeExplainer)"
 else:
-sampled_X = X_transformed[used_features].sample(100, random_state=42)
+logging.warning(f"len(X_transformed) = {len(X_transformed)}")
+max_samples = 100
+n_samples = min(max_samples, len(X_transformed))
+sampled_X = X_transformed[used_features].sample(
+n=n_samples,
+replace=False,
+random_state=42
+)
 explainer = shap.KernelExplainer(model.predict, sampled_X)
 shap_values = explainer.shap_values(sampled_X)
 plot_X = sampled_X
 plot_title = f"SHAP Summary for {model_class_name} (KernelExplainer)"

Mercurial > repos > goeckslab > pycaret_predict