python - 是否可以在 scikit-learn 的 DecisionTreeRegressor 中检索每个叶子中的火车行 ID？-6ren

python - 是否可以在 scikit-learn 的 DecisionTreeRegressor 中检索每个叶子中的火车行 ID？

转载作者：行者123 更新时间：2023-11-28 18:34:47

25

4

目前，我可以检索我在训练样本上生长的每个节点的 ID，我的测试样本的每一行最有可能属于:

tree.tree_.apply(np.array(X_test).astype(np.float32)) 其中 X_test 表示决策树的输入。

但是，对于我生长的树的每一片叶子，我想获取其中包含的训练样本的 ID。这样我就可以知道哪个训练样本与一个测试输入最相似。

最佳答案

我最终对我的训练样本使用了“apply”函数来获取它所属的 leaf_id。

def get_nearest_points(self, tr, input_train):
  inside_leaves = {}
  tmp = tr.tree_.apply(np.array(input_train).astype(np.float32))
  leaves_list = set(tmp)

  for leaf in leaves_list:
    inside_leaves[leaf] = [idx for idx, elt in enumerate(tmp) if elt == leaf]
  return inside_leaves

inside_leaves 现在是一个字典，其中包含每个 leaf_id 包含此叶中涉及的行的列表。

关于python - 是否可以在 scikit-learn 的 DecisionTreeRegressor 中检索每个叶子中的火车行 ID？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33545888/

25

4

0

文章推荐： javascript - 更改鼠标悬停标题上的文字颜色

文章推荐： ios - ARC 提示实例变量

python - DecisionTreeRegressor 参数调整的分数会引发错误
我正在使用 DecisionTreeRegressor 调整模型。 tuned_parameters = [{'splitter': ['best'], 'max_leaf_nodes': [2,
python - tree.DecisionTreeRegressor 是模型树还是回归树？
我的理解是: 在回归树中:每个叶子的目标值计算为在训练期间到达该叶子的实例的目标值的平均值。在模型树中:每个叶子的值都是使用特征子集的线性函数，通过对训练期间到达该叶子的实例执行线性回归来确定。 s
python - tree.DecisionTreeRegressor 是模型树还是回归树？
我的理解是: 在回归树中:每个叶子的目标值计算为在训练期间到达该叶子的实例的目标值的平均值。在模型树中:每个叶子的值都是使用特征子集的线性函数，通过对训练期间到达该叶子的实例执行线性回归来确定。 s
python - 未计算 DecisionTreeRegressor 分数
我正在尝试使用以下代码计算 DecisionTreeRegressor 的分数: from sklearn import preprocessing from sklearn.model_select
python - 解释 DecisionTreeRegressor 分数？
我正在尝试评估特征的相关性，并且我正在使用DecisionTreeRegressor() 相关部分代码如下: # TODO: Make a copy of the DataFrame, using t
python - 获取 DecisionTreeRegressor 中叶节点的值
我一直在尝试分析我在 sklearn 中训练的 DecisionTreeRegressor。我发现http://scikit-learn.org/stable/auto_examples/tree/p
python - sklearn 中 DecisionTreeRegressor 的自定义标准
我想使用 DecisionTreeRegressor 进行多输出回归，但我想为每个输出使用不同的“重要性”权重(例如，准确预测 y1 的重要性是预测 y2 的两倍)。有没有办法将这些权重直接包含在
python - DecisionTreeRegressor 的 Predict_proba 的等效项
scikit-learn 的 DecisionTreeClassifier 支持通过 predict_proba() 函数预测每个类的概率。 DecisionTreeRegressor 中不存在这一点
python - DecisionTreeRegressor 中的 random_state 是什么？
有什么区别:DecisionTreeRegressor(splitter='random') 和 DecisionTreeRegressor(splitter='best') 如果两者似乎都抛出随机预
python - sklearn 的 DecisionTreeRegressor 的回归预测是简单平均值吗？
我试图弄清楚决策树回归预测是如何生成的。我所介绍的文档中没有对此进行详细解释。来自sklearn DecisionTreeRegressor documentation关于预测函数: For a c
python - scikit-learn 的 DecisionTreeRegressor 是否进行真正的多输出回归？
我遇到了一个需要我们使用多维 Y 的 ML 问题。现在我们正在这个输出的每个维度上训练独立的模型，它没有利用来自事实输出相关的附加信息. 我一直在读this了解更多关于已真正扩展以处理多维输出的少数
python - 从 sklearn 导入 DecisionTreeRegressor >> ImportError
(1) 运行 Windows 8(2) 下载并安装，Anaconda for Windows, PYTHON 2.7 (3) 来自 Anaconda 提示符: conda install scikit
python - 在 scikit-learn 中获取 DecisionTreeRegressor 的叶节点处的值分布
默认情况下，scikit-learn DecisionTreeRegressor 返回给定叶节点中训练集中所有目标值的平均值。但是，我有兴趣从我的训练集中取回落入预测叶节点的目标值列表。这将使我能够
python - GridSearchCV 给出 ValueError : continuous is not supported for DecisionTreeRegressor
我正在学习机器学习并完成波士顿房价预测任务。我有以下代码: from sklearn.metrics import fbeta_score, make_scorer from sklearn.mode
python - 如何在 scikit-learn DecisionTreeRegressor 中使用实际的特征名称而不是 "X"？
我想这是可能的，因为在 fit 函数的定义中 it says : X : array-like, shape = [n_samples, n_features] 现在我有，我当然可以生成决策树的字符
python - 是否可以在 scikit-learn 的 DecisionTreeRegressor 中检索每个叶子中的火车行 ID？
目前，我可以检索我在训练样本上生长的每个节点的 ID，我的测试样本的每一行最有可能属于: tree.tree_.apply(np.array(X_test).astype(np.float32)) 其
python-2.7 - 您可以从 scikit-learn 中的 DecisionTreeRegressor 获取选定的叶子吗
正在阅读本文great paper并尝试实现这一点: ...我们对待每一个人树作为一个分类特征，以实例最终落入的叶子的索引。我们使用 1-此类特征的 of-K 编码。例如，考虑图 1 中的提升树模型有
python - sklearn.tree.DecisionTreeRegressor : depth of tree is bigger than specified when max_leaf_nodes ! = 无
我目前正在研究一个预测问题，当我遇到以下问题时，我试图用 scikit-learns DecisionTreeRegressor 解决这个问题: When fitting a tree specify

首页

博学

6Ren·AI

商城

python - 是否可以在 scikit-learn 的 DecisionTreeRegressor 中检索每个叶子中的火车行 ID？