scikit-learn - clf.tree_.feature 的输出是什么？-6ren

scikit-learn - clf.tree_.feature 的输出是什么？

转载作者：行者123 更新时间：2023-12-04 08:04:35

24

4

我观察到 scikit-learn clf.tree_.feature 偶尔返回负值。例如-2。据我了解 clf.tree_.feature 应该返回功能的顺序。如果我们有特征名称数组['feature_one', 'feature_two', 'feature_three'] ，那么 -2 将指代 feature_two .我对负索引的使用感到惊讶。引用 feature_two 更有意义按索引 1。(-2 是便于人类消化的引用，而不是机器处理的引用)。我读对了吗？

更新:下面是一个例子:

def leaf_ordering():
    X = np.genfromtxt('X.csv', delimiter=',')
    Y = np.genfromtxt('Y.csv',delimiter=',')
    dt = DecisionTreeClassifier(min_samples_leaf=10, random_state=99)
    dt.fit(X, Y)
    print(dt.tree_.feature)

这是文件 X和 Y

这是输出:

    [ 8  9 -2 -2  9  4 -2  9  8 -2 -2  0  0  9  9  8 -2 -2  9 -2 -2  6 -2 -2 -2
  2 -2  9  8  6  9 -2 -2 -2  8  9 -2  9  6 -2 -2 -2  6 -2 -2  9 -2  6 -2 -2
  2 -2 -2]

最佳答案

通过阅读树生成器的 Cython 源代码，我们看到 -2 只是叶节点特征拆分属性的虚拟值。

Line 63

TREE_UNDEFINED = -2

Line 359

if is_leaf:
    # Node is not expandable; set node as leaf
    node.left_child = _TREE_LEAF
    node.right_child = _TREE_LEAF
    node.feature = _TREE_UNDEFINED
    node.threshold = _TREE_UNDEFINED

关于scikit-learn - clf.tree_.feature 的输出是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39708304/

24

4

0

文章推荐： wolfram-mathematica - 由 JLink 或 UseFrontEnd 生成的未捕获 throw

文章推荐： amazon-web-services - AWS cli 今天开始随机失败......？

python - clf 在机器学习中是什么意思？
在进行拟合时，我总是会遇到类似的代码 clf = svm.SVC(kernel='linear', C=1).fit(X_train, y_train) (来自 http://scikit-learn
python - sklearn 中估算器管道的参数 clf 无效
任何人都可以检查以下代码的问题吗？我在构建模型的任何步骤中都错了吗？我已经在参数中添加了两个“clf__”。 clf=RandomForestClassifier() pca = PCA() pca_
python - 如何在 clf.predict_proba() 中找到对应的类
我有许多类和对应的特征向量，当我运行 predict_proba() 时，我会得到这个: classes = ['one','two','three','one','three'] feature =
scikit-learn - clf.tree_.feature 的输出是什么？
我观察到 scikit-learn clf.tree_.feature 偶尔返回负值。例如-2。据我了解 clf.tree_.feature 应该返回功能的顺序。如果我们有特征名称数组['featur
python - clf.score(X_train,Y_train) 在决策树中评估什么？
我正在尝试构建决策树，并在网上找到了以下代码。我的问题是: clf.score(X_train,Y_train) 在决策树中评估什么？输出如下面的屏幕截图所示，我想知道该值是什么？ clf = De
python - clf.score(X_test,Y_test) 如何用于线性回归？
Y_预测= [ 1.22770607 -0.04569864 2.23941551 1.35143415 1.28991445 0.01398049 1.05511961 1.84491
python - 如何在 clf.predict_proba(X_test) 中获得更多小数？
我有一个 pandas 数据框，用于二元分类案例(类别 A 和类别 B)。为了获得 X_train、X_test、y_train、y_test，我按 70:30 拆分，如下所示: from sklea
python - 通过 clf() 处理每一帧来制作 matplotlib 动画
我正在尝试使用animation.FuncAnimation制作最简单的matplotlib动画。我不关心效率。我不想跟踪绘制的线并更新它们的数据(在我想要的应用程序中这会很烦人)，我只是想在对每一帧
python - scikit learn clf.fit/评分模型准确性
我正在构建一个模型 clf 说 clf = MultinomialNB() clf.fit(x_train, y_train) 然后我想使用分数查看我的模型准确性 clf.score(x_train,
python - 何时使用 cla()、clf() 或 close() 清除绘图
Matplotlib 提供以下功能: cla() # Clear axis clf() # Clear figure close() # Close a figure window 我应该什么
python - plt.close() 和 plt.clf() 之间的区别
在matplotlib.pyplot中，plt.clf()和plt.close()有什么区别？它们会以同样的方式运作吗？我正在运行一个循环，在每次迭代结束时，我都会生成一个图形并保存该图。在第一次尝
python - 循环绘图(使用 basemap 和 pyplot)....pyplot.clf() 的问题
我正在为一个研究项目绘制一些天气数据。该图由 18 个时间步组成。我认为实现此目的的最佳方法是为每个时间步长创建一个新图，将其保存为文件，然后为下一个时间步长创建一个新图(使用 for 循环)。例如
python - 从 sklearn RandomForestClassifier(而不是从单个 clf.estimators_)制作 graphviz
python 。学习。随机森林分类器。在拟合 RandomForestClassifier 之后，它是否会生成某种可用于创建 graphviz 的单一“最佳”“平均”共识树？是的，我查看了文档。不
python - scikit-learn 只允许使用线性 svms 访问 clf.coef_ 是有原因的吗？
我想用多项式核 svm 计算原始变量 w，但为此我需要计算 clf.coef_ * clf.support_vectors_。除了 linear 之外，所有内核类型的访问都仅限于 .coef_ - 这

首页

博学

6Ren·AI

商城

scikit-learn - clf.tree_.feature 的输出是什么？