- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我观察到 scikit-learn clf.tree_.feature 偶尔返回负值。例如-2。据我了解 clf.tree_.feature 应该返回功能的顺序。如果我们有特征名称数组['feature_one', 'feature_two', 'feature_three']
,那么 -2 将指代 feature_two
.我对负索引的使用感到惊讶。引用 feature_two
更有意义按索引 1。(-2 是便于人类消化的引用,而不是机器处理的引用)。我读对了吗?
更新:下面是一个例子:
def leaf_ordering():
X = np.genfromtxt('X.csv', delimiter=',')
Y = np.genfromtxt('Y.csv',delimiter=',')
dt = DecisionTreeClassifier(min_samples_leaf=10, random_state=99)
dt.fit(X, Y)
print(dt.tree_.feature)
[ 8 9 -2 -2 9 4 -2 9 8 -2 -2 0 0 9 9 8 -2 -2 9 -2 -2 6 -2 -2 -2
2 -2 9 8 6 9 -2 -2 -2 8 9 -2 9 6 -2 -2 -2 6 -2 -2 9 -2 6 -2 -2
2 -2 -2]
最佳答案
通过阅读树生成器的 Cython 源代码,我们看到 -2 只是叶节点特征拆分属性的虚拟值。
Line 63
TREE_UNDEFINED = -2
if is_leaf:
# Node is not expandable; set node as leaf
node.left_child = _TREE_LEAF
node.right_child = _TREE_LEAF
node.feature = _TREE_UNDEFINED
node.threshold = _TREE_UNDEFINED
关于scikit-learn - clf.tree_.feature 的输出是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39708304/
在进行拟合时,我总是会遇到类似的代码 clf = svm.SVC(kernel='linear', C=1).fit(X_train, y_train) (来自 http://scikit-learn
任何人都可以检查以下代码的问题吗?我在构建模型的任何步骤中都错了吗?我已经在参数中添加了两个“clf__”。 clf=RandomForestClassifier() pca = PCA() pca_
我有许多类和对应的特征向量,当我运行 predict_proba() 时,我会得到这个: classes = ['one','two','three','one','three'] feature =
我观察到 scikit-learn clf.tree_.feature 偶尔返回负值。例如-2。据我了解 clf.tree_.feature 应该返回功能的顺序。如果我们有特征名称数组['featur
我正在尝试构建决策树,并在网上找到了以下代码。 我的问题是: clf.score(X_train,Y_train) 在决策树中评估什么?输出如下面的屏幕截图所示,我想知道该值是什么? clf = De
Y_预测= [ 1.22770607 -0.04569864 2.23941551 1.35143415 1.28991445 0.01398049 1.05511961 1.84491
我有一个 pandas 数据框,用于二元分类案例(类别 A 和类别 B)。为了获得 X_train、X_test、y_train、y_test,我按 70:30 拆分,如下所示: from sklea
我正在尝试使用animation.FuncAnimation制作最简单的matplotlib动画。我不关心效率。我不想跟踪绘制的线并更新它们的数据(在我想要的应用程序中这会很烦人),我只是想在对每一帧
我正在构建一个模型 clf 说 clf = MultinomialNB() clf.fit(x_train, y_train) 然后我想使用分数查看我的模型准确性 clf.score(x_train,
Matplotlib 提供以下功能: cla() # Clear axis clf() # Clear figure close() # Close a figure window 我应该什么
在matplotlib.pyplot中,plt.clf()和plt.close()有什么区别?它们会以同样的方式运作吗? 我正在运行一个循环,在每次迭代结束时,我都会生成一个图形并保存该图。在第一次尝
我正在为一个研究项目绘制一些天气数据。该图由 18 个时间步组成。我认为实现此目的的最佳方法是为每个时间步长创建一个新图,将其保存为文件,然后为下一个时间步长创建一个新图(使用 for 循环)。 例如
python 。学习。 随机森林分类器。在拟合 RandomForestClassifier 之后,它是否会生成某种可用于创建 graphviz 的单一“最佳”“平均”共识树? 是的,我查看了文档。不
我想用多项式核 svm 计算原始变量 w,但为此我需要计算 clf.coef_ * clf.support_vectors_。除了 linear 之外,所有内核类型的访问都仅限于 .coef_ - 这
我是一名优秀的程序员,十分优秀!