- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在分析成绩数据。作为查看数据的新方法,我第一次使用决策树。我相信我的代码是正确的,现在我正在尝试解释它。这些特征是一系列测验获得的成绩,分类是学生获得的最终成绩。我有几个问题:
如果我的理解是正确的,每个节点都有一个测试和一个左分支代表测试为真,另一个代表假。当树似乎已经问了足够多的问题时,它就会说出“类”是什么。如果是这样的话,为什么在叶子之前的盒子上有一个 class= ?我本以为只有叶子有一个类=
如何“调整”整个树?好像盒子太多了。这是“过度拟合”的例子吗?我怎样才能更好地调整它?
例如,FINAL_GRADE_PA01 的使用似乎是基于数据顺序的任意使用。这是真的还是分析实际上得出结论认为该特征是最好的鉴别器?
最佳答案
如果我没记错的话,这些 class
值表明模型在该节点上停止分支时会预测什么。它仍然存储这些值,但如果有来自该节点的分支,它不会使用它们。
关于节点数量,如docs中所示:
The default values for the parameters controlling the size of the trees (e.g. max_depth, min_samples_leaf, etc.) lead to fully grown and unpruned trees which can potentially be very large on some data sets. To reduce memory consumption, the complexity and size of the trees should be controlled by setting those parameter values.
您可以使用多个参数来降低模型的复杂性。以下两个参数只是一个示例:
max_leaf_nodes : int or None, optional (default=None)
Grow a tree with max_leaf_nodes in best-first fashion. Best nodes are defined as relative reduction in impurity. If None then unlimited number of leaf nodes.
min_impurity_decrease : float, optional (default=0.)
A node will be split if this split induces a decrease of the impurity greater than or equal to this value.
关于machine-learning - 如何解释 sklearn.tree.export_graphviz 的输出?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49692891/
我正在使用 python sklearn RandomForestClassifier 并尝试导出决策树。 基本代码如下: from sklearn import tree with open(dot
我正在积极学习如何在 python 中实现决策树。 从 scikit-learn 重新创建 Iris 分类示例时,我得到一个存在于 export_graphviz 中的参数的 TypeError ,即
问题设置:我有一个不平衡的数据集,其中 98% 的数据属于 A 类,2% 属于 B 类。我训练了一个 DecisionTreeClassifier(来自 sklearn),其中 class_weigh
可以使用 pypi 的 pydotplus 来可视化决策树,但它在我的机器上有问题(它说它不是用 libexpat 构建的,因此它只在节点上显示数字而不是一张包含一些信息的表格),我想使用替代方法。我
有没有办法用export_graphviz来表示extratreesclasiffier的最终树?如果不是,如何在视觉上表现出来? 最佳答案 我认为没有办法从 sklearn.ensemble.Ext
使用以下代码: classes = ['ham', 'spam'] dot_data = StringIO() with open("./plots/ritesh.dot", "w") as f:
我正在分析成绩数据。作为查看数据的新方法,我第一次使用决策树。我相信我的代码是正确的,现在我正在尝试解释它。这些特征是一系列测验获得的成绩,分类是学生获得的最终成绩。我有几个问题: 如果我的理解是正确
我正在尝试在 IPython 中运行这个机器学习树算法代码: from sklearn.datasets import load_iris from sklearn.tree import Decis
我使用随机森林训练了我的模型,我想可视化决策树。然后,我想将export_graphviz转换为png文件。 from subprocess import call # Convert to png
我是一名优秀的程序员,十分优秀!