machine-learning - 如何解释 sklearn.tree.export

machine-learning - 如何解释 sklearn.tree.export_graphviz 的输出？

转载作者：行者123 更新时间：2023-11-30 08:45:54

25

4

我正在分析成绩数据。作为查看数据的新方法，我第一次使用决策树。我相信我的代码是正确的，现在我正在尝试解释它。这些特征是一系列测验获得的成绩，分类是学生获得的最终成绩。我有几个问题:

如果我的理解是正确的，每个节点都有一个测试和一个左分支代表测试为真，另一个代表假。当树似乎已经问了足够多的问题时，它就会说出“类”是什么。如果是这样的话，为什么在叶子之前的盒子上有一个 class= ？我本以为只有叶子有一个类=
如何“调整”整个树？好像盒子太多了。这是“过度拟合”的例子吗？我怎样才能更好地调整它？
例如，FINAL_GRADE_PA01 的使用似乎是基于数据顺序的任意使用。这是真的还是分析实际上得出结论认为该特征是最好的鉴别器？

最佳答案

如果我没记错的话，这些 class 值表明模型在该节点上停止分支时会预测什么。它仍然存储这些值，但如果有来自该节点的分支，它不会使用它们。

关于节点数量，如docs中所示:

The default values for the parameters controlling the size of the trees (e.g. max_depth, min_samples_leaf, etc.) lead to fully grown and unpruned trees which can potentially be very large on some data sets. To reduce memory consumption, the complexity and size of the trees should be controlled by setting those parameter values.

您可以使用多个参数来降低模型的复杂性。以下两个参数只是一个示例:

max_leaf_nodes : int or None, optional (default=None)

Grow a tree with max_leaf_nodes in best-first fashion. Best nodes are defined as relative reduction in impurity. If None then unlimited number of leaf nodes.

min_impurity_decrease : float, optional (default=0.)

A node will be split if this split induces a decrease of the impurity greater than or equal to this value.

关于machine-learning - 如何解释 sklearn.tree.export_graphviz 的输出？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49692891/

25

4

0

文章推荐： java - 一个类中有多个 FlowLayouts？

python - “DecisionTreeClassifier”对象没有属性 'export_graphviz'
我正在使用 python sklearn RandomForestClassifier 并尝试导出决策树。基本代码如下: from sklearn import tree with open(dot
Python - export_graphviz class_name 类型错误
我正在积极学习如何在 python 中实现决策树。从 scikit-learn 重新创建 Iris 分类示例时，我得到一个存在于 export_graphviz 中的参数的 TypeError ，即
python - 了解 export_graphviz 的决策树输出
问题设置:我有一个不平衡的数据集，其中 98% 的数据属于 A 类，2% 属于 B 类。我训练了一个 DecisionTreeClassifier(来自 sklearn)，其中 class_weigh
python - sklearn.tree.export_graphviz 备选方案
可以使用 pypi 的 pydotplus 来可视化决策树，但它在我的机器上有问题(它说它不是用 libexpat 构建的，因此它只在节点上显示数字而不是一张包含一些信息的表格)，我想使用替代方法。我
python-3.x - export_graphviz extratreesclassifier python可视化
有没有办法用export_graphviz来表示extratreesclasiffier的最终树？如果不是，如何在视觉上表现出来？最佳答案我认为没有办法从 sklearn.ensemble.Ext
python-2.7 - "class_names"in export_graphviz 意外关键字错误
使用以下代码: classes = ['ham', 'spam'] dot_data = StringIO() with open("./plots/ritesh.dot", "w") as f:
machine-learning - 如何解释 sklearn.tree.export_graphviz 的输出？
我正在分析成绩数据。作为查看数据的新方法，我第一次使用决策树。我相信我的代码是正确的，现在我正在尝试解释它。这些特征是一系列测验获得的成绩，分类是学生获得的最终成绩。我有几个问题: 如果我的理解是正确
python-3.x - 为什么在使用 export_graphviz 时我的 image_path 未定义？ - python 3
我正在尝试在 IPython 中运行这个机器学习树算法代码: from sklearn.datasets import load_iris from sklearn.tree import Decis
python - 文件未找到错误: [WinError 2] The system cannot find the file specified when using export_graphviz
我使用随机森林训练了我的模型，我想可视化决策树。然后，我想将export_graphviz转换为png文件。 from subprocess import call # Convert to png

首页

博学

6Ren·AI

商城

machine-learning - 如何解释 sklearn.tree.export_graphviz 的输出？