gpt4 book ai didi

python - 如何在 scikit 学习中将特征名称添加到决策树的输出

转载 作者:太空宇宙 更新时间:2023-11-03 11:00:57 25 4
gpt4 key购买 nike

我正在 scikit-learn 中构建决策树,然后想生成该树的 pdf。我输出树的工作流程大致如下。

vec = DictVectorizer()
data_vectorized = vec.fit_transform(data)
vec.get_feature_names() #Shows feature names

clf = tree.DecisionTreeClassifier()
clf = clf.fit(data_vectorized, Labels)

from sklearn.externals.six import StringIO
import pydot
dot_data = StringIO()
tree.export_graphviz(clf, out_file=dot_data)
graph = pydot.graph_from_dot_data(dot_data.getvalue())
graph.write_pdf("tree.pdf")

然而,此 pdf 的每个节点都显示了使用 data_vectorized[i] 对某些 i 进行的比较。当 data_vectorized 很大且稀疏时,这很难解释。

如何让它显示功能的名称?

此图显示了您获得的示例(当特征位于变量 X 中时。例如,我希望将 X[2] 替换为特征名称。

enter image description here

最佳答案

尝试将导出更改为:

tree.export_graphviz(clf, out_file=dot_data, feature_names=vec.get_feature_names()) 

关于python - 如何在 scikit 学习中将特征名称添加到决策树的输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32530283/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com