gpt4 book ai didi

apache-spark - 如何在 Apache Spark (PySpark 1.4.1) 中可视化/绘制决策树?

转载 作者:行者123 更新时间:2023-12-02 06:29:04 25 4
gpt4 key购买 nike

我正在使用 Apache Spark Mllib 1.4.1(PySpark,Spark 的 Python 实现)根据我拥有的 LabeledPoint 数据生成决策树。树正确生成,我可以使用以下命令将其打印到终端(提取规则,因为该用户称之为 How to extract rules from decision tree spark MLlib ):

model = DecisionTree.trainClassifier( ... )
print(model.toDebugString()

但我想做的是可视化或绘制决策树,而不是将其打印到终端。有什么方法可以在 PySpark 中绘制决策树,或者可以保存决策树数据并使用 R 来绘制它?谢谢!

最佳答案

有这个项目Decision-Tree-Visualization-Spark用于可视化决策树模型

有两个步骤

  • 将 Spark 决策树输出解析为 JSON格式。
  • 使用 JSON 文件作为 D3.js 的输入可视化。

用于解析器检查Dt.py

函数 def tree_json(tree) 的输入是您的模型 toDebugString()

来自question的回答

关于apache-spark - 如何在 Apache Spark (PySpark 1.4.1) 中可视化/绘制决策树?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31853979/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com