gpt4 book ai didi

python - 可视化和聚类

转载 作者:行者123 更新时间:2023-11-30 23:58:09 25 4
gpt4 key购买 nike

早些时候我发布了一个关于可视化和聚类的问题。我想我的问题不够清楚,所以我再次发布。我希望这次我能做出更好的解释。我也为我的旧问题没有“接受答案”而道歉。我不知道我能做到这一点,直到有人指出。从现在开始我一定会这么做的。

好的。回到问题。之前我写了一个python脚本来计算文档之间的相似度。现在我将所有数据写入记事本,如下所示:

(1, 6821): inf

(1, 8): 3.458911570

(1, 9): 7.448105193

(1, 10): inf

(1, 11): inf

(6821, 8): inf

(6821, 9): inf

(6821, 10): inf

(6821, 11): inf

(8, 9): 2.153308936

(8, 10): inf

(8, 11): 16.227647992

(9, 10): inf

(9, 11): 34.943139430

(10, 11): inf

括号中的数字代表文档编号。它后面的值是两个文档之间的距离。我想要的实际上是可视化工具或方法,我可以创建代表每个文档编号的节点。例如,我有 6 个不同的文档。所以我希望创建 6 个不同的节点来代表我的文档编号。然后,我想要根据这些节点的距离将它们连接在一起的边。例如,文档 1 和 8 之间的距离是 3.46,而文档 1 和 9 之间的距离是 7.45。因此,1 和 8 需要比 1 和 9 聚集得更近。而具有“inf”距离的文档对不应该有任何连接或边缘将它们连接在一起。

这听起来很容易,但我真的很难找到一个可以有效帮助我执行此操作的开源可视化工具。我很感激任何建议。

最佳答案

你试过吗GraphViz ?我在这样的情况下使用它。我还没有尝试过改变节点连接的长度,你必须弄清楚这一点。查看list of example graphs作为起点。

关于python - 可视化和聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3250328/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com