gpt4 book ai didi

python - 使用 Python 生成连接/网络图

转载 作者:太空狗 更新时间:2023-10-29 22:23:12 27 4
gpt4 key购买 nike

我有一个包含大约 850 万个数据点的文本文件,格式如下:

Company 87178481
Company 893489
Company 2345788
[...]

我想用Python创建一个连接图,看看公司之间的网络是什么样子的。从上面的示例中,如果第二列中的值相同,则两家公司将共享优势(来自/针对 Hooked 的说明)。

我一直在使用 NetworkX 包并且已经能够为几千个点生成一个网络,但是它没有通过完整的 850 万个节点的文本文件。我跑了大概15个小时左右,回来的时候shell里的光标还在闪烁,但是没有输出图。

假设它仍在运行是否安全?是否有更好/更快/更简单的方法来绘制数百万个点?

最佳答案

如果您有 1000,000 个数据点,您将需要某种方式来查看全局。根据您要寻找的确切内容,如果您可以在公司之间分配一个“距离”(比如分开的连接数),您可以通过 Dendrogram 可视化关系(或集群) .

Scipy 做聚类:

http://docs.scipy.org/doc/scipy/reference/cluster.hierarchy.html#module-scipy.cluster.hierarchy

并具有将它们转换为树状图以进行可视化的功能:

http://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.hierarchy.dendrogram.html#scipy.cluster.hierarchy.dendrogram

通过 networkx 的最短路径距离函数示例:

http://networkx.lanl.gov/reference/generated/networkx.algorithms.shortest_paths.generic.shortest_path.html#networkx.algorithms.shortest_paths.generic.shortest_path

最终,您必须决定如何对图中两家公司(顶点)之间的距离进行加权。

关于python - 使用 Python 生成连接/网络图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13073066/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com