- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在研究 Networkx
.MultiDiGraph()
从总共 82927 个定向电子邮件数据构建的对象。在当前阶段,我正在尝试从 .MultiDiGraph()
中获取最大的强连接组件。对象及其对应的子图。可以访问文本数据here .这是我的工作代码:
import networkx as nx
import pandas as pd
import matplotlib.pyplot as plt
email_df = pd.read_csv('email_network.txt', delimiter = '->')
edge_groups = email_df.groupby(["#Sender", "Recipient"], as_index=False).count().rename(columns={"time":"weight"})
email = nx.from_pandas_dataframe(edge_groups, '#Sender', 'Recipient', edge_attr = 'weight')
G = nx.MultiDiGraph()
G.add_edges_from(email.edges(data=True))
# G is a .MultiDiGraph object
# using .strongly_connected_components() to get the part of G that has the most nodes
# using list comprehension
number_of_nodes = [len(n) for n in sorted(nx.strongly_connected_components(G))]
number_of_nodes
# 'number_of_nodes' return a list of [1, 1, 1,...,1] of length 167 (which is the exact number of nodes in the network)
# using the recommended method in networkx documentation
largest = max(nx.strongly_connected_components(G), key=len)
largest
# 'largest' returns {92}, not sure what this means...
正如我在上面的代码块中指出的那样,列表理解方法返回一个长度为 167(这是我的数据中的节点总数)的 [1, 1, 1,..., 1] 的列表,而max(nx.strongly_connected_components(G), key=len)
返回 {92}
,我不确定这是什么意思。
看来我的代码有问题,我可能错过了处理数据的几个关键步骤。有谁愿意看一看并启发我吗?
谢谢。
注意:修改后的代码(感谢 Eric 和 Joel)
import networkx as nx
import pandas as pd
import matplotlib.pyplot as plt
email_df = pd.read_csv('email_network.txt', delimiter = ' ')
edge_groups = email_df.groupby(["#Sender", "Recipient"], as_index=False).count().rename(columns={"time":"weight"})
# per @Joel's comment, adding 'create_using = nx.DiGraph()'
email = nx.from_pandas_dataframe(edge_groups, '#Sender', 'Recipient', edge_attr = 'weight', create_using = nx.DiGraph())
# adding this 'directed' edge list to .MultiDiGraph() object
G = nx.MultiDiGraph()
G.add_edges_from(email.edges(data=True))
我们现在检查该网络中最大的强连通组件(根据节点数量)。
In [1]: largest = max(nx.strongly_connected_components(G), key=len)
In [2]: len(largest)
Out [2]: 126
最大的强连通组件由 126 个节点组成。
[更新]经过进一步的尝试和错误,我发现需要使用 create_using = .MultiDiGraph()
(而不是 .DiGraph()
)将数据加载到 networkx
上时,否则,即使您为 MultiDiGraph
获得了正确数量的节点及其弱/强连接子图,您可能仍然会弄错边数!这会反射(reflect)在你身上.strongly_connected_subgraphs()
输出。
对于我这里的情况,我会推荐其他人使用这个单行
import networkx as nx
import pandas as pd
import matplotlib.pyplot as plt
G = nx.read_edgelist(path="email_network.txt", data=[('time', int)], create_using=nx.MultiDiGraph(), nodetype=str)
我们可以实现.strongly_connected_components(G)
和 strongly_connected_subgraphs
进行验证。
如果您使用 networkx
输出 G
从第一个代码块开始,max(nx.strongly_connected_components(G), key=len)
将给出一个包含 126 个节点和 52xx 个边缘的输出,但是如果你应用我上面列出的单行代码,你将得到:
In [1]: largest = max(nx.strongly_connected_components(G), key=len)
In [2]: G_sc = max(nx.strongly_connected_subgraphs(G), key=len)
In [3]: nx.number_of_nodes(G_sc)
Out [3]: 126
In [4]: nx.number_of_nodes(G_sc)
Out [4]: 82130
由于与不同的 networkx
相关联的计数机制不同,您将使用这两种方法获得相同数量的节点,但边缘数量不同图类。
最佳答案
错误的根本原因是 nx.from_pandas_dataframe
默认创建无向图。所以 email
是一个无向图。当您随后创建有向图时,每条边仅出现在一个方向上。
要修复它,请使用带有参数 create_using = DiGraph
的 nx.from_pandas_dataframe
与您得到的输出相关的旧评论
所有强连接组件都有一个节点。
当您执行 max(nx.strongly_connected_components(G), key=len)
时,它会找到长度最长的节点集并将其返回。在你的例子中,它们的长度都是 1,所以它返回其中一个(我相信无论哪个 networkx 碰巧首先放入 nx.strongly_connected_components(G)
)。但它返回的是集合,而不是长度。所以 {92}
是它返回的节点集。
碰巧 {92}
被决胜局选为 nx.strongly_connected_components(G)
中“最长”长度为 1 的组件。
例子:
max([{1}, {3}, {5}], key = len)
> {1}
关于python - 有向图的最大强连通分量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46316874/
1、前言 在数字化时代,自动化工具成为了提升工作效率和生产力的重要手段。Python作为一种广泛使用的编程语言,以其强大的功能和易用性受到许多开发者的青睐。 而今天给大家推荐一款开源的自动化脚本工具
我有一个 UIViewController,它引用了一个重复调用闭包的 Timer 对象。 Timer 对象在其 block 中捕获 self。据我所知,这会导致 View Controller 和
在当今软件开发的快速迭代中,接口自动化测试已成为确保代码质量和服务稳定性的关键步骤。 随着微服务架构和分布式系统的广泛应用,对接口自动化测试平台的需求也日益增长。 今天,我将为大家推荐一款强大的开
这个问题在这里已经有了答案: Is Python strongly typed? (13 个答案) 关闭 9 年前。 我了解到 Python 是一种强动态类型的语言。 动态:变量的类型在执行时确定,
想象以下使用手动内存管理(也称为非 ARC)的场景: 我有一个将 block 传递给类方法的 VC。在执行 block 之前,VC 从 UINavigationController 中弹出。 __bl
我已阅读this article关于Java中不同类型的引用(强引用、软引用、弱引用、幻像引用),但我不太理解。 这些引用类型之间有什么区别?每种类型何时使用? 最佳答案 Java 提供了两种不同类型
我需要两个选择器: 一个用于 h2 元素中的普通文本 还有一个用于 strong 标记内的文本 第一个是与: 选择器:'h2.flashHeader' 但是 选择器:'h2.flashHeader S
`我承认我不是 ARC 和保留周期方面的专家,尽管通过一些研究和一些很棒的文章(如 this),我相信我已经掌握了基础知识。 但是,我现在很困惑。我有一个属性定义如下。 @property (nona
就像这是非原子的 COPY 的 Setter @property (copy, nonatomic) NSString *someString; -(void)setSomeString:(NSStr
我有一个按钮的以下操作,它切换一个对象是显示为最喜欢的还是不最喜欢的: - (IBAction)addToFavorites:(UIButton *)sender { if ([object is
这个问题在这里已经有了答案: How to make my font bold using css? (10 个答案) 关闭 3 个月前。 在我网页上的整个文本和标题中,我需要将某些词加粗,而其他词
在我的项目中,我使用了 Storyboard,当我访问一个 UI 元素时,我创建了一个属性并将其链接。这个属性很弱。据我了解,该属性可能很弱,因为它已经添加到 View 中并且 View 保留了它。
我正在寻找有关 TLS/SSL 密码套件强度的信息。 例如,当在 chrome 上按 F12 时,会出现一个包含密码协议(protocol)和套件信息的安全概览选项卡。 Chrome 安全选项卡示例:
我使用 Xcode 中的分析工具(分配)发现的是,当您清零一个属性时,它不会被释放,直到父类被清空。现在假设你想确保你不会在内存中保留一个昂贵的模态视图 Controller (假设它不会经常使用),
下面的 Parent 类具有对单个子对象的强引用和弱引用。永远不会释放子对象。移除弱引用, child 就被释放了。 需要调用 Mirror 方法来进行此泄漏,但我不明白为什么使用 Mirror 会导
大家好,我是狂师! 今天给大家推荐一款开源的HTTP测试工具:Hurl,相比curl、wget功能更强大,且更容易上手、很适用新手使用。 1、项目介绍 Hurl是一个使用Rust语言开发的命令行
当我从 Storyboard 控制拖动导出时,默认情况下我得到了 strong 属性。我正在使用 Xcode 9.4.1 .以下代码是它的样子。是不是因为 XCode 与 Swift 兼容,所以在 S
这两个Objective-C声明之间有什么区别? 我一直在看一些Apple源代码示例,他们在各种情况下都使用了第二个示例。我只是想了解为什么和何时最好使用第二个版本而不是第一个版本(我知道 stron
我已经在 AWS Linux 实例上安装了 Strong-pm: [root@box]# npm -g install strongloop strong-pm [root@box]# sl-pm-i
我似乎还没有遇到问题,但我正在努力确保我使用了一些最佳实践。 假设我有一个 UITableViewController,它的数据源是 MyObject 对象的 NSArray。所以在我的 UITabl
我是一名优秀的程序员,十分优秀!