gpt4 book ai didi

python - 识别树中的根 parent 及其所有 child

转载 作者:太空宇宙 更新时间:2023-11-03 20:16:01 25 4
gpt4 key购买 nike

我有一个 pandas 数据框:

parent   child   parent_level   child_level
A B 0 1
B C 1 2
B D 1 2
X Y 0 2
X D 0 2
Y Z 2 3

这代表一棵看起来像这样的树

       A  X
/ / \
B / \
/\ / \
C D Y
|
Z

我想制作如下所示的东西:

root    children
A [B,C,D]
X [D,Y,Z]

root   child
A B
A C
A D
X D
X Y
X Z

在不循环的情况下最快的方法是什么?我有一个非常大的数据框。

最佳答案

我建议您使用networkx ,因为这是一个图问题。特别是descendants功能:

import networkx as nx
import pandas as pd

data = [['A', 'B', 0, 1],
['B', 'C', 1, 2],
['B', 'D', 1, 2],
['X', 'Y', 0, 2],
['X', 'D', 0, 2],
['Y', 'Z', 2, 3]]

df = pd.DataFrame(data=data, columns=['parent', 'child', 'parent_level', 'child_level'])

roots = df.parent[df.parent_level.eq(0)].unique()
dg = nx.from_pandas_edgelist(df, source='parent', target='child', create_using=nx.DiGraph)

result = pd.DataFrame(data=[[root, nx.descendants(dg, root)] for root in roots], columns=['root', 'children'])
print(result)

输出

  root   children
0 A {D, B, C}
1 X {Z, Y, D}

关于python - 识别树中的根 parent 及其所有 child ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58451134/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com