gpt4 book ai didi

python - 如何通过对列进行分区来高效地生成这个字典?

转载 作者:行者123 更新时间:2023-12-01 23:29:09 25 4
gpt4 key购买 nike

我有一个数据框df如下

    parent_id   name
0 t3_35jfjt t1_cr4y72v
1 t3_35jfjt t1_cr4y7m7
2 t3_35jfjt t1_cr4y7p3
3 t1_cr4y72v t1_cr4y92z
4 t3_35jfjt t1_cr4y986
... ... ...

其中 name 列中的所有元素都是唯一的。我想根据 parent_id 列对 name 列进行分区。这意味着 name 列中的 2 个元素如果具有相同的 parent_id 则属于同一类。

然后我想创建一个字典,其键是 name 列中的元素,其值是这些元素所属类的元素数。例如,

{'t1_cr4y72v': 3, 't1_cr4y72v': 4,...}

在这种情况下,t1_cr4y72v 属于基数为 3 的类。

我可以使用循环来制作这本字典,但效率不高,因为我有超过 300 万行。您能否详细说明一种有效的方法?

import pandas as pd
df = pd.read_csv('https://raw.githubusercontent.com/leanhdung1994/WebMining/main/df.csv', header = 0)
df

最佳答案

解决方法:

dict(zip(df.name, df.groupby('parent_id')['parent_id'].transform('count')))

关于python - 如何通过对列进行分区来高效地生成这个字典?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66629764/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com