gpt4 book ai didi

python - Pandas:如何跟踪两个数据帧之间匹配数据条目的索引?

转载 作者:行者123 更新时间:2023-12-01 08:33:56 24 4
gpt4 key购买 nike

我对 Pandas 还很陌生。

我正在尝试以python字典的形式缓存两个Pandas数据帧之间匹配数据条目的索引以获取更多信息稍后进行时间高效的计算和哈希查找。

例如,我有两个数据框关系。

R1:                     R2:

A B B C
1 2 2 18
2 2 5 18
3 6 6 26
4 7 6 31
7 32

B 列是 R1 和 R2 之间的公共(public)属性。我想构造一个字典,将 R1 中的每个值映射到 R2 中匹配数据条目的索引。

例如期望的输出

{2: [0],        (2 from R1[B] matches with the 0th entry in R2)
6: [2,3] (6 from R1[B] matches with the 2nd and 3rd entry in R2)
7: [4]} (7 from R1[B] matches with the 4th entry in R2)

有什么有效的方法吗? R1[B] 中与 R2 中不匹配的值是否显示为输出字典中具有空列表作为值的项目,或者完全跳过,这并不重要。

谢谢!

最佳答案

使用 reset_indexgroupby 与 R2 列 B ,获取 indexlist ,然后链接.loc

R2.reset_index().groupby('B')['index'].apply(list).loc[R1.B.unique()]# if you need dict , adding to_dict() at the end 
B
2 [0]
6 [2, 3]
7 [4]
Name: index, dtype: object

关于python - Pandas:如何跟踪两个数据帧之间匹配数据条目的索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53808085/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com