gpt4 book ai didi

python - Pandas 列差异,包含列表

转载 作者:行者123 更新时间:2023-12-01 03:39:32 25 4
gpt4 key购买 nike

我有一个数据框,其中的列值是列表,并且想要查找两列之间的差异,或者换句话说,我想查找 A 列中 B 列中不存在的所有元素。

data={'NAME':['JOHN','MARY','CHARLIE'],
'A':[[1,2,3],[2,3,4],[3,4,5]],
'B':[[2,3,4],[3,4,5],[4,5,6]]}
df=pd.DataFrame(data)
df=df[['NAME','A','B']]

#I'm able to concatenate
df['C']=df['A']+df['B']

NAME A B C
0 JOHN [1, 2, 3] [2, 3, 4] [1, 2, 3, 2, 3, 4]
1 MARY [2, 3, 4] [3, 4, 5] [2, 3, 4, 3, 4, 5]
2 CHARLIE [3, 4, 5] [4, 5, 6] [3, 4, 5, 4, 5, 6]

有什么办法可以找出差异吗?

df['C']=df['A']-df['B']

我知道我们可以对函数使用 df.apply ,但逐行处理会运行缓慢,因为我有大约 400K 行。我正在寻找一种直接的方法,例如

df['C']=df['A']+df['B']

最佳答案

对于一定的差异,

df['A'].map(set) - df['B'].map(set)

关于python - Pandas 列差异,包含列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39860131/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com