gpt4 book ai didi

python - 列值数据帧之间的 Pandas 差异

转载 作者:太空宇宙 更新时间:2023-11-04 08:06:08 25 4
gpt4 key购买 nike

我找不到一种方法来使数据帧具有基于列的 2 个数据帧的差异。所以基本上:

dfA = ID, val
1, test
2, other test

dfB = ID, val
2, other test

我想要一个 dfC 来保存基于列 ID 的差异 dfA - dfB

dfC = ID, val
1, test

最佳答案

合并 ID 上的数据框

dfMerged = dfA.merge(dfB, left_on='ID', right_on='ID', how='outer') # defaults to inner join.

在合并数据帧中,使用后缀 _x_y 来表示左右源数据帧,避免了名称冲突。

因此,您最终(很可能)会得到 val_xval_y。根据需要比较这些列。例如:

dfMerged['x_y_test'] = dfMerged.val_y == dfMerged.val_x
# gives you a column with a comparison of val_x, val_y.

将其用作掩码以获取问题中所需的 dfC

关于python - 列值数据帧之间的 Pandas 差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30986788/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com