gpt4 book ai didi

python - 两个数据帧之间 Pandas 的计算集差异

转载 作者:太空宇宙 更新时间:2023-11-03 12:55:56 25 4
gpt4 key购买 nike

想知道如何使用两个不同的数据帧计算 Python 的 Pandas 中的集合差异。

一个数据框 (df1) 的格式为:

State  City          Population
NY Albany 856654
WV Wheeling 23434
SC Charleston 35323
OH Columbus 343534
WV Charleston 34523

而第二个数据框(df2)是

State  City
WV Wheeling
OH Columns

我需要一个返回以下数据框的操作

State   City        Population
NY Albany 856654
SC Charleston 35323
WV Charleston 34523

基本上,我不知道如何根据 2 列从 df1 “减去”df2(需要两列,因为我会在不同州重复城市名称)。

最佳答案

使用 indicator 进行左连接,它提供有关每一行来源的信息,然后您可以根据 indicator 进行过滤:

df1.merge(df2, indicator=True, how="left")[lambda x: x._merge=='left_only'].drop('_merge',1)

#State City Population
#0 NY Albany 856654
#2 SC Charleston 35323
#4 WV Charleston 34523

关于python - 两个数据帧之间 Pandas 的计算集差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42425549/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com