gpt4 book ai didi

python - 如何使用 Python(使用 pandas 或其他方式)巧妙地匹配两个数据框?

转载 作者:太空狗 更新时间:2023-10-30 02:17:44 26 4
gpt4 key购买 nike

我有一个 pandas 数据框,由世界城市的名称以及城市所属的国家/地区组成,

city.head(3)

city country
0 Qal eh-ye Now Afghanistan
1 Chaghcharan Afghanistan
2 Lashkar Gah Afghanistan

还有一个由世界大学地址组成的数据框,如下所示:

df.head(3)
university
0 Inst Huizhou, Huihzhou 516001, Guangdong, Peop...
1 Guangxi Acad Sci, Nanning 530004, Guangxi, Peo...
2 Shenzhen VisuCA Key Lab SIAT, Shenzhen, People...

城市名称的位置不规则地分布在各行中。我想将城市名称与世界大学的地址相匹配。也就是说,我想知道每所大学位于哪个城市。希望匹配的城市名称与每所大学的地址显示在同一行。

我尝试了以下方法,但它不起作用,因为城市的位置在各行中是不规则的。

df['university'].str.split(',').str[0]

最佳答案

我建议使用apply

city_list = city.tolist()

def match_city(row):
for city in city_list:
if city in row['university']: return city
return 'None'

df['city'] = df.apply(match_city, axis=1)

我假设大学数据的地址足够干净。如果你想做更高级的匹配检查,你可以调整match_city函数。

关于python - 如何使用 Python(使用 pandas 或其他方式)巧妙地匹配两个数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39353215/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com