gpt4 book ai didi

python - 如何从数据框列中提取城市(格式不同)

转载 作者:行者123 更新时间:2023-12-05 04:21:15 27 4
gpt4 key购买 nike

我有这个数据框,我想在单独的列中提取城市。您还可以看到,格式不一样,城市可以在行中的任何位置。我怎样才能只提取新列中的城市?提示。这里我们谈论的是德国城市。可能是要找到一本显示所有德国城市的字典,并以某种方式与我的数据集进行比较?

这是德国城市字典:https://gist.github.com/embayer/772c442419999fa52ca1

数据框

Adresse
0 Karlstr 10, 10 B, 30,; 04916 Hamburg
1 München Dorfstr. 28-55, 22555
2 Marnstraße. Berlin 12, 45666 Berlin
3 Musterstr, 24855 Dresden
... ...
850 Muster Hausweg 11, Hannover, 56668
851 Mariestr. 4, 48669 Nürnberg
852 Hilden Weederstr 33-55, 56889
853 Pt-gaanen-Str. 2, 45883 Potsdam

输出

Cities
0 Hamburg
1 München
2 Berlin
3 Dresden
... ...
850 Hannover
851 Nürnberg
852 Hilden
853 Potsdam

最佳答案

您可以从您提供的字典中提取所有城市列表(我假设它是 'stadt' key ),然后在您的列表中使用 str.findall专栏:

cities_ = [cities[n]['stadt'] for n in range(0,len(cities))]
df.Adresse.str.findall(r'|'.join(cities_))

>>>
0 [Karlstr, Hamburg]
1 []
2 []
3 []
4 []
5 []
6 []
7 []
8 []
Name: Adresse, dtype: object

关于python - 如何从数据框列中提取城市(格式不同),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74275857/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com