gpt4 book ai didi

德国地址的正则表达式

转载 作者:行者123 更新时间:2023-12-01 10:23:35 25 4
gpt4 key购买 nike

我正在寻找用于查找德国地址的正则表达式模式。
问题是格式有点奇怪,而且经常变化,示例:

Falcken Str. 45 F
Heinrich-Heine-Straße 62A, Berlin-Kreuzberg
Lindenstrasse 113; Kreuzberg; 10969 Berlin
Erkstrasse 7; Neuköln; 12043 Berlin
Werbellin Strasse 69; Neuköln; 12053 Berlin
Anschrift; Rudolfstrasse 8-10; Friedrichshain; 10245 Berlin
Maybachufer 3, Neukölln, 12047, Berlin, Germany (?)
Skalitzer Strasse 31-32; Kreuzberg; 10999 Berlin
Mühlen Strasse 17; Friedrichshain; 10243 Berlin
Am Flutgraben 1; Treptow; 12435 Berlin; Germany (?)
Rigaer Strasse 89; Friedrichshain; 10247 Berlin
Köpenicker Str. 12, 10997 Berlin-Kreuzberg
Schliemannstraße 27; 10437; Berlin
Michaelkirchstr. 32, 10179 Berlin
Maybachufer 44, Neukölln, 12045, Berlin, Germany
Alexanderstrasse 11; Mitte; 10178 Berlin
Café Dritter Raum - Hertzbergstr. 14 - 12055 Berlin

现在我尝试将它们分组(至少 [Address] [zipcode] [berlin])
但我没能捕获所有的,我能想到的最好的是

^([a-zäöüß\s\d.,-]+?)\s*([\d\s]+(?:\s?[-|+/]\s?\d+)?\s*[a-z]?)?;*\s*(\d{5})\s*(.+)?$

(感谢关于 stackoverflow 的另一个问题)。

有什么想法吗?

最佳答案

不规则的数据会导致不一致的结果。此外,正则表达式并不是对每个 Crystal 瓶都适用的锤子。

实用的角度来看,我只是解析标准化地址(无论这对德国地址意味着什么),并将剩余的转储到另一个文件以进行手动地址更正。如果您的大多数地址格式不正确,那么您可能需要访问某种地址更正数据库——通常是商业性的,并且通常可以从相关的邮政服务处获得。

关于德国地址的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10939618/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com