gpt4 book ai didi

Python 正则表达式 : find zip from html content

转载 作者:太空宇宙 更新时间:2023-11-03 18:50:55 27 4
gpt4 key购买 nike

我有一个电子邮件模板,其中包含 html 格式的电子邮件上下文,

现在我想从电子邮件 html 内容中查找邮政编码,

为此,我使用正则表达式来搜索邮政编码,内容就像甲酸盐1:

helllo this is the mail  which will converted in the lead 
and here is some addresss which will not be used..

and the
zip: 364001
city: New york

甲酸盐2:

<p><b>Name</b></p><br/>
fname
<p><b>Last Name</b></p><br/>
lname
<p><b>PLZ</b></p><br/>
71392
<p><b>mail</b></p><br/>
heliconia72@mail.com

代码看起来像,

regex = r'(?P<zip>Zip:\s*\d\d\d\d\d\d)'
zip_match = re.search(regex, mail_content) # find zip
zip_match.groups()[0]

这只是搜索 fomate 2,我如何编写正则表达式,使其适用于这两个 formate。

最佳答案

如果您确实需要为此使用正则表达式(第二个我可能会使用 BeautifulSoup),您可以使用以下示例:

regex = r'(?:zip:\s*|PLZ</b></p><br/>\n)(\d{5})'
zip_match = re.search(regex1, mail_content)
zip_match.groups()[0]

关于Python 正则表达式 : find zip from html content,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18396051/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com