gpt4 book ai didi

Python 正则表达式 Google App Engine

转载 作者:行者123 更新时间:2023-11-28 20:45:01 25 4
gpt4 key购买 nike

我在 GAE 上使用 python

我正在尝试从 html 中获取以下内容

<TD><FONT FACE="Arial,helvetica" SIZE="-2">V1068078</FONT></TD>

我想得到所有带有“V”后跟 7 位或更多数字并在其后面的内容。

我的正则表达式是

response = urllib2.urlopen(url)
html = response.read()
tree = etree.HTML(html)
mls = tree.xpath('/[V]\d{7,10}</FONT>')
self.response.out.write(mls)

它抛出了一个无效的表达式。我不知道它的哪一部分是无效的,因为它适用于在线正则表达式测试器

我如何以 xpath 格式执行此操作?

最佳答案

>>> import re

>>> s = '<TD><FONT FACE="Arial,helvetica" SIZE="-2">V1068078</FONT></TD>'

>>> a = re.search(r'(.*)(V[0-9]{7,})',s)

>>> a.group(2)
'V1068078'

编辑

(.*) 是一个贪婪的方法。 re.search(r'V[0-9]{7,}',s) 将不贪婪地进行提取。

编辑 正如@Kaneg 所说,您可以对所有实例使用findall。您将获得一个列表,其中包含所有出现的 'V[0-9]{7,}'

关于Python 正则表达式 Google App Engine,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24502022/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com