gpt4 book ai didi

python - 使用正则表达式刮取不带括号的干净科学名称

转载 作者:行者123 更新时间:2023-11-30 23:31:48 26 4
gpt4 key购买 nike

我正在使用正则表达式从网站上抓取科学名称,但我不知道如何不去掉科学名称的括号。

HTML是这样写的:

<span class="SciName">(Acanthastrea bowerbanki)</span>

我的正则表达式是这样写的:

regex = '<span class="SciName">(.+?)</span>'

我的结果如下所示:

(Acanthastrea bowerbanki)

但我需要它们看起来像这样:

Acanthastrea bowerbanki

最佳答案

您需要一对额外的括号,必须使用反斜杠对其进行转义以使它们成为文字字符:

regex = r'<span class="SciName">\((.+?)\)</span>'

您将使用它,如下所示:

import re

text = '<span class="SciName">(Acanthastrea bowerbanki)</span>'
regex = r'<span class="SciName">\((.+?)\)</span>'
m = re.match(regex, text)
print m.group(1)

关于python - 使用正则表达式刮取不带括号的干净科学名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19716822/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com