gpt4 book ai didi

python - 如何使用 Beautiful Soup 查找带有特定文本的标签?

转载 作者:IT老高 更新时间:2023-10-28 22:14:24 28 4
gpt4 key购买 nike

如何找到text I am looking for在以下 HTML 中(用 \n 标记的换行符)?

...
<tr>
<td class="pos">\n
"Some text:"\n
<br>\n
<strong>some value</strong>\n
</td>
</tr>
<tr>
<td class="pos">\n
"Fixed text:"\n
<br>\n
<strong>text I am looking for</strong>\n
</td>
</tr>
<tr>
<td class="pos">\n
"Some other text:"\n
<br>\n
<strong>some other value</strong>\n
</td>
</tr>
...

下面的代码返回第一个找到的值,所以我需要过滤"Fixed text:"不知何故。

result = soup.find('td', {'class' :'pos'}).find('strong').text

更新:如果我使用以下代码:

title = soup.find('td', text = re.compile(ur'Fixed text:(.*)', re.DOTALL), attrs = {'class': 'pos'})
self.response.out.write(str(title.string).decode('utf8'))

然后它只返回 Fixed text: ,而不是 <strong> - 在同一元素中突出显示的文本。

最佳答案

您可以将正则表达式传递给 findAll 的文本参数,如下所示:

import BeautifulSoup
import re

columns = soup.findAll('td', text = re.compile('your regex here'), attrs = {'class' : 'pos'})

关于python - 如何使用 Beautiful Soup 查找带有特定文本的标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9007653/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com