gpt4 book ai didi

python - Beautiful Soup 根据部分属性值查找标签

转载 作者:行者123 更新时间:2023-12-02 06:51:32 26 4
gpt4 key购买 nike

我正在尝试根据部分属性值来识别 html 文档中的标签。

例如,如果我有一个 Beautifulsoup 对象:

import bs4 as BeautifulSoup

r = requests.get("http:/My_Page")

soup = BeautifulSoup(r.text, "html.parser")

我想要带有 id 属性的 tr 标签,其值的格式如下:“news_4343_23255_xxx”。我对任何 tr 标记感兴趣,只要它的 id 属性值的前 4 个字符为“news”。

我知道我可以按如下方式搜索:

trs = soup.find_all("tr",attrs={"id":True})

这给了我所有带有id属性的tr标签。

如何根据子字符串进行搜索?

最佳答案

使用正则表达式获取tr,其中id“news”开头

例如:

from bs4 import BeautifulSoup
import re
soup = BeautifulSoup(html, "html.parser")
for i in soup.find_all("tr", {'id': re.compile(r'^news')}):
print(i)

关于python - Beautiful Soup 根据部分属性值查找标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50630160/

26 4 0