gpt4 book ai didi

python - 使用 beautifulSoup,尝试获取所有包含字符串的表行

转载 作者:太空宇宙 更新时间:2023-11-03 23:48:56 27 4
gpt4 key购买 nike

我需要获取页面上包含特定字符串“abc123123”的所有表格行。

字符串在 TD 内,但如果它在内部任何位置包含“abc123123”,我需要整个 TR。

我试过这个:

userrows = s.findAll('tr', contents = re.compile('abc123123'))

我不确定内容是否是写入属性。

我的 html 看起来像这样:

<tr>
<td>
</td>
<td><table>.... abc123123 </table><tr>
..
</tr>
<tr>
..
</tr>
..
..

最佳答案

不,超出指定参数(name、attrs、recursive、text、limit)的额外关键字参数均指代您正在搜索的标签的属性 .

你不能同时搜索name text(如果你指定text,BS忽略name) 所以你需要单独调用,例如:

allrows = s.findAll('tr')
userrows = [t for t in allrows if t.findAll(text=re.compile('abc123123'))]

这里我使用了列表理解,因为我假设您想要一个相关标签对象的列表,正如 findAll 本身给您的那样。

关于python - 使用 beautifulSoup,尝试获取所有包含字符串的表行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3436770/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com