gpt4 book ai didi

python - 使用 lxml.cssselector 查找内联样式

转载 作者:行者123 更新时间:2023-11-28 20:29:24 24 4
gpt4 key购买 nike

这个库的新手(遗憾的是,对 BeautifulSoup 也不熟悉),尝试做一些非常简单的事情(按内联样式搜索):

<td style="padding: 20px">blah blah </td>

我只想选择所有 style="padding: 20px"的 tds,但我似乎无法弄清楚。所有的例子都展示了如何选择td,例如:

for col in page.cssselect('td'):

但这对我帮助不大。

最佳答案

好吧,有一个更好的方法:XPath。

import lxml.html
data = """<td style="padding: 20px">blah blah </td>
<td style="padding: 21px">bow bow</td>
<td style="padding: 20px">buh buh</td>
"""
doc = lxml.html.document_fromstring(data)
for col in doc.xpath("//td[@style='padding: 20px']"):
print col.text

那更整洁也更快。

关于python - 使用 lxml.cssselector 查找内联样式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2619536/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com