a") 返回整个 a 标签,我只想要值。此外,页面上可能有多个 H2。如何筛选具有类 hell-6ren">
gpt4 book ai didi

python - 我如何获得 soup.select 的值?

转载 作者:太空狗 更新时间:2023-10-30 02:59:10 24 4
gpt4 key购买 nike

<h2 class="hello-word"><a href="http://www.google.com">Google</a></h2>

如何获取 a 标签的值 (Google)?

print soup.select("h2 > a")

返回整个 a 标签,我只想要值。此外,页面上可能有多个 H2。如何筛选具有类 hello-word 的那个?

最佳答案

您可以在 CSS 选择器中的 h2 上使用 .hello-word,只选择 h2 类为 hello- 的标签word 然后选择它的 child a 。此外,soup.select() 返回所有可能匹配项的列表,因此您可以轻松地对其进行迭代并调用每个元素 .text 以获取文本。示例 -

for i in soup.select("h2.hello-word > a"):
print(i.text)

示例/演示(我添加了一些我自己的元素,其中一个具有稍微不同的类以显示选择器的工作)-

>>> from bs4 import BeautifulSoup
>>> s = """<h2 class="hello-word"><a href="http://www.google.com">Google</a></h2>
... <h2 class="hello-word"><a href="http://www.google.com">Google12</a></h2>
... <h2 class="hello-word2"><a href="http://www.google.com">Google13</a></h2>"""

>>> soup = BeautifulSoup(s,'html.parser')

>>> for i in soup.select("h2.hello-word > a"):
... print(i.text)
...
Google
Google12

关于python - 我如何获得 soup.select 的值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32126358/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com