gpt4 book ai didi

Python:如何使用 BeautifulSoup 查找第一个 anchor 标记的文本

转载 作者:太空宇宙 更新时间:2023-11-03 16:39:57 25 4
gpt4 key购买 nike

我有这样的 HTML 结构

<p class="title">
<a href="abc.com">
Story
</a>
<span class="domain">
<a href="xyz.com">comments</a>
</span>
</p>

我想提取第一个 anchor 标记的文本,即Story

这是我如何使用Beautifulsoup从 anchor 标记中提取文本

soup = BeautifulSoup(html, 'html.parser')
soup.prettify()
for link in soup.find_all(class_='title'):
print link.findNext('a').text

和输出:

Story

Comments

但我只想提取第一个 anchor 标记的文本,即 Story。我如何在 python 中使用 BeautifulSoup 来做到这一点?

最佳答案

您可以通过执行以下操作来访问第一个 a 标记

print link.a.text

去除多余的空白

link.a.text.strip()

关于Python:如何使用 BeautifulSoup 查找第一个 anchor 标记的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36896069/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com