gpt4 book ai didi

python - 无法在 BeautifulSoup 中获得正确的链接

转载 作者:行者123 更新时间:2023-11-28 17:54:17 24 4
gpt4 key购买 nike

我正在尝试解析一些 HTML,我想提取与特定模式匹配的链接。我正在使用带有正则表达式的 find 方法,但它没有为我提供正确的链接。这是我的片段。有人可以告诉我我做错了什么吗?

from BeautifulSoup import BeautifulSoup
import re

html = """
<div class="entry">
<a target="_blank" href="http://www.rottentomatoes.com/m/diary_of_a_wimpy_kid/">RT</a>
<a target="_blank" href="http://www.imdb.com/video/imdb/vi2496267289/">Trailer</a> &ndash;
<a target="_blank" href="http://www.imdb.com/title/tt1196141/">IMDB</a> &ndash;
</div>
"""

soup = BeautifulSoup(html)
print soup.find('a', href = re.compile(r".*title/tt.*"))['href']

我应该得到第二个链接,但 BS 总是返回第一个链接。第一个链接的 href 甚至不匹配我的正则表达式,为什么它会返回它?

谢谢。

最佳答案

find只返回第一个 <a>标签。你要 findAll .

关于python - 无法在 BeautifulSoup 中获得正确的链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3316415/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com