gpt4 book ai didi

python - 如何使用 Beautiful Soup 查找指定类中的链接

转载 作者:行者123 更新时间:2023-12-01 03:32:45 24 4
gpt4 key购买 nike

我正在使用 Beautiful Soup 4 来解析新闻网站以查找正文中包含的链接。我能够找到包含链接的所有段落,但每个链接的 paragraph.get('href') 返回类型 none 。我正在使用Python 3.5.1。非常感谢任何帮助。

from bs4 import BeautifulSoup
import urllib.request
import re

soup = BeautifulSoup("http://www.cnn.com/2016/11/18/opinions/how-do-you-deal-with-donald-trump-dantonio/index.html", "html.parser")

for paragraph in soup.find_all("div", class_="zn-body__paragraph"):
print(paragraph.get('href'))

最佳答案

你真的想要这个吗?

for paragraph in soup.find_all("div", class_="zn-body__paragraph"):
for a in paragraph("a"):
print(a.get('href'))

请注意paragraph.get('href')尝试查找属性 href<div>您找到的标签。由于没有这样的属性,因此它返回 None 。最有可能的是,您实际上必须找到所有标签 <a>你的后裔 <div> (这可以通过 paragraph("a") 来完成,这是 paragraph.find_all("a") 的快捷方式,然后对于每个元素 <a> 查看它们的 href 属性。

关于python - 如何使用 Beautiful Soup 查找指定类中的链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40698322/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com