gpt4 book ai didi

python - 无法从网络获取下载链接

转载 作者:行者123 更新时间:2023-12-01 01:07:34 24 4
gpt4 key购买 nike

我尝试从该网站下载所有报告:https://www.opec.org/opec_web/en/publications/4814.htm但我无法自动找到美丽汤和请求的链接。有人可以帮助我吗?

到目前为止我已经尝试过以下代码:

from bs4 import BeautifulSoup

from urllib.request import Request, urlopen
import re

req = Request("https://www.opec.org/opec_web/static_files_project/media")
html_page = urlopen(req)

soup = BeautifulSoup(html_page, "lxml")

links = []

for link in soup.findAll('a'):

print(link.get('href'))

最佳答案

你的代码应该是这样的

如果是 html 文档,则应使用“html.parser”,并且应链接到请求中的正确 url。

from bs4 import BeautifulSoup

from urllib.request import Request, urlopen
import re

req = Request("https://www.opec.org/opec_web/en/publications/4814.htm")
html_page = urlopen(req)

soup = BeautifulSoup(html_page, "html.parser")

links = []

for link in soup.findAll('a'):
href = link.get('href')
if 'pdf' in href:
print(href)

关于python - 无法从网络获取下载链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55196452/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com