gpt4 book ai didi

python - 如何使用python从网页下载所有可下载的内容?

转载 作者:行者123 更新时间:2023-12-01 02:54:40 24 4
gpt4 key购买 nike

有一个网站有 13 页的 midi 文件,我想下载,但我无法手动下载数百个文件,所以我想知道是否有任何方法可以使用 python 获取所有可下载的文件。

这是网站的网址:http://midkar.com/jazz/jazz_01.html网站中的每个页面都有一个链接列表,当您单击时它们就会开始下载。

我编写了一个 for 循环来遍历所有 13 个页面,如下所示:

for i in range(1,14):
url = "http://midkar.com/jazz/jazz_0" + str(i) + ".html"
print(url)

但这几乎是我所做的全部事情,我希望得到一些帮助。

最佳答案

您应该学习使用 requests 模块来获取页面,并使用 BeautifulSoup 模块通过解析这些页面的 html 来获取实际链接,然后获取这些链接并再次使用 requests 模块下载它们。

无法为您编写完整的代码,但您应该从这里开始:

请求:http://docs.python-requests.org/en/master/user/quickstart/

美丽汤:https://www.crummy.com/software/BeautifulSoup/bs4/doc/

关于python - 如何使用python从网页下载所有可下载的内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44338472/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com