gpt4 book ai didi

python-3.x - Python - 请求模块 - 检索网页时出现 HTTP 500 错误

转载 作者:可可西里 更新时间:2023-11-01 17:06:11 24 4
gpt4 key购买 nike

此代码应下载 html 页面并将其打印到屏幕,但我却收到 HTTP 500 错误异常,我不知道如何管理。

有什么想法吗?

import requests ,bs4

headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.10; rv:39.0) Gecko/20100101 Firefox/39.0'}

#Load mainPage
_requestResult = requests.get("http://www.geometriancona.it/categoria_albo/albo/",headers = headers, timeout = 20)
_requestResult.raise_for_status()
_htmlPage = bs4.BeautifulSoup(_requestResult.text, "lxml")
print(_htmlPage)

#search for stuff in html code

最佳答案

您可以使用 urllib 模块下载单个 URL,但这只会返回数据。它不会解析 HTML 并自动下载 CSS 文件和图像等内容。如果你想下载“整个”页面,你需要发短信来解析 HTML 并找到你需要下载的其他东西。您可以使用 Beautiful Soup 之类的东西来解析您检索到的 HTML。 This question有一些示例代码正是这样做的。

关于python-3.x - Python - 请求模块 - 检索网页时出现 HTTP 500 错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41660618/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com