gpt4 book ai didi

Python2.7。访问 HTTPS 网站并检索内容

转载 作者:太空宇宙 更新时间:2023-11-04 00:16:12 24 4
gpt4 key购买 nike

<分区>

大家早上好

我一直在尝试通过 HTTPS 的 Python 2.7 访问一个网站,但无法访问内容,经过数天的研究也无济于事。网址是:https://www.cioh.org.co/ .在 Python 中,我希望能够访问页面并检索所有 HTML 内容。过去,我会使用 ssl 模块并在顶部添加以下代码行:

导入SSLssl._create_default_https_context = ssl._create_unverified_context

这一次,这不起作用,我收到错误:SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:661)将请求模块与 requests.get(' https://www.cioh.org.co/ ') 一起使用时

在某些网站上,有人指出使用:导入请求r = requests.get(URL, verify=False)打印 r.text

我也试过了,但它实际上并没有抓取内容。它只是从网站中检索内部 header 信息:

<html>

<head>

<META NAME="robots" CONTENT="noindex,nofollow">

<script src="/_Incapsula_Resource?SWJIYLWA=5074a744e2e3d891814e9a2dace20bd4,719d34d31c8e3a6e6fffd425f7e032f3">

</script>

<body>

</body></html>

打印的回复与网站完全不同。通过无数研究,我尝试使用 certifi 模块。我还安装了 OpenSSL 并提取了 .crt、.key 和 .pem 文件(并尝试使用它们),但仍然没有成功。如果需要,我可以扩展我所做的进一步研究。

该网站,如果使用任何浏览器都可以轻松访问。任何帮助将不胜感激。

旁注:这是我第一次创建帐户并提出问题。如果我不清楚任何事情,请告诉我。提前致谢。

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com