gpt4 book ai didi

Python 请求 - "To continue your browser has to accept cookies and has to have JavaScript enabled."

转载 作者:行者123 更新时间:2023-12-01 01:20:02 25 4
gpt4 key购买 nike

我想从 mobile.de 上抓取一些广告供个人使用。

我正在使用带有请求库的 python 3.6,但我面临一些机器人检查的问题。我怎样才能从他们的网站通过这个网关?

import requests
from bs4 import BeautifulSoup

r = requests.get("https://www.mobile.de/?lang=en")
bs = BeautifulSoup(r.content, 'lxml')
print(bs)

这部分代码向我显示以下内容:

<p>To continue your browser has to accept cookies and has to have JavaScript enabled.</p>

我在哪里可以找到我需要解决的逻辑才能通过这个?

最佳答案

您收到意外内容的原因是您没有有效的 header 。正如@afit 所说。但是要继续,您的浏览器必须接受cookie并且必须启用JavaScript。是有道理的,因为如果您不启用JavaScript,您将无法加载完整的内容。

注意:我建议您使用 selenium 来执行此操作。由于渲染时缺少合适的 header ,requests_html 无法成功访问网站。顺便说一句,如果你想访问 JavaScript 内部的 url 并抓取内容,这将是一项艰巨的工作。

from bs4 import BeautifulSoup
from selenium import webdriver

dr = webdriver.Chrome()
dr.get("https://www.mobile.de/?lang=en")
bs = BeautifulSoup(dr.page_source,"lxml")

关于Python 请求 - "To continue your browser has to accept cookies and has to have JavaScript enabled.",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53918187/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com