gpt4 book ai didi

python - 使用 Python MechanicalSoup 登录时出现 503 错误

转载 作者:行者123 更新时间:2023-12-04 16:19:40 24 4
gpt4 key购买 nike

我想在登录页面后面抓取一些信息,但我收到了 503

这是我尝试使用 Mechanicalsoup 登录时发生的情况(与 robobrowser 的结果相同):

>>> import mechanicalsoup
>>> browser = mechanicalsoup.StatefulBrowser(user_agent='Mozilla/5.0')
>>> page = browser.get('https://X.com')
>>> page.status_code
200
>>> page = browser.get('https://X.com/wp-login.php')
>>> page.status_code
503

我已经尝试了几个不同的 user_agents,我该如何解决这个问题?移动 cookies ?

最佳答案

好的,我设法使用 https://github.com/Anorov/cloudflare-scrape 做到了这一点

import cfscrape
from bs4 import BeautifulSoup

# log in
scraper = cfscrape.CloudflareScraper()
scraper.get('https://X.com/wp-login.php')
tokens = cfscrape.get_tokens('https://X.com')
browser = mechanicalsoup.StatefulBrowser(session=scraper, user_agent=tokens[1])
browser.select_form('#loginform')
browser['log'] = 'X'
browser['pwd'] = 'X'
browser.submit_selected()
browser.open('https://X.com/page/')

关于python - 使用 Python MechanicalSoup 登录时出现 503 错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48155877/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com