gpt4 book ai didi

python - 使用 Python 的请求登录 FT.com

转载 作者:可可西里 更新时间:2023-11-01 17:06:24 29 4
gpt4 key购买 nike

我正在尝试编写一个脚本,它将登录到我的 FT.com 帐户并为我提取一些数据。

第一个障碍显然是登录。为此我正在使用 Pythons Requests 库。

这是我的代码:

#!/usr/bin/env python
import requests


# log into FT website
log_in_url = 'https://accounts.ft.com/login'
my_email = 'my@emaill.com'
my_pass = 'mypassword'
data = {'email': my_email,
'password': my_pass,
}

with requests.Session() as session:
log_in_request = session.post(log_in_url, data=data)
# prints log-in page with error about contacting cus. service
print log_in_request.content

它只是将我重定向回登录页面。它没有说“不正确的细节”或任何东西(它们绝对是正确的)。它只是不允许我登录。我怀疑我的 POST 请求有问题 - 比如我缺少 header 或 cookie 或其他东西。

有人知道会发生什么吗?

干杯,

院长

最佳答案

如果您从 ft 网站复制原始内容或抓取不可忽略的数据量,您将被阻止,因为您将违反他们的条款和条件(更不用说版权法了)。

英国《金融时报》的部分资金来自广告。如果您使用 Python 绕过这些,您正在侵 eclipse 合法的收入来源。

我使用此脚本将我的监视列表提取到 Excel 中,我过去使用复制/粘贴来完成此操作。我不使用它进行分析或阅读文章。我通过浏览器阅读英国《金融时报》,每天产生一定程度的广告浏览流量。

请不要滥用它。如果这样做,可能会导致每个付费订阅者都无法使用 Python 进行哪怕是极少量的导航。

from robobrowser import RoboBrowser

browser = RoboBrowser(history=True)

url='https://accounts.ft.com/login?location=https%3A%2F%2Fwww.ft.com%2F'

browser.open(url)
form=browser.get_form()
form['email']=""
form['password']=""
browser.session.headers['Referer'] = url
browser.submit_form(form)

如果你想进行数据挖掘等,有一个 FT Developer Program: https://developer.ft.com/

关于python - 使用 Python 的请求登录 FT.com,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40192468/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com