gpt4 book ai didi

python - 如何使用 python 从 Intranet 站点抓取 URL 数据?

转载 作者:行者123 更新时间:2023-11-28 16:37:00 24 4
gpt4 key购买 nike

我需要 Python Warrior 来帮助我(我是菜鸟)!我正在尝试使用模块 urllib 从内部网站抓取某些数据。但是,由于我公司的网站只供员工查看,不对公众开放,因此我认为这就是我获得此代码的原因:

IOError: ('http 错误', 401, '未经授权', )

我该怎么做?它甚至不会使用 htmlfile.read() 读取站点

获取公共(public)站点的示例代码:

import urllib
import re

htmlfile = urllib.urlopen("http://finance.yahoo.com/q?s=AAPL")

htmltext = htmlfile.read()

regex = '<span id="yfs_l84_aapl">(.+?)</span>'

pattern = re.compile(regex)

price = re.findall(pattern,htmltext)

print price

最佳答案

尝试 requestsrequests_ntlm :

import requests
from requests_ntlm import HttpNtlmAuth

r = requests.get("http://ntlm_protected_site.com",auth=HttpNtlmAuth('domain\\username','password'))

print r.text

如果您需要有关此库的任何细节的帮助,但无法在文档中找到它,请发表评论。

关于python - 如何使用 python 从 Intranet 站点抓取 URL 数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24805432/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com