gpt4 book ai didi

python - 使用 python 3 urllib 访问网站但失败

转载 作者:塔克拉玛干 更新时间:2023-11-01 21:28:32 26 4
gpt4 key购买 nike

我正在尝试使用以下代码使用 urllib 访问 python 3 中的网站

url = "http://www.goal.com"
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}

r = urllib.request.Request(url=url, headers=headers)
urllib.request.urlopen(r).read(1000)

当它访问“yahoo.com”时它工作正常,但是当访问“goal.com,hkticketing.com.hk”等网站时它总是返回错误403,我无法弄清楚我错过了什么。感谢您的帮助。

最佳答案

在 python 2.x 版本中,您可以使用 urllib2 来获取内容。您可以调用add headers 函数来添加header 信息。然后调用 open 方法并读取内容。最后打印出来。

import urllib2
import sys

print sys.version
url = urllib2.build_opener()
url.addheaders = [('User-agent', 'Mozilla/5.0(Windows NT 6.1; WOW64; rv:23.0)Gecko/20100101 Firefox/23.0')]
print url.open('http://hkticketing.com.hk').read()

关于python - 使用 python 3 urllib 访问网站但失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32001389/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com