gpt4 book ai didi

python - 无法在python中获取页面源代码

转载 作者:太空宇宙 更新时间:2023-11-03 12:49:05 24 4
gpt4 key购买 nike

我正在尝试使用以下方法获取页面的源代码:

import urllib2
url="http://france.meteofrance.com/france/meteo?PREVISIONS_PORTLET.path=previsionsville/750560"
page =urllib2.urlopen(url)
data=page.read()
print data

也可以使用 user_agent(headers)页面源码获取失败!

你们有什么想法可以做什么吗?提前致谢

最佳答案

我试过了,请求有效,但您收到的内容说您的浏览器必须接受 cookie(法语)。您可能可以使用 urllib2 来解决这个问题,但我认为最简单的方法是使用 requests 库(如果您不介意有额外的依赖项)。

安装requests:

pip install requests

然后在你的脚本中:

import requests

url = 'http://france.meteofrance.com/france/meteo?PREVISIONS_PORTLET.path=previsionsville/750560'

response = requests.get(url)
print(response.content)

我很确定页面的源代码将是您所期望的。

关于python - 无法在python中获取页面源代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17450391/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com