gpt4 book ai didi

python - urllib.urlopen 返回一个旧页面?

转载 作者:太空宇宙 更新时间:2023-11-03 11:07:04 24 4
gpt4 key购买 nike

所以我有一个非常简单的 HTML 页面(一个目录列表),我尝试用 urllib 读取它,这样:

page =  urllib.urlopen(coreRepositoryUrl).read()

问题是,我以这种方式阅读的 HTML 比最新的要旧。 info() 返回给我:

Date: Fri, 19 Apr 2013 18:48:09 GMT
Server: Apache/2.0.52 (Fedora)
Content-Type: text/html; charset=UTF-8
Connection: close
Age: 481084

页面最后更新于今天 (2013-04-25)。哪个组件可能是缓存的组件?

最佳答案

在您的请求中添加值为“max-age=0”的 header “Cache-Control”

import urllib2
req = urllib2.Request(url)
req.add_header('Cache-Control', 'max-age=0')
resp = urllib2.urlopen(req)
content = resp.read()

沿途使用该 header 的每个缓存将重新验证其缓存条目

关于python - urllib.urlopen 返回一个旧页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16210233/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com