gpt4 book ai didi

Python:从 urllib2.urlopen 调用中获取 HTTP header ?

转载 作者:IT老高 更新时间:2023-10-28 20:34:48 25 4
gpt4 key购买 nike

urllib2 是否在调用 urlopen 时获取整个页面?

我想只读取 HTTP 响应 header 而不获取页面。看起来 urllib2 打开了 HTTP 连接,然后获得了实际的 HTML 页面......还是它只是开始使用 urlopen 调用缓冲页面?

import urllib2
myurl = 'http://www.kidsidebyside.org/2009/05/come-and-draw-the-circle-of-unity-with-us/'
page = urllib2.urlopen(myurl) // open connection, get headers

html = page.readlines() // stream page

最佳答案

使用 response.info() 方法获取 header 。

来自 urllib2 docs :

urllib2.urlopen(url[, data][, timeout])

...

This function returns a file-like object with two additional methods:

  • geturl() — return the URL of the resource retrieved, commonly used to determine if a redirect was followed
  • info() — return the meta-information of the page, such as headers, in the form of an httplib.HTTPMessage instance (see Quick Reference to HTTP Headers)

因此,对于您的示例,请尝试逐步通过 response.info().headers 的结果来查找您要查找的内容。

注意使用 httplib.HTTPMessage 的主要注意事项记录在 python issue 4773 中。 .

关于Python:从 urllib2.urlopen 调用中获取 HTTP header ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/843392/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com