gpt4 book ai didi

python - 请求 : Explanation of the . 文本格式

转载 作者:行者123 更新时间:2023-12-02 04:14:14 26 4
gpt4 key购买 nike

我正在使用 requests 模块和 Python 2.7 构建一个基本的网络爬虫。

source_code = requests.get(url)
plain_text = source_code.text

现在,在上面的代码行中,我将指定 URL 的源代码和其他元数据存储在 source_code 变量中。现在,在 source_code.text 中,.text 属性到底是什么?它不是一个函数。我在文档中也找不到任何解释 .text 起源或特征的内容。

最佳答案

requests.get() 返回一个 Response object ;它是具有 .text 属性的对象;它不是 URL 的“源代码”,它是一个允许您访问响应的源代码(正文)以及其他信息的对象。 Response.text 属性为您提供响应的主体,解码为 unicode

参见 Response Content section快速入门文档:

When you make a request, Requests makes educated guesses about the encoding of the response based on the HTTP headers. The text encoding guessed by Requests is used when you access r.text.

可以在 API 文档中找到更多信息,请参阅 Response.text entry :

Content of the response, in unicode.

If Response.encoding is None, encoding will be guessed using chardet.

The encoding of the response content is determined based solely on HTTP headers, following RFC 2616 to the letter. If you can take advantage of non-HTTP knowledge to make a better guess at the encoding, you should set r.encoding appropriately before accessing this property.

您还可以使用 Response.content访问未解码的响应主体,作为原始字节。

关于python - 请求 : Explanation of the . 文本格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34819483/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com