gpt4 book ai didi

python 编码

转载 作者:太空宇宙 更新时间:2023-11-04 01:38:22 29 4
gpt4 key购买 nike

使用mechanize,我检索到一个网页的源页面,其中包含一些非ASCII字符,比如汉字。

代码如下:

#using python2.6
from mechanize import Browser

br = Browser()
br.open("http://www.example.html")

src = br.reponse().read() #retrieve the source of the web

print src #print the src

问题:

1.根据页面的来源,我可以看到,它的charset=gb2312,但是当我print src时,所有的内容都是正确的,我没有胡言乱语的意思。为什么? print 是否知道 src 的编码?

2.我应该显式解码还是编码 src?

最佳答案

src 是一个 unicode ,没有编码。 print(或更准确地说,sys.stdout.write())找出输出时使用的编码。

关于 python 编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7551618/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com