gpt4 book ai didi

python - 如何在 Python 中处理 Unicode(非 ASCII)字符?

转载 作者:太空狗 更新时间:2023-10-29 17:29:57 32 4
gpt4 key购买 nike

我在 Python 编程我正在通过 urllib2 从网页获取信息图书馆。问题是该页面可以为我提供非 ASCII 字符,例如 'ñ''á' 等。就在这一刻 urllib2 获取这个字符,它会引发异常,如下所示:

File "c:\Python25\lib\httplib.py", line 711, in send
self.sock.sendall(str)
File "<string>", line 1, in sendall:
UnicodeEncodeError: 'ascii' codec can't encode character u'\xf1' in position 74: ordinal not in range(128)

我需要处理这些字符。我的意思是,我不想处理异常而是继续程序。有没有办法,例如(我不知道这是否愚蠢),使用另一个 codec而不是ASCII?因为我必须处理这些字符,将它们插入数据库等。

最佳答案

您刚刚从套接字中读取了一组字节。如果你想要一个字符串,你必须解码它:

yourstring = receivedbytes.decode("utf-8") 

(将您使用的任何编码替换为 utf-8)

然后您必须执行相反的操作才能将其发回:

outbytes = yourstring.encode("utf-8")

关于python - 如何在 Python 中处理 Unicode(非 ASCII)字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1644640/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com