gpt4 book ai didi

python : UnicodeEncodeError: 'latin-1' codec can't encode character

转载 作者:太空狗 更新时间:2023-10-29 17:42:29 32 4
gpt4 key购买 nike

我在调用 api 的情况下,根据 api 的结果,我为 api 中的每条记录调用数据库。我的 api 调用返回字符串,当我对 api 返回的项目进行数据库调用时,对于某些元素,我收到以下错误。

Traceback (most recent call last):
File "TopLevelCategories.py", line 267, in <module>
cursor.execute(categoryQuery, {'title': startCategory});
File "/opt/ts/python/2.7/lib/python2.7/site-packages/MySQLdb/cursors.py", line 158, in execute
query = query % db.literal(args)
File "/opt/ts/python/2.7/lib/python2.7/site-packages/MySQLdb/connections.py", line 265, in literal
return self.escape(o, self.encoders)
File "/opt/ts/python/2.7/lib/python2.7/site-packages/MySQLdb/connections.py", line 203, in unicode_literal
return db.literal(u.encode(unicode_literal.charset))
UnicodeEncodeError: 'latin-1' codec can't encode character u'\u2013' in position 3: ordinal not in range(256)

上述错误所指的我的代码段是:

         ...    
for startCategory in value[0]:
categoryResults = []
try:
categoryRow = ""
baseCategoryTree[startCategory] = []
#print categoryQuery % {'title': startCategory};
cursor.execute(categoryQuery, {'title': startCategory}) #unicode issue
done = False
cont...

在进行一些谷歌搜索后,我在命令行中尝试了以下命令以了解发生了什么......

>>> import sys
>>> u'\u2013'.encode('iso-8859-1')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'latin-1' codec can't encode character u'\u2013' in position 0: ordinal not in range(256)
>>> u'\u2013'.encode('cp1252')
'\x96'
>>> '\u2013'.encode('cp1252')
'\\u2013'
>>> u'\u2013'.encode('cp1252')
'\x96'

但我不确定解决此问题的解决方案是什么。我也不知道 encode('cp1252') 背后的理论是什么,如果我能对上面的尝试得到一些解释,那就太好了。

最佳答案

如果您需要 Latin-1 编码,您有几个选项可以去除破折号或其他超过 255 的代码点(Latin-1 中不包含的字符):

>>> u = u'hello\u2013world'
>>> u.encode('latin-1', 'replace') # replace it with a question mark
'hello?world'
>>> u.encode('latin-1', 'ignore') # ignore it
'helloworld'

或者做你自己的自定义替换:

>>> u.replace(u'\u2013', '-').encode('latin-1')
'hello-world'

如果您不需要输出 Latin-1,则 UTF-8 是常见且首选的选择。它由 W3C 推荐并很好地编码所有 Unicode 代码点:

>>> u.encode('utf-8')
'hello\xe2\x80\x93world'

关于 python : UnicodeEncodeError: 'latin-1' codec can't encode character,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8290206/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com