gpt4 book ai didi

python - Unicode latin1 字符串编码/解码

转载 作者:行者123 更新时间:2023-11-28 19:29:48 27 4
gpt4 key购买 nike

当使用 Python (Django) ORM 从未知/旧/不一致的 Mysql 数据库获取数据到 Postgres utf-8 数据库时,我有时会因此编码错误数据。

目标:格雷戈里

> a
u'gr\xe3\xa9gory'

> print a
grã©gory

我尝试了几种解码/编码技巧都没有成功:

 > print a.encode('utf-8').decode('latin1')
grã©gory

> print a.encode('utf-8').decode('latin1')
grã©gory

> print a.decode('latin-1')
UnicodeEncodeError: 'ascii' codec can't encode characters in position 2-3: ordinal not in range(128)

即使有一些unicode_转义

最佳答案

我猜字符串在某些时候被错误地转换为小写,将 \xc3 更改为 \xe3。小写转换假定为 latin1 编码,而实际上是 utf-8。

>>> print 'gr\xc3\xa9gory'.decode('utf8')
grégory

关于python - Unicode latin1 字符串编码/解码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14852224/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com