gpt4 book ai didi

python - "ASCII-ish"Python中一些Unicode字符的近似

转载 作者:太空宇宙 更新时间:2023-11-04 02:29:07 26 4
gpt4 key购买 nike

由于我无法控制的原因,我必须将带有一些 Unicode 字符的(英语)文本转换为 ASCII(以便在别处进一步处理)。例如:

Deutsche Börse 

当我这样做时:

u'Deutsche Börse'.encode(encoding='ascii', errors='replace')

我明白了

b'Deutsche B?rse'

这不是我需要的。理想情况下,我希望获得 Deutsche Borse

我当然知道绝大多数 Unicode 字符是不可能的。但对于许多重要的名称,例如 Quebec,原则上这是可能的。

我该怎么做?

最佳答案

这是你需要的:要转换为 ASCII,您可能想尝试 unicodedata

import unicodedata

data= u'Deutsche Börse'

print (unicodedata.normalize('NFKD', data).encode('ascii','ignore'))

输出

 b'Deutsche Borse'

关于python - "ASCII-ish"Python中一些Unicode字符的近似,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49652528/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com