gpt4 book ai didi

python - 如何输入unicode字符并获取其数值

转载 作者:太空宇宙 更新时间:2023-11-04 10:14:56 26 4
gpt4 key购买 nike

我正在尝试获取一个文件并删除所有不是希腊语的字符。我们找到了字母表的 unicode 值 880 - 1023,并且能够使用简单的 print(unichr(880)) 行打印出正确的字符。问题是运行这段代码时

greek ='ÏÎ' 
for c in greek:
if(unichr(c) >= 880 and unichr(c) <= 1023):
print(c)

有没有办法输入将返回 unicode 值的任何字母或符号。我们测试了希腊范围内和外部的值,但仍然得到相同的错误,UnicodeDecodeError: 'ascii' codec cannot decode byte 0xc3 in position 0: ordinal not in range(128)

最佳答案

unichr 接受一个整数并返回一个 unicode 字符。我的第一个建议是在这里将 unichr 替换为 ord,因为您传递的是一个字符串并希望返回一个表示 unicode 代码点的整数。

现在是 Unicode 解码错误——我怀疑它的发生是因为 print 正在隐式地尝试对您的 unicode 字符串进行编码,但不知道如何这样做。如果您使用 utf-8 显式编码您的 unicode 字符串,您可能会更幸运。试试这个:

greek = u'ÏÎ' 
for c in greek:
if(ord(c) >= 880 and ord(c) <= 1023):
print(c.encode('utf-8'))

关于python - 如何输入unicode字符并获取其数值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35930979/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com