gpt4 book ai didi

python - 如何存储非英文文本?

转载 作者:太空宇宙 更新时间:2023-11-03 16:39:17 24 4
gpt4 key购买 nike

我有一个文本文件。它由许多非英语字符组成。我想将此文件存储为数字序列,例如 ascii。

如何表示非英语字符?

>>> str(ord('x'))
'120'
>>> str(ord('ç'))
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: ord() expected a character, but string of length 2 found
>>>

最佳答案

您必须首先使用正确的编码方案对其进行解码,然后您将获得该字符的序数值,因为 ord 返回的整数值单字符字符串:

>>> s = 'ç'
>>> s
'\xc3\xa7'
>>> print s
ç
>>> len(s)
2
>>> s.decode('utf-8')
u'\xe7'
>>> len(s.decode('utf-8'))
1
>>> ord(s.decode('utf-8'))
231

关于python - 如何存储非英文文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36967011/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com