gpt4 book ai didi

python - 在 Python 中使用 UTF-8

转载 作者:太空宇宙 更新时间:2023-11-03 13:03:38 25 4
gpt4 key购买 nike

现在是夏天,我决定学习一门新语言,Python 是我的选择。真的,我想学习的是如何使用 Python 处理阿拉伯语文本。现在,我找到了很多关于使用 Python 的资源,这些资源真的很棒。但是,当我将所学知识应用于阿拉伯字符串时,我得到了数字和字母组合在一起的结果。

以英语为例:

>>> ebook = 'The American English Dictionary'
>>> ebook[2]
'e'

现在,对于阿拉伯语:

>>> abook = 'القاموس العربي'
>>> abook[2]
'\xde' #the correct output should be 'ق'

但是,使用 print 效果很好,如下所示:

>>> print abook[2]
ق

我需要修改什么才能让 Python 始终识别阿拉伯字母?

最佳答案

明确使用 Unicode:

>>> s = u'القاموس العربي'
>>> s
u'\u0627\u0644\u0642\u0627\u0645\u0648\u0633 \u0627\u0644\u0639\u0631\u0628\u064a'
>>> print s
القاموس العربي

>>> print s[2]
ق

甚至逐个字符:

>>> for i, c in enumerate(s):
... print i,c
...
0 ا
1 ل
2 ق
3 ا
4 م
5 و
6 س
7
8 ا
9 ل
10 ع
11 ر
12 ب
13 ي
14

我推荐 Python Unicode page这是简短、实用和有用的。

关于python - 在 Python 中使用 UTF-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11175976/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com