python - 如何使用python将阿拉伯字符映射到英文字符串-6ren

python - 如何使用python将阿拉伯字符映射到英文字符串

转载作者：太空宇宙更新时间：2023-11-04 08:55:43

我正在尝试读取一个包含阿拉伯字符(如“ù”)的文件并将其映射到英文字符串“AYN”。我想在 Python 3.4 中创建所有 28 个阿拉伯字母到英文字符串的映射。我仍然是 Python 的初学者，不知道如何开始。具有阿拉伯字符的文件以 UTF8 格式编码。

最佳答案

使用unicodedata;

(注意:这是 Python 3。在 Python 2 中使用 u'ù' 代替)

In [1]: import unicodedata

In [2]: unicodedata.name('a')
Out[2]: 'LATIN SMALL LETTER A'

In [6]: unicodedata.name('ع')
Out[6]: 'ARABIC LETTER AIN'

In [7]: unicodedata.name('ع').split()[-1]
Out[7]: 'AIN'

最后一行适用于简单字母，但不适用于所有阿拉伯符号。例如。带下面三个点的阿拉伯文字母FEH。

所以你可以使用；

In [26]: unicodedata.name('ڥ').lower().split()[2]
Out[26]: 'feh'

或

In [28]: unicodedata.name('ڥ').lower()[14:]
Out[28]: 'feh with three dots below'

为了识别字符，使用类似这样的东西(Python 3)；

c = 'ع'
id = unicodedata.name(c).lower()
if 'arabic letter' in id:
    print("{}: {}".format(c, id[14:].lower()))

这会产生；

ع: ain

我正在过滤字符串 'arabic letter' 因为 arabic unicode block还有很多其他符号。

一个完整的字典可以用:

arabicdict = {}
for n in range(0x600, 0x700):
    c = chr(n)
    try:
        id =  unicodedata.name(c).lower()
        if 'arabic letter' in id:
            arabicdict[c] = id[14:]
    except ValueError:
        pass

关于python - 如何使用python将阿拉伯字符映射到英文字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30443665/

文章推荐： Python比较两个不均匀数组

文章推荐： c++ - 一次读取完整文件是个好主意吗？

文章推荐： c - 在 c 中选择显示奇怪的行为

文章推荐： python - 为什么我不能在 Raspberry Pi 上使用 python-mosquitto？

php - 阿拉伯/波斯数字的 Number_format
我在 mysql 数据库中有一个“价格”字段，其中包含以阿拉伯或波斯数字表示的产品价格。数字示例:12345567890 //1234567890 我不知道如何格式化它以便以用户友好的方式格式化。我
ruby-on-rails - 阿拉伯 Prawn gem
由于单独使用 prawn gem 时阿拉伯字母显示为未知字符，因此我安装了 Arabic-Prawn gem 0.0.1 以阿拉伯语打印数据。我用下面的代码作为测试 Prawn::Document.g

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 如何使用python将阿拉伯字符映射到英文字符串