gpt4 book ai didi

python阿拉伯语编码问题

转载 作者:太空宇宙 更新时间:2023-11-03 12:55:41 24 4
gpt4 key购买 nike

我有一段使用 windows-1256 编码的文本。现在我想将文本从阿拉伯语 (windows-1256) 转换为 utf-8

示例文本:

Óæí Ïæã ÈíåÞí

结果:

سوي دوم بيهقي

我使用这段代码解码并编码为utf-8

# -*- coding: utf-8 -*-

data = "Óæí Ïæã ÈíåÞí"
print data.decode("windows-1256", "replace")
print data.encode("windows-1256")

该代码返回此结果:

أ“أ¦أ­ أڈأ¦أ£ أˆأ­أ¥أ‍أ­
Traceback (most recent call last):
File "mohmal2.py", line 5, in <module>
print data.encode("windows-1256")
File "/usr/lib/python2.7/encodings/cp1256.py", line 12, in encode
return codecs.charmap_encode(input,errors,encoding_table)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 0: ordinal not in range(128)

我找到了一个可以转换此文本的网站:

http://www.iosart.com

最佳答案

看起来您不小心将输入解码为 Windows-1252。

>>> "Óæí Ïæã ÈíåÞí".encode('cp1252').decode('cp1256')
'سوي دوم بيهقي'

关于python阿拉伯语编码问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43496669/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com