>> word = word.decode('UTF-8') >>> word-6ren">
gpt4 book ai didi

python - 如何解码和编码希伯来语字符串?

转载 作者:IT老高 更新时间:2023-10-28 20:47:59 27 4
gpt4 key购买 nike

我正在尝试对希伯来语字符串“שלום”进行编码和解码。但是,编码后,我得到了乱码:

>>> word = "שלום"
>>> word = word.decode('UTF-8')
>>> word
u'\u05e9\u05dc\u05d5\u05dd'
>>> print word
שלום
>>> word = word.encode('UTF-8')
>>> word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print word
׳©׳׳•׳

我应该如何正确地做呢?

最佳答案

您必须确保在您的环境(shell 或脚本)中使用正确的编码。如果您使用的是脚本,请包括以下内容:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

确保您的环境知道您使用的是 UTF-8。您可能会发现您的 shell 终端只接受 ASCII,因此请确保它能够支持 UTF-8。

>>> word = "שלום"
>>> word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print word
שלום
>>> word = word.decode('UTF-8')
>>> word
u'\u05e9\u05dc\u05d5\u05dd'
>>> print word
שלום
>>> word = word.encode('UTF-8')
>>> word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print word
שלום
>>>

关于python - 如何解码和编码希伯来语字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29850912/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com