gpt4 book ai didi

Python 不识别 unicode

转载 作者:太空宇宙 更新时间:2023-11-03 13:03:04 29 4
gpt4 key购买 nike

我正在尝试制作一个脚本,将日文片假名转换为罗马字(“shi”到“shi”)。这是我正在尝试的:

x = u''
x = raw_input('Enter katakana: ')
x = x.replace(u'\u30B7', u'shi')

Enter Katakana: シ
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe3 in position 0: ordinal not in range(128)

只要我的脚本中的 unicode 写成 u'\u30B7' 而不是 shi,它应该能够处理它,对吗?

最佳答案

raw_input 以字节编码形式返回输入的字符串,该形式因使用的终端而异。首先尝试将输入显式解码为 Unicode:

import sys
x = raw_input('Enter katakana: ').decode(sys.stdin.encoding)

您得到的错误是由于 replace 试图通过默认的 ascii 编解码器天真地将字节编码的 x 转换为 Unicode。

关于Python 不识别 unicode,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13556587/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com