gpt4 book ai didi

python - 解码shift-jis : "illegal multibyte sequence"

转载 作者:太空狗 更新时间:2023-10-29 22:27:46 26 4
gpt4 key购买 nike

我正在尝试解码 shift-jis 编码的字符串,如下所示:

string.decode('shift-jis').encode('utf-8')

能够在我的程序中查看它。

当我遇到 2 个 shift-jis 字符(十六进制“0x87 0x54”和“0x87 0x55”)时,我收到此错误:

UnicodeDecodeError: 'shift_jis' codec can't decode bytes in position 12-13: illegal multibyte sequence

但我确定它们是有效的 shift-jis 字符:http://www.rikai.com/library/kanjitables/kanji_codes.sjis.shtml

我还注意到这些字符在我的 shift-jis 文本编辑器中显示为黑框,这意味着它们无法被识别。所以这两个字符有一些特殊之处,导致我的编辑器和 Python 解码器失败。帮忙?

(抱歉,我无法发布示例字符串,因为当这些字符存在时,它不会从那里添加到剪贴板,并且还会自动转换为 unicode。不过我发布了它们的十六进制值。 )

最佳答案

存在多个版本的 Shift JIS。 shift_jis 编解码器是 JIS X 0208 ,而该表是 JIS X 0213 , 对应于 shift_jisx0213 编解码器。

>>> u'⑲⑳Ⅰ'.encode('shift_jisx0213')
'\x87R\x87S\x87T'

关于python - 解码shift-jis : "illegal multibyte sequence",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6729016/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com