gpt4 book ai didi

python - 即使一切都是 unicode ( python 2.7 ),ascii 解码错误

转载 作者:行者123 更新时间:2023-12-01 01:15:44 33 4
gpt4 key购买 nike

我正在数据流(apache beam)中运行一个脚本,它在python 2.7.12中运行,并使用 unicode 字符串进行一些文本处理。

在处理过程中,我执行以下操作,其中名词短语是unicode(我认为...)

# -*- coding: utf-8 -*-
...
key = u"{}_{}".format(
noun, phrase.replace(u" ", u"_")
)

但是它会产生 ascii 解码错误

'ascii' codec can't decode byte 0xe2 in position 1: ordinal not in range(128)

我可以进行调试并获取用作名词短语中使用的字符串的repr,但我目前没有它们,因为我的日志记录没有输出他们。

当我认为我非常明确我想要unicode中的所有内容时,我不明白ascii解码错误!

您能给一些提示吗?或者我应该返回有关输入字符串的更多信息?

最佳答案

好的,你的字符串中有一个非 ASCII 字符。您需要直接将phrase转换为unicode

 phrase.decode('latin-1')

unicode.format 中进行操作

关于python - 即使一切都是 unicode ( python 2.7 ),ascii 解码错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54364991/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com