gpt4 book ai didi

python - 使用 Python 搜索并用竖线 (|) 替换刺号 (þ) 字符

转载 作者:行者123 更新时间:2023-11-30 23:34:19 24 4
gpt4 key购买 nike

我正在尝试使用python查找刺“þ”字符,并用管道“|”替换。例如,该文件的内容类似于 125650×383736×392647。下面是我的代码:

f = codecs.open(path, encoding='utf-8', mode='r+')
contents = f.read()
if u'\u00FE' in contents:
print 'Found thorn'

我在contents = f.read()行上遇到错误:UnicodeDecodeError:“utf8”编解码器无法解码位置 7 中的字节 0xfe:起始字节无效

文件对象 f 似乎无法解码 thorn 字符。这里有什么问题?提前致谢

最佳答案

解码错误的最常见原因是您使用了错误的编码。在这种情况下,您的文件似乎是使用 Windows-1252 或 latin-1 编码的,而不是 UTF-8。我很确定情况确实如此,因为 0xfe 是这些编解码器的拉丁小写字母 thorn 的代码点。

例如:

>>> print '125650\xfe383736\xfe3926'.decode('latin-1')
125650þ383736þ3926

关于python - 使用 Python 搜索并用竖线 (|) 替换刺号 (þ) 字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18192672/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com