gpt4 book ai didi

python - 使用多种编码对文本进行编码

转载 作者:太空宇宙 更新时间:2023-11-03 20:55:03 26 4
gpt4 key购买 nike

我试图在 python 中打开一个 txt 文件并使用 open()read() 读取它,问题是有些文本不是 UTF-8。这是错误:

UnicodeDecodeError: 'charmap' codec can't decode byte 0x8f in position 1911885: character maps to

如何阅读此文档?

最佳答案

您可能想检查这个问题的所有答案,因为它看起来与您的非常相似:UnicodeDecodeError: 'charmap' codec can't decode byte X in position Y: character maps to <undefined>

正如网站中所述,请尝试:

file = open(filename, encoding="utf8")

本来打算将此作为评论分享,但我没有足够的声誉:)

编辑:阅读您的评论作为对我之前答案的回应并按照 Cett 的建议进行改进后:

处理编码错误的最佳方法可能是使用错误参数。正如您的问题中所述,如果只有某些字符未解码,那么这应该可以使用。

file = open(filename, encoding="utf8", errors = "ignore")

注意:使用此参数将导致 Python 忽略该特殊字符。因此,只有当您愿意丢失一些数据时,我才推荐这样做。

关于python - 使用多种编码对文本进行编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56075269/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com