gpt4 book ai didi

字节不在文件中的 Python Unicode 解码错误

转载 作者:太空宇宙 更新时间:2023-11-04 13:22:19 25 4
gpt4 key购买 nike

我正在使用 readline() 逐行读取 python 中的一个大文件。在接近 672,280 行后,我得到一个错误:

 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfd in position 228:
invalid start byte.

但是,我使用 grep 搜索了一个字节 0xfd 的文件,但没有返回任何结果。我还编写了 c++ 代码来遍历文件并查找字节 0xfd 但仍然一无所获。所以我不知道这里发生了什么。是文件太大导致的错误吗?

我只是不明白为什么不在文件中的字节会发生解码错误。

谢谢

最佳答案

你可以试试用ISO编码打开文件。

open('myfile.txt', encoding = "ISO-8859-1")

关于字节不在文件中的 Python Unicode 解码错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34740255/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com