gpt4 book ai didi

python-3.x - 使用 pd.read_csv 导入 csv - 无效的起始字节错误

转载 作者:行者123 更新时间:2023-12-03 23:29:00 32 4
gpt4 key购买 nike

我正在尝试使用以下方法导入 csv 文件:

data = pd.read_csv("filename.csv")

我收到以下错误: "UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb0 in position 2: invalid start byte".
本题答案: UnicodeDecodeError: 'utf8' codec can't decode byte 0x9c
可能有用,但我不确定如何实现它(我无法对答案发表评论,因为我还没有足够的声誉)。

任何帮助,将不胜感激。

编辑:这个问题似乎与我有学位符号的事实有关。如果在导入过程中跳过这个问题对我来说会很好。

最佳答案

如果您因为文件编码不是 pd.read_csv() 中提到的默认编码而面临编码错误docs ,您可以通过首先安装 chardet 找到文件的编码接着是下面的代码:

import chardet    
rawdata = open('D:\\path\\file.csv', 'rb').read()
result = chardet.detect(rawdata)
charenc = result['encoding']
print(charenc)

这将为您提供文件的编码。

一旦你有了编码,你可以读为:
pd.read_csv('D:\\path\\file.csv',encoding = 'encoding you found')

或者
pd.read_csv(r'D:\path\file.csv',encoding = 'encoding you found')

您将获得所有编码列表 here

希望您觉得这个有帮助。

关于python-3.x - 使用 pd.read_csv 导入 csv - 无效的起始字节错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54133455/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com