gpt4 book ai didi

Python:标记数据时出错。 C 错误:在源上调用 read(nbytes) 失败,输入 nzip 文件

转载 作者:行者123 更新时间:2023-12-03 15:26:51 24 4
gpt4 key购买 nike

我正在使用 conda python 2.7

python --version
Python 2.7.12 :: Anaconda 2.4.1 (x86_64)

我有读取大型 gzip 文件的休闲方法:
df = pd.read_csv(os.path.join(filePath, fileName),
sep='|', compression = 'gzip', dtype='unicode', error_bad_lines=False)

但是当我读取文件时,出现以下错误:
pandas.parser.CParserError: Error tokenizing data. C error: Calling read(nbytes) on source failed. Try engine='python'.
Segmentation fault: 11

我阅读了所有现有答案,但大多数问题都有错误,例如附加列。我已经用 error_bad_lines=False 处理了这个问题选项。

我在这里有哪些选择?

当我尝试解压缩文件时发现了一些有趣的东西:
gunzip -k myfile.txt.gz 
gunzip: myfile.txt.gz: unexpected end of file
gunzip: myfile.txt.gz: uncompress failed

最佳答案

您放置的路径可能实际上是 folder 的路径而不是 file这需要阅读。Pandas.read_csv无法读取文件夹,需要明确的兼容文件名。

关于Python:标记数据时出错。 C 错误:在源上调用 read(nbytes) 失败,输入 nzip 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40835287/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com