gpt4 book ai didi

python - Pandas .DAT 文件导入错误并跳过行

转载 作者:太空宇宙 更新时间:2023-11-03 15:54:37 24 4
gpt4 key购买 nike

我正在尝试将一个巨大的数据文件分成较小的部分。我正在使用以下脚本 -

 df = pd.read_csv(file_name, header=None,encoding='latin1',sep='\t',nrows=100000, skiprows = 100000)

但是我发现skip rows参数跳过了大约200000行而不是100000行谁能告诉我为什么会发生这种情况

最佳答案

感谢@EdChum,我能够使用 chunksize 和以下代码解决问题:-

i = 0
tp = pd.read_csv(filename,header=None,encoding='latin1', sep='\t', iterator=True, chunksize=1000000)
for c in tp:
ca = pd.DataFrame(c)
ca.to_csv (file_destination +str(i)+'test.csv', index = False, header = False)
i = i+1

关于python - Pandas .DAT 文件导入错误并跳过行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40914795/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com