gpt4 book ai didi

Python Pandas : How to read only first n rows of CSV files in?

转载 作者:IT老高 更新时间:2023-10-28 20:29:46 24 4
gpt4 key购买 nike

我有一个非常大的数据集,我无法读取整个数据集。所以,我正在考虑只读取其中的一部分进行训练,但我不知道该怎么做。任何想法将不胜感激。

最佳答案

如果您只想读取前 999,999(非标题)行:

read_csv(..., nrows=999999)

如果您只想读取第 1,000,000 ... 1,999,999 行

read_csv(..., skiprows=1000000, nrows=999999)

nrows : int, default None 要读取的文件行数。对...有用读取大文件*

skiprows:类列表或整数文件开头要跳过的行号(0 索引)或要跳过的行数(int)

对于大文件,您可能还想使用 chunksize:

chunksize:int,默认无返回 TextFileReader 对象进行迭代

pandas.io.parsers.read_csv documentation

关于Python Pandas : How to read only first n rows of CSV files in?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23853553/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com