gpt4 book ai didi

r - 仅从 R 中的 .csv 文件导入每第 N 行

转载 作者:行者123 更新时间:2023-12-01 23:41:13 24 4
gpt4 key购买 nike

只是一个简单的问题。有没有办法使用 read.csv 从大文件中导入每 N 行:

例如,一个 50-6000 万行的文件,您只需要从第 2 行开始的每 4 行。

我考虑过合并“seq”函数,但我不确定这是否可行。

有什么建议吗?

最佳答案

对于大型数据文件,最好的选择是在导入 R 之前过滤掉不必要的行。最简单的方法是使用操作系统命令,如 sed、awk、grep 等。以下代码从文件中每隔 4 行读取一次:例如:

write.csv(1:1000, file='test.csv')

file.pipe <- pipe("awk 'BEGIN{i=0}{i++;if (i%4==0) print $1}' < test.csv ")
res <- read.csv(file.pipe)
res

> res
X3 X3.1
1 7 7
2 11 11
3 15 15
4 19 19
5 23 23
6 27 27
7 31 31
8 35 35

关于r - 仅从 R 中的 .csv 文件导入每第 N 行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21891841/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com