gpt4 book ai didi

r - 高效地将大文件中的特定行读取到 R 中

转载 作者:行者123 更新时间:2023-12-03 03:58:21 25 4
gpt4 key购买 nike

我对 R 从大文件 (11GB+) 中读取特定行所需的时间感到惊讶。例如:

> t0 = Sys.time()
> read.table('data.csv', skip=5000000, nrows=1, sep=',')
V1 V2 V3 V4 V5 V6 V7
1 19.062 56.71047 1 16 8 2006 56281
> print(Sys.time() - t0)
Time difference of 49.68314 secs

OSX 终端可以立即返回特定行。有谁知道 R 中更有效的方法吗?

最佳答案

你可以使用这样的东西

 dat <- read.table(pipe("sed -n -e'5000001p' data.csv"), sep=',')

仅读取使用其他 shell 工具提取的行。

另请注意,system.time(someOps) 是一种更简单的测量时间的方法。

关于r - 高效地将大文件中的特定行读取到 R 中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18235269/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com