gpt4 book ai didi

将 csv 文件中的特定行读入 R

转载 作者:行者123 更新时间:2023-12-02 01:35:54 25 4
gpt4 key购买 nike

我有一个很大的 csv 文件,我需要将其读入 R。但是,我只需要具有特定变量值(即具有特定日期)的观察结果。有没有一种方法可以从一开始就做到这一点,而无需读取整个文件然后进行子集化?

最佳答案

假设日期在数据集的第一列中(并且您在类 Unix 机器上),您可以这样做:

dates <- paste0(c("2015-06-01", "2015-06-16"), collapse = "|")
expr <- paste0("grep -E '(", dates, "),.+' tmpcsv.csv", collapse = "")
##
R> data.table::fread(expr)
V1 V2
1: 2015-06-16 -1.6866933
2: 2015-06-16 1.3686023
3: 2015-06-01 -0.2257710
4: 2015-06-16 -1.0185754
5: 2015-06-01 0.3035286
6: 2015-06-01 2.0500847
7: 2015-06-01 -0.4910312

否则,您将不得不相应地修改正则表达式。


数据:

set.seed(123)
##
df <- data.frame(
Date = Sys.Date() + floor(50*round(runif(50, -1, 1), 1)),
Value = rnorm(50)
)
write.csv(df, file = "tmpcsv.csv", row.names = FALSE)
##

关于将 csv 文件中的特定行读入 R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31256516/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com