gpt4 book ai didi

r - 如何将 .csv 文件的特定列加载到 R?

转载 作者:行者123 更新时间:2023-12-04 00:08:30 24 4
gpt4 key购买 nike

我有一个存储为 .csv 文件的巨大数据集,它不适合内存。但是,我只需要数据集中适合内存的 3 列。如何加载它们?

更新:我可以按名称而不是按列索引选择列吗?我不知道他们的指数先验

最佳答案

如果你的表很大,考虑使用 data.table 包:

# create an example: 10,000 rows by 100 columns
df <- data.frame(matrix(rnorm(1e6),ncol=100))
write.csv(df,"sample.csv",row.names=F)

library(data.table)
dt <- fread("sample.csv",select=c(3,8,20))
head(dt)
# X3 X8 X20
# 1: 0.5537762 1.0271272 -0.14437400
# 2: -0.4111327 -0.2297311 -1.04998490
# 3: -1.2540440 0.6977565 -0.21514021
# 4: -1.1500974 -0.3181102 -0.07910133
# 5: -0.6549245 1.8385510 0.73741980
# 6: 0.8049360 0.4722533 -0.65750679

这仅读取第 3、8 和 20 列,速度非常快。

关于r - 如何将 .csv 文件的特定列加载到 R?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22416888/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com