gpt4 book ai didi

r - 如何从 R 中的大型固定宽度文件中读取特定列

转载 作者:行者123 更新时间:2023-12-01 23:54:43 25 4
gpt4 key购买 nike

R 中有没有方便的方法从固定宽度的数据文件中读取特定列(或多列)?例如。该文件如下所示:

10010100100002000000
00010010000001000000
10010000001002000000

比如说,我会对第 15 列感兴趣。目前我正在使用 read.fwf 读取整个数据,宽度为 1 的向量,长度为总列数:

data <- read.fwf("demo.asc", widths=rep(1,20))
data[,14]
[1] 2 1 2

这很有效,但无法扩展到包含 100,000 列和行的数据集。有什么有效的方法可以做到这一点吗?

最佳答案

您可以使用连接并以 block 的形式处理文件:

复制您的数据:

dat <-"10010100100002000000
00010010000001000000
10010000001002000000"

使用连接在 block 中处理:

# Define a connection
con = textConnection(dat)


# Do the block update
linesPerUpdate <- 2
result <- character()
repeat {
line <- readLines(con, linesPerUpdate)
result <- c(result, substr(line, start=14, stop=14))
if (length(line) < linesPerUpdate) break
}

# Close the connection
close(con)

结果:

result
[1] "2" "1" "2"

关于r - 如何从 R 中的大型固定宽度文件中读取特定列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24572252/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com