gpt4 book ai didi

r - 将文本文件导入R

转载 作者:行者123 更新时间:2023-12-03 16:06:07 24 4
gpt4 key购买 nike

我有一个包含超过100,000行的文本文件,我每周从SAP下载一次。它以页面形式下载,每个页面包含相同的标题和虚线。下面是一个最小示例,其中包含两个页面,每个页面仅包含两个项目。

------------------------------------------------------------
|date |Material |Description |
|----------------------------------------------------------|
|10/04/2013 |WM.5597394 |PNEUMATIC |
|11/07/2013 |GB.D040790 |RING |
------------------------------------------------------------

------------------------------------------------------------
|date |Material |Description |
|----------------------------------------------------------|
|08/06/2013 |WM.4M01004A05 |TOUCHEUR |
|08/06/2013 |WM.4M010108-1 |LEVER |
------------------------------------------------------------

我想做的就是将此文件导入到R中,该文件只有一个 header ,没有虚线。我试过了:
read.table( "myfile.txt",  sep = "|", fill=TRUE)

非常感谢

最佳答案

另一种readLines方法:

l <- readLines("myfile.txt")

# remove unnecessary lines
l <- grep("^\\|?-+\\|?$|^$", l, value = TRUE, invert = TRUE)

# remove duplicated headers
l2 <- c(l[1], l[-1][l[-1] != l[1]])

# split
lsplit <- strsplit(l2, "\\s*\\|")

# create data frame
dat <- setNames(data.frame(do.call(rbind, lsplit[-1])[ , -1]), lsplit[[1]][-1])


date Material Description
1 10/04/2013 WM.5597394 PNEUMATIC
2 11/07/2013 GB.D040790 RING
3 08/06/2013 WM.4M01004A05 TOUCHEUR
4 08/06/2013 WM.4M010108-1 LEVER

关于r - 将文本文件导入R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21114598/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com