gpt4 book ai didi

r - 使用 R 包 : readxl and writing to a csv 按列合并多个 .xlsx 文件时出现标题前有垃圾文本的问题

转载 作者:行者123 更新时间:2023-12-02 22:39:20 25 4
gpt4 key购买 nike

我对 R 和一般编程非常陌生,需要帮助排列 ~2000 个 .xls 和 .xlsx 文件中包含的数据。每个文件以标题前的 34 - 40 行“垃圾”文本开头;标题下的所有数据都具有相同的维度。

我尝试的第一种方法将数据添加到列表中;垂直格式没有用。

library(readxl)
file.list <- list.files(pattern='*.xls')
dm.list <- lapply(file.list, read_excel)

我目前正在尝试一次读入一个文件,删除“垃圾”文本,然后写入 .csv 文件(逐列附加数据)。

library(readxl)
file.list <- list.files(pattern='*.xls')

for(i in 1:dim.data.frame(file.list))

store.matrix <- read_excel((paste0("C:\\Users\\jlmine\\Desktop\\qPCRextData\\", file.list[i])), sheet = "Results")

while (store.matrix[1,1] != "Well") #search for header
{ store.matrix <- store.matrix[-c(1)] } #delete non-header rows

write.csv(store.matrix, file = "qPCRdataanalysis.csv", append = TRUE)

以下行抛出错误:

store.matrix <- read_excel((paste0("C:\\Users\\jlmine\\Desktop\\qPCRextData\\", file.list[i])), sheet = "Results")

Error: 'C:\Users\jlmine\Desktop\qPCRextData\' does not exist. In addition: Warning message: In 1:dim.data.frame(file.list) :
numerical expression has 2 elements: only the first used

“C:\Users\jlmine\Desktop\qPCRextData\”被设置为我的工作目录任何想法将不胜感激。

最佳答案

如果无法访问您的 .xlsx 文件,问题似乎出在您的 for 循环语句中。 list.files 返回指定目录中文件的字符向量。在长度为 5 的向量 x 上使用 dim.data.frame 会得到结果:

#[0, 5]

从警告消息中,您知道 for 循环中仅使用了第一个元素。所以你没有循环任何东西。

因此,如果您想更优雅地循环所有文件,您可以...

for (i in seq(length(file.list)) {

关于r - 使用 R 包 : readxl and writing to a csv 按列合并多个 .xlsx 文件时出现标题前有垃圾文本的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39629363/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com