gpt4 book ai didi

r - 将带有多字符分隔符的 "csv"文件导入到 R?

转载 作者:行者123 更新时间:2023-12-03 15:59:35 24 4
gpt4 key购买 nike

我有一个“csv”文本文件,其中每个字段由 \t&%$# 分隔我现在正试图导入到 R 中。
sep= read.table() 的论据坚持一个字符。有没有直接导入这个文件的快速方法?

一些数据字段是用户提交的文本,其中包含制表符、引号和其他杂乱的内容,因此将分隔符更改为更简单的内容似乎会产生其他问题。

最佳答案

以下代码将能够处理多个分隔符:

#fileName <- file name with fully qualified path
#separators <- each of them separated by '|'

read <- function(fileName, separators) {
data <- readLines(con <- file(fileName))
close(con)
records <- sapply(data, strsplit, split=separators)
dataFrame <- data.frame(t(sapply(records,c)))
rownames(dataFrame) <- 1: nrow(dataFrame)
return(as.data.frame(dataFrame,stringsAsFactors = FALSE))
}

关于r - 将带有多字符分隔符的 "csv"文件导入到 R?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18186357/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com