gpt4 book ai didi

将制表符分隔的数据读入 R

转载 作者:行者123 更新时间:2023-12-03 15:00:15 24 4
gpt4 key购买 nike

我正在尝试将一个大的制表符分隔文件读入 R。

首先我试过这个:

data <- read.table("data.csv", sep="\t")

但它正在读取一些数字变量作为因子

所以我试图根据我希望每个变量是这样的类型来读入数据:
data <- read.table("data.csv", sep="\t", colClasses=c("character","numeric","numeric","character","boolean","numeric"))

但是当我尝试这个时,它给了我一个错误:

Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : scan() expected 'a real', got '"4"'



我认为原始原始文件中的某些数值周围可能有引号,但我不确定。

最佳答案

如果没有看到您的数据,您将有以下几种情况之一:您没有将数据分隔开的所有选项卡;在单个观察中有嵌入的选项卡;或一连串的其他人。

解决这个问题的方法是设置 options(stringsAsFactors=FALSE)然后使用你的第一行。

退房 str(data)并尝试找出哪些行是罪魁祸首。某些数值读取为因子的原因是因为该列中有一些东西被 R 解释为一个字符,因此它将整个列强制转换为字符。这通常需要一些挖掘,但问题几乎肯定出在您的输入文件上。

这是一个常见的数据修改问题,祝你好运!

关于将制表符分隔的数据读入 R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11675917/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com