gpt4 book ai didi

r - 对空白缺失值使用不同长度的 data.table 的 fread

转载 作者:行者123 更新时间:2023-12-04 20:07:14 28 4
gpt4 key购买 nike

我有一个包含许多缺失值的数据集。一些缺失值是 NA,一些是 Null,而另一些则具有不同长度的空格。我想使用 fread函数在 R能够将所有这些值读取为缺失值。

下面是一个例子:

#Find fake data
iris <- data.table(iris)[1:5]

#Add missing values non-uniformly
iris[1,Species:=' ']
iris[2,Species:=' ']
iris[3,Species:='NULL']

#Write to csv and read back in using fread
write.csv(iris,file="iris.csv")
fread("iris.csv",na.strings=c("NULL"," "))

V1 Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1: 1 5.1 3.5 1.4 0.2
2: 2 4.9 3.0 1.4 0.2 NA
3: 3 4.7 3.2 1.3 0.2 NA
4: 4 4.6 3.1 1.5 0.2 setosa
5: 5 5.0 3.6 1.4 0.2 setosa

从上面的例子中,我们看到我无法解释第一个缺失值,因为有很多空格。有谁知道解决这个问题的方法?

最佳答案

非常感谢@eddi 的精彩回答。

fread("sed 's/ *//g' iris.csv",na.strings=c("",NA,"NULL"))

关于r - 对空白缺失值使用不同长度的 data.table 的 fread,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24191409/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com