gpt4 book ai didi

r - 数据框选定列中包含 NA(缺失)值的行子集

转载 作者:行者123 更新时间:2023-12-03 05:03:44 68 4
gpt4 key购买 nike

我们有一个来自 CSV 文件的数据框。数据框 DF 具有包含观测值的列和包含测量日期的列 (VaR2)。如果未记录日期,则 CSV 文件包含值 NA,表示缺少数据。

Var1  Var2 
10 2010/01/01
20 NA
30 2010/03/01

我们希望使用subset命令定义一个新的数据框new_DF,使其仅包含列中具有NA'值的行( >VaR2)。在给出的示例中,只有第 2 行将包含在新的 DF 中。

命令

new_DF<-subset(DF, DF$Var2=="NA") 

不起作用,生成的数据框没有行条目。

如果在原始 CSV 文件中将值 NANULL 交换,则相同的命令会产生所需的结果:

new_DF <- subset(DF, DF$Var2=="NULL")

如果原始 CSV 文件中提供了字符串值 NA,如何才能使此方法正常工作?

最佳答案

切勿使用 =='NA' 来测试缺失值。请改用 is.na() 。这应该可以做到:

new_DF <- DF[rowSums(is.na(DF)) > 0,]

或者如果您想检查特定列,您也可以使用

new_DF <- DF[is.na(DF$Var),]

如果您有 NA 字符值,请首先运行

Df[Df=='NA'] <- NA

用缺失值替换它们。

关于r - 数据框选定列中包含 NA(缺失)值的行子集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7980622/

68 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com