gpt4 book ai didi

r - 排除子集中特定列中包含 NA 的行

转载 作者:行者123 更新时间:2023-12-01 08:52:44 26 4
gpt4 key购买 nike

我正在尝试排除包含我选择的特定列的 NA 的子集的行。我有一个这种组织的调查数据的 CSV 电子表格,例如:

name    idnum   term    type      q2    q3
bob 0321 1 2 0 .
. . 3 1 5 3
ron . 2 4 2 1
. 2561 4 3 4 2

在创建 R 工作区时,我将其设置为 data <- read.csv(..., na.strings='.') .出于分析的目的,我随后按术语和类型创建了子集,例如 set13 <- subset(data, term=1 & type=2) , 例如。当我尝试进行 t 检验时,我注意到该函数抛出了任何 NA 实例,有效地将我的样本量减少了一半。

对于我的分析,我想排除缺少调查项目的响应,例如我的示例中的 Bob,缺少问题 3。但我仍然想在 name 中包含具有一个或多个 NA 的行。或 idnum列。所以,从本质上讲,我想按列选择哪些 NA 被省略。 (请记住,这只是一个示例 - 我的实际 CSV 大约有 1000 行,因此每个子集可能包含 100-150 行。)

我知道这可以使用数据框来完成,但我不确定如何将其合并到给定的子集格式中。有没有办法做到这一点?

最佳答案

查看complete.cases,如this 的答案所示所以发帖。

data[complete.cases(data[,3:6]),]

这将返回第 3 到第 6 列中包含完整信息的所有行。

关于r - 排除子集中特定列中包含 NA 的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37848436/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com