gpt4 book ai didi

r - 如何总结具有缺失数据的分类变量?

转载 作者:行者123 更新时间:2023-12-03 16:22:06 25 4
gpt4 key购买 nike

我正在尝试对分类变量脆弱分数执行 group_by 总结。数据的结构使得每个主题都有多个观察结果,其中一些包含缺失的数据,例如

Subject  Frailty
1 Managing well
1 NA
1 NA
2 NA
2 NA
2 Vulnerable
3 NA
3 NA
3 NA

我希望对数据进行汇总,以便在有可用的情况下出现脆弱的描述,如果没有,则出现 NA,例如
Subject  Frailty
1 Managing well
2 Vulnerable
3 NA

我尝试了以下两种方法都返回错误:
Mode <- function(x) {
ux <- na.omit(unique(x[!is.na(x)]))
tab <- tabulate(match(x, ux)); ux[tab == max(tab)]
}

data %>%
group_by(Subject) %>%
summarise(frailty = Mode(frailty)) %>%

Error: Expecting a single value: [extent=2].
condense <- function(x){unique(x[!is.na(x)])}

data %>%
group_by(subject) %>%
summarise(frailty = condense(frailty))

Error: Column frailty must be length 1 (a summary value), not 0

最佳答案

一种解决方案涉及 dplyr可能:

df %>%
group_by(Subject) %>%
slice(which.min(is.na(Frailty)))

Subject Frailty
<int> <chr>
1 1 Managing_well
2 2 Vulnerable
3 3 <NA>

关于r - 如何总结具有缺失数据的分类变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60531403/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com