gpt4 book ai didi

r - 计算二进制变量的百分比 BY R 中的另一个变量

转载 作者:行者123 更新时间:2023-12-02 15:22:16 25 4
gpt4 key购买 nike

我想总结按地区接受治疗的人数百分比。

我为此创建了一个虚拟数据集:

id <- seq(1:1000)
region <- rep(c("A","B","C","D","E"),c(200,200,200,200,200))
treatment <- rep(seq(1:2), each=4)
d <- data.frame(id,region,treatment)

我如何找出 (a) 每个地区的总人数(我想我会为此目的使用长度)和 (b) 按地区接受治疗 1(相对于 2)的人的百分比?

我将为某些 ID 使用 NA,因此如果可以从一开始就将其合并到代码中,我们将不胜感激。

我过去曾使用 ddply 来总结连续变量(即平均值),但在使用因子变量时却很吃力。

如有任何帮助,我们将不胜感激。

最佳答案

dplyr 解决方案:

library(dplyr)
d %>% group_by(region) %>% summarize(NumPat=n(),prop=sum(treatment==1)/n())

我们在这里做的是按地区分组,然后通过管道将其汇总为每组中的患者数量,然后计算接受治疗 1 的患者比例。

关于r - 计算二进制变量的百分比 BY R 中的另一个变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34792323/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com