r - 计算二进制变量的百分比 BY R 中的另一个变量-6ren

r - 计算二进制变量的百分比 BY R 中的另一个变量

转载作者：行者123 更新时间：2023-12-02 15:22:16

我想总结按地区接受治疗的人数百分比。

我为此创建了一个虚拟数据集:

id <- seq(1:1000)
region <- rep(c("A","B","C","D","E"),c(200,200,200,200,200))
treatment <- rep(seq(1:2), each=4)
d <- data.frame(id,region,treatment)

我如何找出 (a) 每个地区的总人数(我想我会为此目的使用长度)和 (b) 按地区接受治疗 1(相对于 2)的人的百分比？

我将为某些 ID 使用 NA，因此如果可以从一开始就将其合并到代码中，我们将不胜感激。

我过去曾使用 ddply 来总结连续变量(即平均值)，但在使用因子变量时却很吃力。

如有任何帮助，我们将不胜感激。

最佳答案

dplyr 解决方案:

library(dplyr)
d %>% group_by(region) %>% summarize(NumPat=n(),prop=sum(treatment==1)/n())

我们在这里做的是按地区分组，然后通过管道将其汇总为每组中的患者数量，然后计算接受治疗 1 的患者比例。

关于r - 计算二进制变量的百分比 BY R 中的另一个变量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34792323/

文章推荐： Django 1.9 和 django.contrib.auth

文章推荐： R : How evaluate formals (arguments) of function?

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

r - 计算二进制变量的百分比 BY R 中的另一个变量