作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想总结按地区接受治疗的人数百分比。
我为此创建了一个虚拟数据集:
id <- seq(1:1000)
region <- rep(c("A","B","C","D","E"),c(200,200,200,200,200))
treatment <- rep(seq(1:2), each=4)
d <- data.frame(id,region,treatment)
我如何找出 (a) 每个地区的总人数(我想我会为此目的使用长度)和 (b) 按地区接受治疗 1(相对于 2)的人的百分比?
我将为某些 ID 使用 NA,因此如果可以从一开始就将其合并到代码中,我们将不胜感激。
我过去曾使用 ddply 来总结连续变量(即平均值),但在使用因子变量时却很吃力。
如有任何帮助,我们将不胜感激。
最佳答案
dplyr
解决方案:
library(dplyr)
d %>% group_by(region) %>% summarize(NumPat=n(),prop=sum(treatment==1)/n())
我们在这里做的是按地区分组,然后通过管道将其汇总为每组中的患者数量,然后计算接受治疗 1 的患者比例。
关于r - 计算二进制变量的百分比 BY R 中的另一个变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34792323/
我是一名优秀的程序员,十分优秀!