r - 使用 dplyr 汇总时省略 NA-6ren

r - 使用 dplyr 汇总时省略 NA

转载作者：行者123 更新时间：2023-12-04 10:35:45

24

4

我的问题涉及使用 summarise_each 总结具有多列(50 列)的数据框dplyr 中的函数。
列中的数据条目是二进制的(0=负，1=正)，我的目标是获得 colsums 和百分比正数。
问题是某些列有 NA，我希望在计算总数和百分比时排除这些。
下面是一个最小的例子:

library(dplyr)
library(tidyr)
df=data.frame(
  x1=c(1,0,0,NA,0,1,1,NA,0,1),
  x2=c(1,1,NA,1,1,0,NA,NA,0,1),
  x3=c(0,1,0,1,1,0,NA,NA,0,1),
  x4=c(1,0,NA,1,0,0,NA,0,0,1),
  x5=c(1,1,NA,1,1,1,NA,1,0,1))

> df
   x1 x2 x3 x4 x5
1   1  1  0  1  1
2   0  1  1  0  1
3   0 NA  0 NA NA
4  NA  1  1  1  1
5   0  1  1  0  1
6   1  0  0  0  1
7   1 NA NA NA NA
8  NA NA NA  0  1
9   0  0  0  0  0
10  1  1  1  1  1

df %>%
  summarise_each(funs(total.count=n(), positive.count=sum(.,na.rm=T),positive.pctg=sum(.,na.rm=T)*100/n())) %>%
  gather(key,fxn,x1_total.count:x5_positive.pctg) %>%
  separate(key,c("col","funcn"),sep="\\_") %>%
  spread(funcn,fxn)

  col positive.count positive.pctg total.count
1  x1              4            40          10
2  x2              5            50          10
3  x3              4            40          10
4  x4              3            30          10
5  x5              7            70          10

例如，我希望在上表中得到的是 x1 的 total(total.count) 为:

length(df$x1[!is.na(df$x1)])

[1] 8

相反，我得到了以下内容，其中包括 NA:

length(df$x1)

[1] 10

我还希望 x1 的百分比(positive.pctg)为:

sum(df$x1,na.rm=T)/length(df$x1[!is.na(df$x1)])

[1] 0.5

相反，我得到了以下内容，其中包括 NA:

sum(df$x1,na.rm=T)/length(df$x1)

[1] 0.4

如何在 dplyr 中计算省略 NAs 的次数？似乎功能 n()或 length()不要采取任何
类似 na.omit/na.rm/complete.cases 的参数.
任何帮助将不胜感激。

最佳答案

尝试

df %>%
    summarise_each(funs(total.count=sum(!is.na(.)), positive.count=sum(.,na.rm=T),positive.pctg=sum(.,na.rm=T)*100/sum(!is.na(.))))%>%
    gather(key,fxn,x1_total.count:x5_positive.pctg) %>%
    separate(key,c("col","funcn"),sep="\\_") %>%
    spread(funcn,fxn)

关于r - 使用 dplyr 汇总时省略 NA，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28692578/

24

4

0

文章推荐： r - 从 0,1 和 NA 的向量创建组

文章推荐： r - R 中的置信区间

文章推荐： r - ggplot2:设置每个离散x点的绝对距离

文章推荐： r - 根据与另一个表的关系填充缺失值

c++ - 省略 for 循环值
这是我在这里的第一篇文章，也是我第一次使用 C++。我正在查看从 Internet 获得的一些代码，但我对此有疑问。它有一个 for 循环，像这样: for(cin >> t;t--;) 我明白它在
php - 省略/忽略用户已购买的任何记录
我目前正在开发一个网站，除其他外，该网站允许用户通过显示或隐藏他们已购买的商品来过滤市场。这适用于基本的 AJAX 调用，该调用传递可用过滤器的当前条件，然后使用 CodeIgniter 的事件记录构
java - 省略不直观地破坏了这段代码
我创建了一个 MWE，其中通过添加来更改单行解决编译器错误。以下代码无法编译: import java.util.List; public class MainClass { publi
SQL: 省略 FROM 子句
当我想测试一些 PostgreSQL 函数 FOO() 的行为时，我发现执行类似 SELECT FOO(bar) 的查询很有用，bar一些数据我用作直接输入，而无需从真实表中SELECT。我读到我们
java - 省略 for 循环中的第一个参数
在 PHP、Java、C++(以及许多其他语言)中，for 循环是这样使用的: for(int i=0;i<10;i++) 如果我已经初始化了i，我该如何省略初始化语句呢？最佳答案在 Java、C
android - 什么会导致溢出菜单项无缘无故被截断/省略？
我发现我们的 Android 应用出现了一个奇怪的问题，特别是在 4.4 版的 Moto X 上。在偏好 Activity 中，所有标题的前 8 个字符都在开头用省略号截断。这也发生在溢出菜单和整个
c# - 省略 XML 声明？
我有一个 XElement，我必须解析它以删除结束标记中的空白。我的代码如下所示: var stringBuilder = new StringBuilder(); using (var string
typescript - 省略 TypeScript 中的联合
假设我有两个接口(interface)，X和 Y ，它们共享一些字段，但也有独立的字段: interface X { abc: number; foo: number; bar: numb
javascript - 省略 mongodb 中不必要的属性
我有这个模型: var accountSchema = new mongoose.Schema({ 'seeker': { 'fullName': String,
r - 省略 `huxreg` 中的因子变量
我在 R 中运行一个具有大量时间和位置固定效应的回归。我尝试将一个漂亮的汇总表输出到 Latex 中。我从 stargazer 包切换到 huxtable，因为 stargazer 在忽略固定效果时表
R - 如何对行上的一些但不是所有变量执行算术运算，省略 NA
假设我有一个数据框: a df a b c d 1 0 9 10 2 1 10 13 3 NA 11 14 4 3 NA 7 5 4 13 22 现在假设我
r - 省略 `huxreg` 中的因子变量
我在 R 中运行一个具有大量时间和位置固定效应的回归。我尝试将一个漂亮的汇总表输出到 Latex 中。我从 stargazer 包切换到 huxtable，因为 stargazer 在忽略固定效果时表
javascript - 替代 lodash 省略
我想删除一个属性并返回一个新对象而不改变原始对象。我知道我们可以像这样使用 Lodash 轻松做到这一点: const profile = { name: 'Maria', age: 30 } _.
javascript - 省略 javascript 对象的索引
我正在通过更改一些内容来修改 javascript 对象。当我重新创建它时，我会得到每个 key 对的索引号。 "0":{...},"1":{...}, 如何删除/省略这些 0、1、2、3、4 数字的
swift - 省略 Swift 闭包中的返回类型
我正在一个非常方便且名称丰富的网站 here 上完成示例之一。，具体来说: func applyMutliplication(value: Int, multFunction: Int -> Int
Java:省略 package 语句会产生什么后果？
这个问题在这里已经有了答案: Why do java source files require package declarations? (4 个答案) 关闭 6 年前。我是 Java 的新手，
c++ - 按值传递临时值时如何避免 move 省略？
在下面的代码中: Widget makeWidget() { return Widget(); } void foo(Widget widget) { ... } foo(makeWid
mysql - 省略 MYSQL 存储过程参数中的额外引号
这是我使用下面的调用调用的过程: CALL abc('01-04-2011','14-04-2014','28,29,36,37,38','33,34,35,41,42,43') 但问题是下面提到的查
javascript - 省略 yui 数据表中的文本
嘿，我正在寻找一种在 yui 数据表中省略文本的好方法。我的意思是，格式化文本，使其很好地适合其单元格，并且如果文本必须被 chop ，则在其后面有一个椭圆 (...)。我想在不使用 CSS 选择器
mysql - 省略 SQL 中的某些记录
我有一个如下表(记录)。 ID Status AA124 Pass AA125 Pass Z_AA134 Fail Z_AA135

首页

博学

6Ren·AI

商城

r - 使用 dplyr 汇总时省略 NA