r - 如何使用 dplyr 来总结两个函数-6ren

r - 如何使用 dplyr 来总结两个函数

转载作者：行者123 更新时间：2023-12-02 18:21:07

25

4

我尝试将此数据集作为示例进行总结，并尝试使用多个函数 n() 和 mean()。如何将两者结合在同一个工作流程中？

这是一个反射(reflect)我的较大数据的玩具数据集:

library(tidyverse)
df <- structure(list(group_var = c(70, 72, 73, 70, 70, 71, 70, 71, 
                                   71, 70), var1_scr = c(50.5, 25.75, 50.5, 50.5, 50.5, 50.5, 75.25, 
                                                         75.25, 50.5, 75.25), var2_scr = c(50.5, 50.5, NA, 75.25, 50.5, 
                                                                                           50.5, 75.25, 75.25, 100, 75.25), var3_scr = c(NA, NA, 75.25, 
                                                                                                                                         NA, NA, NA, NA, NA, NA, NA)), row.names = c(NA, -10L), class = c("tbl_df", 
                                                                                                                                                                                                          "tbl", "data.frame"))
df
#> # A tibble: 10 x 4
#>    group_var var1_scr var2_scr var3_scr
#>        <dbl>    <dbl>    <dbl>    <dbl>
#>  1        70     50.5     50.5     NA  
#>  2        72     25.8     50.5     NA  
#>  3        73     50.5     NA       75.2
#>  4        70     50.5     75.2     NA  
#>  5        70     50.5     50.5     NA  
#>  6        71     50.5     50.5     NA  
#>  7        70     75.2     75.2     NA  
#>  8        71     75.2     75.2     NA  
#>  9        71     50.5    100       NA  
#> 10        70     75.2     75.2     NA

# summarize the scores
df %>%  group_by(group_var) %>% 
  summarise_at(vars(ends_with("_scr")), funs(mean(., na.rm = TRUE)))

#> # A tibble: 4 x 4
#>   group_var var1_scr var2_scr var3_scr
#>       <dbl>    <dbl>    <dbl>    <dbl>
#> 1        70     60.4     65.4    NaN  
#> 2        71     58.8     75.2    NaN  
#> 3        72     25.8     50.5    NaN  
#> 4        73     50.5    NaN       75.2

# count all the oberservations
df %>%  group_by(group_var) %>% 
  summarise(obs = n())
#> # A tibble: 4 x 2
#>   group_var   obs
#>       <dbl> <int>
#> 1        70     5
#> 2        71     3
#> 3        72     1
#> 4        73     1

# my goal is to produce this dataset but using the mutate_at function
df %>%  group_by(group_var) %>% 
  summarise(var1_scr = mean(var1_scr), 
            var2_scr = mean(var2_scr),
            var3_scr = mean(var3_scr), 
            obs = n())
#> # A tibble: 4 x 5
#>   group_var var1_scr var2_scr var3_scr   obs
#>       <dbl>    <dbl>    <dbl>    <dbl> <int>
#> 1        70     60.4     65.4     NA       5
#> 2        71     58.8     75.2     NA       3
#> 3        72     25.8     50.5     NA       1
#> 4        73     50.5     NA       75.2     1

^{由reprex package于2019年8月15日创建(v0.3.0)}

最佳答案

一个选项是在按“group_var”分组后在分组变量中添加“n”，然后执行summarise_at

library(dplyr)
df %>% 
     group_by(group_var)  %>%
     group_by(obs = n(), add = TRUE) %>%
     summarise_at(vars(ends_with("_scr")), list(~mean(., na.rm = TRUE)))
# A tibble: 4 x 5
# Groups:   group_var [4]
#  group_var   obs var1_scr var2_scr var3_scr
#      <dbl> <int>    <dbl>    <dbl>    <dbl>
#1        70     5     60.4     65.4    NaN  
#2        71     3     58.8     75.2    NaN  
#3        72     1     25.8     50.5    NaN  
#4        73     1     50.5    NaN       75.2

<小时/>

另一种选择是使用 mutate 创建频率列，并通过将其也包含在 summarise_at 中来获取平均值(例如 >平均值(rep(3, 5)) -> 3)

df %>% 
     group_by(group_var)  %>%
     mutate(obs = n()) %>%
     summarise_at(vars(ends_with("_scr"), obs), list(~mean(., na.rm = TRUE)))
# A tibble: 4 x 5
#  group_var var1_scr var2_scr var3_scr   obs
#      <dbl>    <dbl>    <dbl>    <dbl> <dbl>
#1        70     60.4     65.4    NaN       5
#2        71     58.8     75.2    NaN       3
#3        72     25.8     50.5    NaN       1
#4        73     50.5    NaN       75.2     1

注意:这两者都为“obs”提供一列

<小时/>

这里，OP 的预期输出是一个汇总输出，对于该输出，summarise/summarise_at/summarise_all/summarise_if 非常有效。但是，如果我们需要使用mutate_at(仅用于演示)

df %>% 
     group_by(group_var)  %>%
     mutate(obs = n()) %>%
     mutate_at(vars(ends_with("_scr"), obs), list(~mean(., na.rm = TRUE))) %>%
     distinct_at(vars(group_var, ends_with("_scr"), obs))
# A tibble: 4 x 5
# Groups:   group_var [4]
#  group_var var1_scr var2_scr var3_scr   obs
#      <dbl>    <dbl>    <dbl>    <dbl> <dbl>
#1        70     60.4     65.4    NaN       5
#2        72     25.8     50.5    NaN       1
#3        73     50.5    NaN       75.2     1
#4        71     58.8     75.2    NaN       3

关于r - 如何使用 dplyr 来总结两个函数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57514455/

25

4

0

文章推荐： docker - Docker容器记录

文章推荐： Docker 服务仅对本地主机可用

文章推荐： haskell - "curl libraries?"在哪里

【网络流】总结
1、定义设 \(u\) 和 \(v\) 为一张图上的任意两个节点。令 \(c(u, v)\) 为它们之间的边的容量， \(f(u, v)\) 为它们之间的流量，则需要满足以
linux下判断文件和目录是否存在的方法(总结)
1、前言工作中涉及到文件系统，有时候需要判断文件和目录是否存在。我结合apue第四章文件和目录，总结一下如何正确判断文件和目录是否存在，方便以后查询。 2、stat系列函数 stat函数用来
c语言数据结构之并查集总结
并查集(Union-Find Set)：一种用于管理分组的数据结构。它具备两个操作：(1)查询元素a和元素b是否为同一组 (2) 将元素a和b合并为同一组。注意：并查集不能将在同一组的元素拆
Mybatis常见注解有哪些(总结)
当下，注解非常流行，以前很长篇的代码，现在基本上一个注解就能搞定。那，在Mybatis中又有哪些注解呢？ Mybatis中的注解基本上都在org.apache.ibatis.annotat
指针操作数组的两种方法(总结)
指针操作数组，方法一是p+index，方法二是p[index]，第二种方法跟数组访问方法是一样的。数组引用返回的是数组的第一个元素的指针地址。可以将指针指向数组的任意元素，然后从那里开始访问
php安全配置记录和常见错误梳理(总结)
通常部署完php环境后会进行一些安全设置，除了熟悉各种php漏洞外，还可以通过配置php.ini来加固PHP的运行环境，PHP官方也曾经多次修改php.ini的默认设置。下面对php.ini中一
PHP检测数据类型的几种方法(总结)
在JavaScript中，使用typeof可以检测基本数据类型，使用instanceof可以检测引用数据类型。在PHP中，也有检测数据类型的方法，具体如下： 1、输出变量的数据类型（gettype
iOS把图片缓存到本地的几种方法(总结)
把图片缓存到本地，在很多场景都会用到，如果只是存储文件信息，那建一个plist文件，或者数据库就能很方便的解决问题，但是如果存储图片到沙盒就没那么方便了。这里简单介绍两种保存图片到沙盒的方法。
Docker容器使用jenkins部署web项目(总结)
（1）需要安装docker容器，在docker容器内安装jenkins，gogs，tomcat。新建maven项目，添加findbugs plugin。使用docker
基于并发服务器几种实现方法(总结)
今天主题是实现并发服务器，实现方法有多种版本，先从简单的单进程代码实现到多进程，多线程的实现，最终引入一些高级模块来实现并发TCP服务器。说到TCP，想起吐槽大会有个段子提到三次握手，也只有程序
超实用的Java快捷键(总结)
如下所示： Ctrl+1或F2快速修复 Ctrl+D快捷删除行 Shift+Enter 快速切换到下一行，在本行的任何位置都可 Ctrl+F11快速运行代码 Alt+上下键快速移动行（可
浅谈JSP与Servlet传值及对比(总结)
JSP是Servlet技术的扩展，本质上是Servlet的简易方式，更强调应用的外表表达。 JSP编译后是”类servlet”。 Servlet和JSP最主要的不同点在于，Servlet的应用逻辑
Java中实现多线程关键词整理(总结)
Java中的Runable,Callable,Future,FutureTask,ExecutorService,Excetor,Excutors,ThreadPoolExcetor在这里对这些关键
读取Java文件到byte数组的三种方法(总结)
读取Java文件到byte数组的三种方法(总结) ? 1
java实现二叉树的创建及5种遍历方法(总结)
用java实现的数组创建二叉树以及递归先序遍历，递归中序遍历，递归后序遍历，非递归前序遍历，非递归中序遍历，非递归后序遍历，深度优先遍历，广度优先遍历8种遍历方式：
Mysql字符串处理函数详细介绍、总结
1、简明总结 ASCII(char)　　　　　　　　返回字符的ASCII码值 BIT_LENGTH(str)　　　　　　返回字符串的比特长度 CONCAT(s1,s2…,sn)　　　　
十大java应用服务器(webserver)总结
java应用服务器(web server)，是指运行java程序的web应用服务器软件，不包括nginx、Apache等通用web服务器软件。一、Tomcat Tomcat是Apache 软件基
精通Java事务编程(9)-总结
事务作为抽象层，允许应用忽略DB 内部一些复杂并发问题和某些硬件、软件故障，简化应用层的处理逻辑：事务中止（transaction abort），而应用仅需重试。对复杂访问模式，事务可大大减少需要考虑
10、DTD 总结
我们在本教程学习了如何描述 XML 文档的结构我们学习到了如何使用 DTD 来定义一个 XML 文档的合法元素，以及如何在我们的 XML 内部或者作为一个外部引用来声明 DTD 我们学习了如何为
08、XPath 总结
在这个XPath 基础教程中我们讲解了如何在 XML 文档中查找信息我们可以使用 XPath 的元素和属性在 XML 文档中进行导航我们也学习了如何使用 XPath 中内建的某些标准函数如

首页

博学

6Ren·AI

商城

r - 如何使用 dplyr 来总结两个函数