r - dplyr 用小计总结-6ren

r - dplyr 用小计总结

转载作者：行者123 更新时间：2023-12-03 11:56:41

25

4

excel 数据透视表的一大优点是它们自动提供小计。首先，我想知道 dplyr 中是否已经创建了任何可以实现这一点的东西。如果没有，实现它的最简单方法是什么？

在下面的示例中，我按气缸和化油器的数量显示了平均排量。对于每组气缸 (4,6,8)，我想查看该组的平均位移(或总位移，或任何其他汇总统计数据)。

library(dplyr)
mtcars %>% group_by(cyl,carb) %>% summarize(mean(disp))

  cyl carb mean(disp)
1   4    1      91.38
2   4    2     116.60
3   6    1     241.50
4   6    4     163.80
5   6    6     145.00
6   8    2     345.50
7   8    3     275.80
8   8    4     405.50
9   8    8     301.00

最佳答案

数据表它非常笨重，但这是一种方式:

library(data.table)
DT <- data.table(mtcars)
rbind(
  DT[,.(mean(disp)),          by=.(cyl,carb)],
  DT[,.(mean(disp), carb=NA), by=.(cyl) ],
  DT[,.(mean(disp), cyl=NA),  by=.(carb)]
)[order(cyl,carb)]

这给

    cyl carb       V1
 1:   4    1  91.3800
 2:   4    2 116.6000
 3:   4   NA 105.1364
 4:   6    1 241.5000
 5:   6    4 163.8000
 6:   6    6 145.0000
 7:   6   NA 183.3143
 8:   8    2 345.5000
 9:   8    3 275.8000
10:   8    4 405.5000
11:   8    8 301.0000
12:   8   NA 353.1000
13:  NA    1 134.2714
14:  NA    2 208.1600
15:  NA    3 275.8000
16:  NA    4 308.8200
17:  NA    6 145.0000
18:  NA    8 301.0000

我宁愿看到类似 R table 的结果，但不知道任何功能。

dplyr @akrun 找到了这个类似的代码

bind_rows(
  mtcars %>% 
    group_by(cyl, carb) %>% 
    summarise(Mean= mean(disp)), 
  mtcars %>% 
    group_by(cyl) %>% 
    summarise(carb=NA, Mean=mean(disp)), 
  mtcars %>% 
    group_by(carb) %>% 
    summarise(cyl=NA, Mean=mean(disp))
) %>% arrange(cyl, carb)

我们可以将重复操作包装在一个函数中

library(lazyeval)
f1 <- function(df, grp, Var, func){
  FUN <- match.fun(func)
   df %>% 
     group_by_(.dots=grp) %>%
     summarise_(interp(~FUN(v), v=as.name(Var)))
  }

 m1 <- f1(mtcars, c('carb', 'cyl'), 'disp', 'mean')
 m2 <- f1(mtcars, 'carb', 'disp', 'mean')
 m3 <- f1(mtcars, 'cyl', 'disp', 'mean')

 bind_rows(list(m1, m2, m3)) %>%
              arrange(cyl, carb) %>%
              rename(Mean=`FUN(disp)`)
   carb cyl     Mean
1     1   4  91.3800
2     2   4 116.6000
3    NA   4 105.1364
4     1   6 241.5000
5     4   6 163.8000
6     6   6 145.0000
7    NA   6 183.3143
8     2   8 345.5000
9     3   8 275.8000
10    4   8 405.5000
11    8   8 301.0000
12   NA   8 353.1000
13    1  NA 134.2714
14    2  NA 208.1600
15    3  NA 275.8000
16    4  NA 308.8200
17    6  NA 145.0000
18    8  NA 301.0000

使用 data.table 的 rbindlist 可以使任一选项变得不那么难看与 fill :

rbindlist(list(
  mtcars %>% group_by(cyl) %>% summarise(mean(disp)),
  mtcars %>% group_by(carb) %>% summarise(mean(disp)),
  mtcars %>% group_by(cyl,carb) %>% summarise(mean(disp))
),fill=TRUE) %>% arrange(cyl,carb)

rbindlist(list(
  DT[,mean(disp),by=.(cyl,carb)],
  DT[,mean(disp),by=.(cyl)],
  DT[,mean(disp),by=.(carb)]
),fill=TRUE)[order(cyl,carb)]

关于r - dplyr 用小计总结，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31164350/

25

4

0

文章推荐： asp.net-mvc - 你怎么知道你的项目的WEB API版本？

文章推荐： .net - .Net套接字-10054错误

文章推荐： perl - 驼鹿对象中Socket属性的奇怪行为

文章推荐： standards - 是否有 ISO-Prolog 引用实现？

【网络流】总结
1、定义设 \(u\) 和 \(v\) 为一张图上的任意两个节点。令 \(c(u, v)\) 为它们之间的边的容量， \(f(u, v)\) 为它们之间的流量，则需要满足以
linux下判断文件和目录是否存在的方法(总结)
1、前言工作中涉及到文件系统，有时候需要判断文件和目录是否存在。我结合apue第四章文件和目录，总结一下如何正确判断文件和目录是否存在，方便以后查询。 2、stat系列函数 stat函数用来
c语言数据结构之并查集总结
并查集(Union-Find Set)：一种用于管理分组的数据结构。它具备两个操作：(1)查询元素a和元素b是否为同一组 (2) 将元素a和b合并为同一组。注意：并查集不能将在同一组的元素拆
Mybatis常见注解有哪些(总结)
当下，注解非常流行，以前很长篇的代码，现在基本上一个注解就能搞定。那，在Mybatis中又有哪些注解呢？ Mybatis中的注解基本上都在org.apache.ibatis.annotat
指针操作数组的两种方法(总结)
指针操作数组，方法一是p+index，方法二是p[index]，第二种方法跟数组访问方法是一样的。数组引用返回的是数组的第一个元素的指针地址。可以将指针指向数组的任意元素，然后从那里开始访问
php安全配置记录和常见错误梳理(总结)
通常部署完php环境后会进行一些安全设置，除了熟悉各种php漏洞外，还可以通过配置php.ini来加固PHP的运行环境，PHP官方也曾经多次修改php.ini的默认设置。下面对php.ini中一
PHP检测数据类型的几种方法(总结)
在JavaScript中，使用typeof可以检测基本数据类型，使用instanceof可以检测引用数据类型。在PHP中，也有检测数据类型的方法，具体如下： 1、输出变量的数据类型（gettype
iOS把图片缓存到本地的几种方法(总结)
把图片缓存到本地，在很多场景都会用到，如果只是存储文件信息，那建一个plist文件，或者数据库就能很方便的解决问题，但是如果存储图片到沙盒就没那么方便了。这里简单介绍两种保存图片到沙盒的方法。
Docker容器使用jenkins部署web项目(总结)
（1）需要安装docker容器，在docker容器内安装jenkins，gogs，tomcat。新建maven项目，添加findbugs plugin。使用docker
基于并发服务器几种实现方法(总结)
今天主题是实现并发服务器，实现方法有多种版本，先从简单的单进程代码实现到多进程，多线程的实现，最终引入一些高级模块来实现并发TCP服务器。说到TCP，想起吐槽大会有个段子提到三次握手，也只有程序
超实用的Java快捷键(总结)
如下所示： Ctrl+1或F2快速修复 Ctrl+D快捷删除行 Shift+Enter 快速切换到下一行，在本行的任何位置都可 Ctrl+F11快速运行代码 Alt+上下键快速移动行（可
浅谈JSP与Servlet传值及对比(总结)
JSP是Servlet技术的扩展，本质上是Servlet的简易方式，更强调应用的外表表达。 JSP编译后是”类servlet”。 Servlet和JSP最主要的不同点在于，Servlet的应用逻辑
Java中实现多线程关键词整理(总结)
Java中的Runable,Callable,Future,FutureTask,ExecutorService,Excetor,Excutors,ThreadPoolExcetor在这里对这些关键
读取Java文件到byte数组的三种方法(总结)
读取Java文件到byte数组的三种方法(总结) ? 1
java实现二叉树的创建及5种遍历方法(总结)
用java实现的数组创建二叉树以及递归先序遍历，递归中序遍历，递归后序遍历，非递归前序遍历，非递归中序遍历，非递归后序遍历，深度优先遍历，广度优先遍历8种遍历方式：
Mysql字符串处理函数详细介绍、总结
1、简明总结 ASCII(char)　　　　　　　　返回字符的ASCII码值 BIT_LENGTH(str)　　　　　　返回字符串的比特长度 CONCAT(s1,s2…,sn)　　　　
十大java应用服务器(webserver)总结
java应用服务器(web server)，是指运行java程序的web应用服务器软件，不包括nginx、Apache等通用web服务器软件。一、Tomcat Tomcat是Apache 软件基
精通Java事务编程(9)-总结
事务作为抽象层，允许应用忽略DB 内部一些复杂并发问题和某些硬件、软件故障，简化应用层的处理逻辑：事务中止（transaction abort），而应用仅需重试。对复杂访问模式，事务可大大减少需要考虑
10、DTD 总结
我们在本教程学习了如何描述 XML 文档的结构我们学习到了如何使用 DTD 来定义一个 XML 文档的合法元素，以及如何在我们的 XML 内部或者作为一个外部引用来声明 DTD 我们学习了如何为
08、XPath 总结
在这个XPath 基础教程中我们讲解了如何在 XML 文档中查找信息我们可以使用 XPath 的元素和属性在 XML 文档中进行导航我们也学习了如何使用 XPath 中内建的某些标准函数如

首页

博学

6Ren·AI

商城

r - dplyr 用小计总结