r - 用不同的功能总结不同列的简洁方法-6ren

r - 用不同的功能总结不同列的简洁方法

转载作者：行者123 更新时间：2023-12-05 00:10:56

28

4

我的问题基于 similar one通过施加额外的约束，每个变量的名称应该只出现一次。

考虑一个数据框

library( tidyverse )
df <- tibble( potentially_long_name_i_dont_want_to_type_twice = 1:10,
              another_annoyingly_long_name = 21:30 )

我要申请 mean到第一列和 sum到第二列，而不必两次输入每个列名。

正如我上面链接的问题所示， summarize允许您这样做，但要求每列的名称出现两次。另一方面， summarize_at允许您简洁地将多个函数应用于多个列，但它是通过调用所有指定列上的所有指定函数来实现的，而不是以一对一的方式进行。有没有办法结合 summarize 的这些独特的功能？和 summarize_at ?

我可以用 rlang 破解它，但我不确定它是否比只输入每个变量两次更干净:

v <- c("potentially_long_name_i_dont_want_to_type_twice",
       "another_annoyingly_long_name")
f <- list(mean,sum)

## Desired output
smrz <- set_names(v) %>% map(sym) %>% map2( f, ~rlang::call2(.y,.x) )
df %>% summarize( !!!smrz )
# # A tibble: 1 x 2
#   potentially_long_name_i_dont_want_to_type_twice another_annoyingly_long_name
#                                             <dbl>                        <int>
# 1                                             5.5                          255

编辑以解决一些哲学观点

我不认为想要避免 x=f(x)成语是不合理的。我可能对输入长名称有点过分热情，但真正的问题实际上是(相对)长名称彼此非常相似。示例包括核苷酸序列(例如， AGCCAGCGGAAACAGTAAGG)和 TCGA barcodes .在这种情况下，不仅自动完成功能有限，而且还可以编写诸如 AGCCAGCGGAAACAGTAAGG = sum( AGCCAGCGGAAACAGTAAGG ) 之类的东西。引入了不必要的耦合并增加了在开发和维护代码时分配的两侧可能意外不同步的风险。

我完全同意@MrFlick 关于 dplyr 的看法提高代码的可读性，但我不认为可读性应该以牺牲正确性为代价。类似 summarize_at 的函数和 mutate_at非常出色，因为它们在将操作放在操作数旁边(清晰)和保证结果写入正确的列(正确性)之间取得了完美的平衡。

出于同样的原因，我觉得完全删除变量提及的建议解决方案在另一个方向上摇摆得太远了。虽然天生聪明——我当然很欣赏它们节省的额外输入——我认为，通过消除函数和变量名称之间的关联，这样的解决方案现在依赖于变量的正确排序，这会产生意外错误的风险。

简而言之，我认为自变异/自总结操作应该只提及每个变量名称一次。

最佳答案

我提出了 2 个技巧来解决这个问题，请参阅底部的代码和两种解决方案的一些详细信息:

一个函数.at它返回一组变量的结果(这里只有一个一组变量)，然后我们可以将其解开，因此我们可以从两个世界中受益，summarize和 summarize_at :

df %>% summarize(
  !!!.at(vars(potentially_long_name_i_dont_want_to_type_twice), mean),
  !!!.at(vars(another_annoyingly_long_name), sum))

# # A tibble: 1 x 2
#     potentially_long_name_i_dont_want_to_type_twice another_annoyingly_long_name
#                                               <dbl>                        <dbl>
#   1                                             5.5                          255

summarize的副词，用美元符号简写。

df %>%
  ..flx$summarize(potentially_long_name_i_dont_want_to_type_twice = ~mean(.),
                  another_annoyingly_long_name = ~sum(.))

# # A tibble: 1 x 2
#     potentially_long_name_i_dont_want_to_type_twice another_annoyingly_long_name
#                                               <dbl>                        <int>
#   1                                             5.5                          255

.at 的代码

它必须在管道中使用，因为它使用 .在父环境中，凌乱但有效。

.at <- function(.vars, .funs, ...) {
  in_a_piped_fun <- exists(".",parent.frame()) &&
    length(ls(envir=parent.frame(), all.names = TRUE)) == 1
  if (!in_a_piped_fun)
    stop(".at() must be called as an argument to a piped function")
  .tbl <- try(eval.parent(quote(.)))
  dplyr:::manip_at(
    .tbl, .vars, .funs, rlang::enquo(.funs), rlang:::caller_env(),
    .include_group_vars = TRUE, ...)
}

我将它设计为结合 summarize和 summarize_at :

df %>% summarize(
  !!!.at(vars(potentially_long_name_i_dont_want_to_type_twice), list(foo=min, bar = max)),
  !!!.at(vars(another_annoyingly_long_name), median))

# # A tibble: 1 x 3
#       foo   bar another_annoyingly_long_name
#     <dbl> <dbl>                        <dbl>
#   1     1    10                         25.5

..flx 的代码
..flx输出一个替换其公式参数的函数，例如 a = ~mean(.)通过电话 a = purrr::as_mapper(~mean(.))(a)在运行之前。用 summarize 方便和 mutate因为一列不能是公式，所以不会有任何冲突。

我喜欢使用美元符号作为速记，并使用以 .. 开头的名称。所以我可以命名这些“标签”(并给它们一个类 "tag" )并将它们视为不同的对象(仍在试验这个)。 ..flx(summarize)(...)不过也能用。

..flx <- function(fun){
  function(...){
    mc <- match.call()
    mc[[1]] <- tail(mc[[1]],1)[[1]]
    mc[] <- imap(mc,~if(is.call(.) && identical(.[[1]],quote(`~`))) {
      rlang::expr(purrr::as_mapper(!!.)(!!sym(.y))) 
    } else .)
    eval.parent(mc)
  }
}

class(..flx) <- "tag"

`$.tag` <- function(e1, e2){
  # change original call so x$y, which is `$.tag`(tag=x, data=y), becomes x(y)
  mc <- match.call()
  mc[[1]] <- mc[[2]]
  mc[[2]] <- NULL
  names(mc) <- NULL
  # evaluate it in parent env
  eval.parent(mc)
}

关于r - 用不同的功能总结不同列的简洁方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55640904/

28

4

0

文章推荐： json - 使用 sed 提取 json 值

文章推荐： r - 拆分字符串知道一些子字符串

文章推荐： scala - 为什么方法需要 'abstract override' 修饰符

文章推荐： admob - AdMob 收入是如何计算的？

【网络流】总结
1、定义设 \(u\) 和 \(v\) 为一张图上的任意两个节点。令 \(c(u, v)\) 为它们之间的边的容量， \(f(u, v)\) 为它们之间的流量，则需要满足以
linux下判断文件和目录是否存在的方法(总结)
1、前言工作中涉及到文件系统，有时候需要判断文件和目录是否存在。我结合apue第四章文件和目录，总结一下如何正确判断文件和目录是否存在，方便以后查询。 2、stat系列函数 stat函数用来
c语言数据结构之并查集总结
并查集(Union-Find Set)：一种用于管理分组的数据结构。它具备两个操作：(1)查询元素a和元素b是否为同一组 (2) 将元素a和b合并为同一组。注意：并查集不能将在同一组的元素拆
Mybatis常见注解有哪些(总结)
当下，注解非常流行，以前很长篇的代码，现在基本上一个注解就能搞定。那，在Mybatis中又有哪些注解呢？ Mybatis中的注解基本上都在org.apache.ibatis.annotat
指针操作数组的两种方法(总结)
指针操作数组，方法一是p+index，方法二是p[index]，第二种方法跟数组访问方法是一样的。数组引用返回的是数组的第一个元素的指针地址。可以将指针指向数组的任意元素，然后从那里开始访问
php安全配置记录和常见错误梳理(总结)
通常部署完php环境后会进行一些安全设置，除了熟悉各种php漏洞外，还可以通过配置php.ini来加固PHP的运行环境，PHP官方也曾经多次修改php.ini的默认设置。下面对php.ini中一
PHP检测数据类型的几种方法(总结)
在JavaScript中，使用typeof可以检测基本数据类型，使用instanceof可以检测引用数据类型。在PHP中，也有检测数据类型的方法，具体如下： 1、输出变量的数据类型（gettype
iOS把图片缓存到本地的几种方法(总结)
把图片缓存到本地，在很多场景都会用到，如果只是存储文件信息，那建一个plist文件，或者数据库就能很方便的解决问题，但是如果存储图片到沙盒就没那么方便了。这里简单介绍两种保存图片到沙盒的方法。
Docker容器使用jenkins部署web项目(总结)
（1）需要安装docker容器，在docker容器内安装jenkins，gogs，tomcat。新建maven项目，添加findbugs plugin。使用docker
基于并发服务器几种实现方法(总结)
今天主题是实现并发服务器，实现方法有多种版本，先从简单的单进程代码实现到多进程，多线程的实现，最终引入一些高级模块来实现并发TCP服务器。说到TCP，想起吐槽大会有个段子提到三次握手，也只有程序
超实用的Java快捷键(总结)
如下所示： Ctrl+1或F2快速修复 Ctrl+D快捷删除行 Shift+Enter 快速切换到下一行，在本行的任何位置都可 Ctrl+F11快速运行代码 Alt+上下键快速移动行（可
浅谈JSP与Servlet传值及对比(总结)
JSP是Servlet技术的扩展，本质上是Servlet的简易方式，更强调应用的外表表达。 JSP编译后是”类servlet”。 Servlet和JSP最主要的不同点在于，Servlet的应用逻辑
Java中实现多线程关键词整理(总结)
Java中的Runable,Callable,Future,FutureTask,ExecutorService,Excetor,Excutors,ThreadPoolExcetor在这里对这些关键
读取Java文件到byte数组的三种方法(总结)
读取Java文件到byte数组的三种方法(总结) ? 1
java实现二叉树的创建及5种遍历方法(总结)
用java实现的数组创建二叉树以及递归先序遍历，递归中序遍历，递归后序遍历，非递归前序遍历，非递归中序遍历，非递归后序遍历，深度优先遍历，广度优先遍历8种遍历方式：
Mysql字符串处理函数详细介绍、总结
1、简明总结 ASCII(char)　　　　　　　　返回字符的ASCII码值 BIT_LENGTH(str)　　　　　　返回字符串的比特长度 CONCAT(s1,s2…,sn)　　　　
十大java应用服务器(webserver)总结
java应用服务器(web server)，是指运行java程序的web应用服务器软件，不包括nginx、Apache等通用web服务器软件。一、Tomcat Tomcat是Apache 软件基
精通Java事务编程(9)-总结
事务作为抽象层，允许应用忽略DB 内部一些复杂并发问题和某些硬件、软件故障，简化应用层的处理逻辑：事务中止（transaction abort），而应用仅需重试。对复杂访问模式，事务可大大减少需要考虑
10、DTD 总结
我们在本教程学习了如何描述 XML 文档的结构我们学习到了如何使用 DTD 来定义一个 XML 文档的合法元素，以及如何在我们的 XML 内部或者作为一个外部引用来声明 DTD 我们学习了如何为
08、XPath 总结
在这个XPath 基础教程中我们讲解了如何在 XML 文档中查找信息我们可以使用 XPath 的元素和属性在 XML 文档中进行导航我们也学习了如何使用 XPath 中内建的某些标准函数如

首页

博学

6Ren·AI

商城

r - 用不同的功能总结不同列的简洁方法