r - dplyr group_by - 混合带或不带引号的变量名称-6ren

r - dplyr group_by - 混合带或不带引号的变量名称

转载作者：行者123 更新时间：2023-12-02 02:13:03

25

4

我希望能够使用 dplyr 的 group_by 按多列进行分组，足够简单。但是，复杂的是我想创建一个函数，其中一个或多个列始终位于分组依据中，并且用户可以选择附加列进行分组。到目前为止，我所尝试的涉及使用始终位于组中的列的非字符串规范，以及对用户选择的列使用字符串，但我尝试过的任何方法都不起作用。这种组合似乎在 SELECT 中工作得很好，但在 GROUP_BY 中则不然。理想情况下，我不想切换到所有字符串，因为我希望能够利用 dplyr 的一些功能来选择一系列列。下面是一个例子。

举一个简单的例子，我从 iris 数据集开始，添加了几列，它们的确切含义并不重要。

test_tbl <- iris %>%
  mutate(extra_var1 = ifelse(Sepal.Length >= 5.0, "Yes", "No"),
         extra_var2 = "What")

这是一个对所有变量使用非字符串规范的示例，效果很好:

test_tbl %>%
  select(Species, extra_var1, Sepal.Length, Petal.Width) %>%
  group_by(Species, extra_var1) %>%
  summarize(average.Sepal.Length = mean(Sepal.Length),
            average.Petal.Width = mean(Petal.Width))

但是，我希望能够在函数内让用户指定是否要按 extra_var1 或 extra_var2 进行分组。这是我的尝试，但行不通。再说一遍，我相信 select 部分工作正常，但 group_by 部分却不行。

group_and_summarize <- function(var) {
  test_tbl %>%
    select(Species, var, Sepal.Length, Petal.Width) %>%
    group_by(Species, var) %>%
    summarize(average.Sepal.Length = mean(Sepal.Length),
              average.Petal.Width = mean(Petal.Width))
}

group_and_summarize("extra_var1")

最佳答案

这是一种方法:

library(dplyr)

group_and_summarize <- function(var) {
  test_tbl %>%
    select(Species, {{var}}, Sepal.Length, Petal.Width) %>%
    group_by(Species, {{var}}) %>%
    summarize(average.Sepal.Length = mean(Sepal.Length),
              average.Petal.Width = mean(Petal.Width))
}

group_and_summarize(extra_var1)
#> `summarise()` regrouping output by 'Species' (override with `.groups` argument)
#> # A tibble: 6 x 4
#> # Groups:   Species [3]
#>   Species    extra_var1 average.Sepal.Length average.Petal.Width
#>   <fct>      <chr>                     <dbl>               <dbl>
#> 1 setosa     No                         4.67               0.195
#> 2 setosa     Yes                        5.23               0.28 
#> 3 versicolor No                         4.9                1    
#> 4 versicolor Yes                        5.96               1.33 
#> 5 virginica  No                         4.9                1.7  
#> 6 virginica  Yes                        6.62               2.03

^{由 reprex package 于 2021 年 5 月 11 日创建(v0.3.0)}

如果你想让用户输入字符串那么我们可以使用!!! syms():

group_and_summarize <- function(vars) {
  test_tbl %>%
    select(Species, !!! syms(vars), Sepal.Length, Petal.Width) %>%
    group_by(Species, !!! syms(vars)) %>%
    summarize(average.Sepal.Length = mean(Sepal.Length),
              average.Petal.Width = mean(Petal.Width))
}

group_and_summarize(c("extra_var1", "extra_var2"))

#> `summarise()` regrouping output by 'Species', 'extra_var1' (override with `.groups` argument)
#> # A tibble: 6 x 5
#> # Groups:   Species, extra_var1 [6]
#>   Species    extra_var1 extra_var2 average.Sepal.Length average.Petal.Width
#>   <fct>      <chr>      <chr>                     <dbl>               <dbl>
#> 1 setosa     No         What                       4.67               0.195
#> 2 setosa     Yes        What                       5.23               0.28 
#> 3 versicolor No         What                       4.9                1    
#> 4 versicolor Yes        What                       5.96               1.33 
#> 5 virginica  No         What                       4.9                1.7  
#> 6 virginica  Yes        What                       6.62               2.03

^{由 reprex package 于 2021 年 5 月 11 日创建(v0.3.0)}

关于r - dplyr group_by - 混合带或不带引号的变量名称，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67488844/

25

4

0

文章推荐： r - 第一个字母改为大写

文章推荐： python-3.x - 我应该使用 == 进行字符串比较吗？

php - 引号(引号)在乌尔都语中造成问题
我有一个类似 ( www.bbcurdu.com) 的网站。现在我的问题是，当我添加一个带有引号或引号的新故事时，它不会保存在数据库中。如果我删除这些逗号或引号，那么它将保存在数据库中。并正确获取和显
ruby - 如何在 Ruby 1.8.7 中将 Microsoft Office "Smart"或 "Curly"引号/撇号转换为 ASCII 或 UTF-8 "Straight"引号/撇号？
我正在使用(并坚持使用)以下版本的 Ruby: ruby 1.8.7 (2012-06-29 patchlevel 370) [x86_64-linux] 我尝试了很多谷歌搜索，但找不到解决我的问题的
Excel连接字符串中的“引号
我有以下示例数据，我想连接 string1 和 string2 以产生连接结果 "a""b" 使用连接函数我在官方的microsoft excel文档中没有找到任何答案 https://suppo
MySQL 引号
我是 SQL-mySQL 方面的 super 新手，我想查询这些包含具有特定值的列的条目，但该值中已经有引号，它实际上看起来像这样，引号已经存在:“荷兰鹿特丹 Voor Land-en Volkenk
正则表达式匹配所有 unicode 引号
是否有一个简单的正则表达式来匹配所有 unicode 引号？还是必须像这样手动编码: quotes = ur"[\"'\u2018\u2019\u201c\u201d]" 感谢阅读。布莱恩最佳答案
javascript - 禁用特殊字符(引号)
我有下面的代码，禁止将特殊字符插入到 HTML 表单上提交的文本中。可以看出，我需要禁用的特殊字符位于引号之间，而我需要禁用引号 " 本身，但我不能这样做，因为如果我添加另一个中间的引号然后读起来就
java - 替换不在括号内的逗号，引号
对于给定的输入字符串 abc,[def,ghi,ijk],lm,(no,pq,rs),[tu,vw,xy],zs,"as,as,fr"输出应该是 abc [def,ghi,ijk] lm (no,pq
Javascript 引号 ... 淡入淡出
下午好，快乐 4 我在处理一些 javascript 时遇到了问题....我是一个初学者，正在使用这个特定的在线示例来了解如何淡入和淡出多个引号... 我已经实现了 HTML/Javascript/C
javascript - 网页上多行文本上的省略号 + 引号
我想在一段文本周围加上引号。文本不能超过 3 行:如果超过，我想要一个省略号(并且我仍然想要引号)。我附上我现在拥有的东西。我的解决方案使用 JS:虽然纯 CSS 解决方案是理想的，但可能的 CSS
随变量帮助一起发送的 php 引号
我将它发送给一个函数，我想在下面的变量值周围加上双引号，例如 $var = "New York"(注意引号) $fq.=" + area:$state"; 所以当我回显 $state 时我想用双
java - 如何在打印的字符串周围添加 ""引号？
这个问题在这里已经有了答案: How can I make Java print quotes, like "Hello"? (11 个答案) 关闭 9 年前。我想在 java 中打印反引号。但是
构造函数中的 F# 引号、数组和自标识符
我认为这是 F# 的一个众所周知的限制，但我找不到任何好的解决方法…… 所以，这里是代码(我试图让它尽可能简单，所以它可能看起来没有任何意义): [] type Human (makeAName: u
php - 如何调用带参数的php url并在SQLite3上的SQL查询中使用它们(引号…)？
我在Windows 7上，在Apache 2.4上使用PHP 5.6.14版：我必须使用PHP在SQLite3数据库上构建查询选择。 NOTA：我是PHP的再见..... 我的代码如下 '; echo
javascript - 令人困惑的 Javascript 引号
在 jQuery 文档中，大多数字符串都是使用单引号“声明”的。包括documentation用于 jQuery UI。那为什么不呢 $(".datepicker").datepicker({ da
Java，在正则表达式中转义(使用)引号
我正在尝试在 Java 中使用以下正则表达式，它应该与任何 lang="2-char-lang-name" 匹配: String lang = "lang=\"" + L.detectLang(inp
restructuredtext - 如何在指令后立即添加 block 引号？
我试图在 more 之后插入一个 block 引用指令，不接受任何参数: First paragraph. .. more:: Blockquote here! -- Author S
java - 使用正则表达式删除 JSON 引号
我从外部进程获得了一些我无法更改的 JSON，并且我需要修改此 JSON 字符串才能使下游 Java 进程正常工作。 JSON 字符串如下所示: {"widgets":"blah","is_dog":
java - 正则表达式处理逗号、双引号、引号
我试图在从数据库读取数据后生成 CSV 文件。现在单个数据可以包含逗号、单引号和双引号。请告诉我如何在正则表达式的帮助下处理这种情况。最佳答案您可以为 CSV 文件使用不同的分隔符吗？也许是一个
java - arg 参数中的代码模型/引号 (")
我尝试在 codemodel(Sun) 中创建下一个表达式: driver.findElement(By.xpath("//div[text()=\""+whatToclick+"\"]/pare
common-lisp - 引号、列表等用时的区别
我需要知道报价和列表之间的区别。例如: cl-prompt> (equal (first (list * 1 2)) *) T cl-prompt> (equal (first '(* 1 2)) *

首页

博学

6Ren·AI

商城

r - dplyr group_by - 混合带或不带引号的变量名称