r - 应用group_by和summarise(sum)，但保留具有不相关冲突数据的列？-6ren

r - 应用group_by和summarise(sum)，但保留具有不相关冲突数据的列？

转载作者：行者123 更新时间：2023-12-04 12:04:13

24

4

我的问题与Applying group_by and summarise on data while keeping all the columns' info非常相似
但我想保留被排除的列，因为它们在分组后会发生冲突。

Label <- c("203c","203c","204a","204a","204a","204a","204a","204a","204a","204a")
Type <- c("wholefish","flesh","flesh","fleshdelip","formula","formuladelip",
          "formula","formuladelip","wholefish", "wholefishdelip")
Proportion <- c(1,1,0.67714,0.67714,0.32285,0.32285,0.32285, 
                0.32285, 0.67714,0.67714)
N <- (1:10)
C <- (1:10)
Code <- c("c","a","a","b","a","b","c","d","c","d")

df <- data.frame(Label,Type, Proportion, N, C, Code)
df

   Label           Type Proportion  N  C Code
1   203c      wholefish     1.0000  1  1    c
2   203c          flesh     1.0000  2  2    a
3   204a          flesh     0.6771  3  3    a
4   204a     fleshdelip     0.6771  4  4    b
5   204a        formula     0.3228  5  5    a
6   204a   formuladelip     0.3228  6  6    b
7   204a        formula     0.3228  7  7    c
8   204a   formuladelip     0.3228  8  8    d
9   204a      wholefish     0.6771  9  9    c
10  204a wholefishdelip     0.6771 10 10    d

total <- df %>% 
  #where the Label and Code are the same the Proportion, N and C 
  #should be added together respectively
  group_by(Label, Code) %>% 
  #total proportion should add up to 1 
  #my way of checking that the correct task has been completed
  summarise_if(is.numeric, sum)

# A tibble: 6 x 5
# Groups:   Label [?]
   Label   Code Proportion     N     C
  <fctr> <fctr>      <dbl> <int> <int>
1   203c      a    1.00000     2     2
2   203c      c    1.00000     1     1
3   204a      a    0.99999     8     8
4   204a      b    0.99999    10    10
5   204a      c    0.99999    16    16
6   204a      d    0.99999    18    18

直到这里，我得到了我想要的。现在，我想包括“类型”列，但由于值冲突而被排除在外。这是我想要获得的结果

# A tibble: 6 x 5
# Groups:   Label [?]
   Label   Code Proportion     N     C    Type
  <fctr> <fctr>      <dbl> <int> <int>  <fctr>
1   203c      a    1.00000     2     2    wholefish
2   203c      c    1.00000     1     1    flesh
3   204a      a    0.99999     8     8    flesh_formula
4   204a      b    0.99999    10    10    fleshdelip_formuladelip
5   204a      c    0.99999    16    16    wholefish_formula
6   204a      d    0.99999    18    18    wholefishdelip_formuladelip

我已经尝试过 ungroup()以及 mutate和 unite的一些变体，但无济于事，任何建议将不胜感激

最佳答案

这是data.table解决方案，我假设您需要比例的mean()，因为这些分组的比例可能不是可加的。

setDT(df)

df[, .(Type =paste(Type,collapse="_"), 
  Proportion=mean(Proportion),N= sum(N),C=sum(C)), by=.(Label,Code)]
  [order(Label)]

   Label Code                        Type Proportion  N  C
1:  203c    c                   wholefish   1.000000  1  1
2:  203c    a                       flesh   1.000000  2  2
3:  204a    a               flesh_formula   0.499995  8  8
4:  204a    b     fleshdelip_formuladelip   0.499995 10 10
5:  204a    c           formula_wholefish   0.499995 16 16
6:  204a    d formuladelip_wholefishdelip   0.499995 18 18

我不确定这是否是最干净的 dplyr解决方案，但它可以正常工作:

df %>% group_by(Label, Code) %>% 
  mutate(Type = paste(Type,collapse="_")) %>% 
  group_by(Label,Type,Code) %>% 
  summarise(N=sum(N),C=sum(C),Proportion=mean(Proportion))

请注意，这里的关键是在创建组合的 Type列后重新分组。

   Label                        Type   Code     N     C Proportion
  <fctr>                       <chr> <fctr> <int> <int>      <dbl>
1   203c                       flesh      a     2     2   1.000000
2   203c                   wholefish      c     1     1   1.000000
3   204a               flesh_formula      a     8     8   0.499995
4   204a     fleshdelip_formuladelip      b    10    10   0.499995
5   204a           formula_wholefish      c    16    16   0.499995
6   204a formuladelip_wholefishdelip      d    18    18   0.499995

关于r - 应用group_by和summarise(sum)，但保留具有不相关冲突数据的列？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46553514/

24

4

0

文章推荐： android - Linphone 库示例 sip 注册

文章推荐： testing - 如何在守夜人测试中绕过recaptcha人工检查？

文章推荐： r - 条形图后面的情节线

java - Hadoop 2.6.x 和 Amazon AWS SDK Library 冲突 http-core 冲突
我的工作是将每条记录写入 Hadoop 映射中的 DynamoDB。我无法使用具有 httpclient-4.2.5.jar 和 httpcore-4.2.5.jar 的 Hadoop 2.6 运行
for循环中断中的Javascript切换；冲突
我在 JavaScript 中嵌套了循环开关，例如: for (var i = 0; i < checkBoxIds.length; i++) { if ($('#' + checkB
SVN重命名分支中的文件夹，冲突
我有一个文件夹被重命名的分支。现在我正在尝试合并从主干到这个分支的更改，但是在主干中修改的文件仍然在原始文件夹名称下，因此 svn 引发了树冲突。我该如何解决这个问题？该文件夹已使用 svn ren
Jquery插件占用相同的函数名 -> 冲突
我在使用 jquery 暴露插件和 Masked 输入插件时遇到了问题。问题是它们都占用 $.mask 函数，从而导致冲突。但我非常需要这两个插件一起工作。我会将其中一个中的 $.mask 重命名为.
CSS 冲突
我正在尝试为我所有的 INPUT 元素做一个简单的 :focus 效果，就像这样: INPUT:focus { border-color: orange; } 这很好用，直到我将这段 CSS 添加到样
Javascript 冲突
我是 javascript 的新手。在 wordpress 上工作，我在自定义 js 中为我的主题输入了以下函数: document.getElementsByName("empty_cart")[
javascript 冲突
为什么有些 javascript 会与其他的发生冲突？我的意思是我一直在为图片库使用 javascript 代码，然后尝试在 jquery 中获取文本水印。为什么在使用 jquery 之后，画廊完全消
已知输入的 MD5 冲突
是否可以根据已知的输入值创建 MD5 碰撞？所以例如我有输入字符串 abc与 MD5 900150983cd24fb0d6963f7d28e17f72 . 现在我想将字节添加到字符串 def获得相同
两个文件中的 Javascript 冲突
我在我的项目中使用原型(prototype): NodeParser.prototype.getChildren = function(parentContainer) { return fl
Git应该显示没有 merge 冲突
根据我对 merge 冲突的理解，当两个人更改了同一文件和/或修改了该文件中的同一行时，就会发生 merge 冲突。所以当我做一个 git pull origin master 我期望 merge 冲
jquery - iScroll 冲突
iPad 上 Mobile Safari 中的 HTML5 模板。带 iScroll 的 Div 工作正常。 if/else 语句中还包含一个 jQuery 函数。该函数测试用户是否在 iScroll
Jquery-Mootools 冲突
我一直在尝试使 2 个脚本(1 个 mootol 和 1 个 jquery)在同一页面上工作，但没有成功。我一直在研究许多论坛等，但我仍然无法使这两个脚本同时工作。这就是它在我的标题中的样子: /w
克隆后的 jQuery 冲突
我想克隆带标题的问号。一切正常，但是当我将鼠标悬停在新问号上时，第一个问号上会出现工具提示。有什么想法吗？我正在使用 jQuery 和醉酒的工具提示。 Demo here click here
jquery - 如何解决jQuery和mooTools之间的$冲突？
好吧，我已经在一个 friend 的网站上工作了一段时间了。我的编码技能......值得怀疑，而且我遇到了很多问题。目前我网站上的 jQuery 停止工作了，我找不到原因，并且我已尽一切努力让它工作
全局变量的类型 C 冲突
我想使用一个文件来保存所有#define 和常量:示例 #ifndef CONSTANTS_H_ #define CONSTANTS_H_ #include //OVERALL DEFS
php - JavaScript 冲突？
我在我的表单中的所有 HTML 下都有一些验证码，这似乎阻止了我的复选框验证码的工作，一旦我在我的 HTML 下的代码周围添加/* */(使其不活动)，我就得出了这个结论) 复选框验证代码开始正常工作
Javascript/JQuery 冲突
我是新手。我的页面上有两个 javascript/jquery。如果我使用第一个脚本，第二个脚本将不起作用。如果我删除第一个脚本，第二个脚本就可以正常工作。我不知道如何解决这个问题。我知道有一个“无冲
冲突 Bison 解析器
我是 Bison 新手，在处理 Shift/Reduce 冲突时遇到了麻烦... 我正在为C语言编写语法规则:ID是标识变量的标记，我编写此规则是为了确保即使将标识符写在括号中，也可以考虑它。 id
android - LibGdx 冲突
我目前正在使用 LibGdx 开发我的第一个 Android 游戏项目。这是一款 2D 迷宫游戏，您可以使用触摸输入从其中一个入口到其中一个导出“画出”一条线。世界本身是一个 TiledMap，目前仅
javascript表单验证和表单 Action 冲突
我正在尝试通过 javascript 完成表单验证，并在 #form# 标记中放置一个要执行的 .py 文件操作。但问题是，当我提交数据后，它不会重定向到 .py 操作。所以我摆脱了 preventd

首页

博学

6Ren·AI

商城

r - 应用group_by和summarise(sum)，但保留具有不相关冲突数据的列？