r - 根据R dplyr中的多列选择每组中具有最大值的行-6ren

r - 根据R dplyr中的多列选择每组中具有最大值的行

转载作者：行者123 更新时间：2023-12-05 02:32:43

27

4

我的数据框看起来像这样

library(tidyverse)

df1 <- tibble(col1= c("apple","apple","banana","banana"), 
              col2 = c("appl","aple","banan","bananb"),
              count_col1=c(1,1,4,4), count_col2=c(3,4,1,1))
df1
#> # A tibble: 4 × 4
#>   col1   col2   count_col1 count_col2
#>   <chr>  <chr>       <dbl>      <dbl>
#> 1 apple  appl            1          3
#> 2 apple  aple            1          4
#> 3 banana banan           4          1
#> 4 banana bananb          4          1

^{由 reprex package 创建于 2022-02-17 (v2.0.1)}

我想在 grouping_by col1 之后选择具有基于 count_col1 和 count_col2 的最大值的行。

我希望我的数据看起来像这样

      col1   col2   count_col1 count_col2
      apple  aple            1          4
      banana banan           4          1
      banana bananb          4          1

对于一个专栏你可以写点东西

df1 %>% 
  slice(which.max(count_col1))

但不是两个人

最佳答案

我们可以使用 pmax 获取 'count' 列的按行最大值，按 'col1' 分组，过滤 max 所在的行“最大”列的值为。

library(dplyr)
df1 %>% 
 mutate(Max = pmax(count_col1, count_col2) ) %>%
 group_by(col1) %>%
 filter(Max == max(Max)) %>%
 ungroup %>%
 select(-Max)

-输出

# A tibble: 3 × 4
  col1   col2   count_col1 count_col2
  <chr>  <chr>       <dbl>      <dbl>
1 apple  aple            1          4
2 banana banan           4          1
3 banana bananb          4          1

我们也可以使用slice_max

library(purrr)
df1 %>%
  group_by(col1) %>%
  slice_max(invoke(pmax, across(starts_with("count")))) %>%
  ungroup
# A tibble: 3 × 4
  col1   col2   count_col1 count_col2
  <chr>  <chr>       <dbl>      <dbl>
1 apple  aple            1          4
2 banana banan           4          1
3 banana bananb          4          1

关于r - 根据R dplyr中的多列选择每组中具有最大值的行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/71165531/

27

4

0

文章推荐： Bash - 如何检索 'or' 语句中第一个命令的退出状态

文章推荐： r - 堆栈数据(可能是 pivot_longer)但很复杂，R

文章推荐： python - 多字 discord 斜杠命令 (PyCord)

文章推荐： haskell - 如何在 Haskell 中安装库？

python - 列表中两个切片的最小值/最大值/最大值
我有一个像 [3,10,4,3,9,15,6,13] 这样的列表，我想找到两个不重叠的系列/序列给出通过取最大-最小值可获得的最大值.它们必须是连续的，因此您不能从 1 中减去项目 3。但是您可以从
python - 行的 Pandas 最大值，前 n 最大值
我正在尝试创建顶部列，这是几个列行的最大值。 Pandas 有一个方法 nlargest但我无法让它成行工作。 Pandas 也有 max和 idxmax这正是我想做的，但仅限于绝对最大值。 df =
Android 位置、经度(最小值、最大值)、纬度(最小值、最大值)
我在使用 Android 时遇到了一点问题。我有我的 GPS 位置，明确的经纬度，以及以米为单位的搜索射线(例如 100 米)，可以吗？想象一下我在射线形成的圆心的位置，我会知道如何在 Andro
data-structures - 有效允许拉取所有范围(最小值、最大值)的最佳数据结构，使得值 >= 最小值和值 <= 最大值？
假设我有一组最小值和最大值。我想要一个数据结构，在给定外部值的情况下，它会最有效地为我提供值 >= 最小值、值 = 最小值和值 <= 最大值？，我们在Stack Overflow上找到一个类似的问题：
最大值:扩展嵌套求和
我有以下 Maxima 代码: m:sum(x[i],i,1,N)/N; 然后我想计算 $m^2$。 m2:m^2, sumexpand; 然后我得到双重求和: sum(sum(x[i1]*x[i2]
python从嵌套字典中获取最小/最大值
如何从嵌套字典中获取一个值的最小值/最大值，该字典的缺失值也包含“Nan”？ *这是供引用，我找到了一个解决方案，我想我应该在这里分享它，因为我在 stackoverflow 上的任何地方都找不到答案
最大值:区分特定索引位置的总和
在千里马 12.04.0 我有一个总和 mysum : sum(u[i]^2, i, 1, N); 现在我区分它 diff(mysum, u[i]); 现在我指定一个定义的索引 i=A 来区分它 at
MySQL在时间轴上选择最小值、最大值
是否可以根据时间轴获取最小和最大时间戳？我将在 parking 场示例中进行解释。 +---------------------+------+--------+-------+-----------
MySQL 最大值
基本上在几个领域有几个日期 SELECT MAX(MAX(DATE_A),MAX(DATE_B)) from table DATE_A 和 DATE_B 是日期，我基本上想要日期 A 或日期 B 的最
Jquery 最大值
我创建了一个小测试，其中一个 div 根据滚动深度滑动。我只是想知道怎么设置 A) 起点 (scrolltop = x something) B) 如何设置最大值？ var pxlCount = 0
CLOCK_MONOTONIC 最大值
由于达到最大值，clock_gettime() 何时会使用 CLOCK_MONOTONIC 返回一个较小的值？我不是指被描述为错误的小扭曲，而是类似于计数器重置的东西。它是时间测量的，还是与滴答的绝
angularjs $timeout 最大值
我正在使用 angularjs，尤其是 $timeout 服务(setTimeout 的包装器)。它的工作原理如下: angular.module('MyApp').controller('MyCo
generics - 未知类型的最小值/最大值
是否有可能获得 MinValue - 或 MaxValue未知的 T 型？如 Int其中有 Int.MinValue和 Int.MaxValue ?? 谢谢最佳答案正如@mpilquist 在上面
sql - 优化查询以获取最小值/最大值
我的数据为员工: id Name -------- 1 xyz 2 abc 3 qaz Employee_A:(Eid - 员工表，title - 职称表) eid active
excel - 如何找到每天的最小值/最大值？
我有一个日期和时间行列表，每天有多行。对于每个唯一日期，我想获取最小和最大时间值。如何在 Excel v10(又名 2002)中执行此操作？最佳答案首先，您可以使用 Excel 函数 MIN(
SQL:显示标准偏差内的平均值和最小值/最大值
我有以下 SQL 表 - Date StoreNo Sales 23/4 34 4323.00 23/4 23 5
Crossfilter - 如何找到最小值/最大值
我可能错过了一些微不足道的东西。我想我还没有完全理解一些基本的交叉过滤器概念无论如何，我创建了一个带有几个维度的交叉过滤器，并在维度上使用过滤器。我现在想知道过滤值(不是键)的最小值/最大值。我将
matlab - 插值结果如何大于或小于原始信号的最小值/最大值？
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 9 年前。 Improve t
沿轴的 Numpy 最大值
我在这里错过了什么吗？我希望以下代码段中的 np.max 会返回 [0, 4] ... >>> a array([[1, 2], [0, 4]]) >>> np.max(a,
python - 在列表列表中按索引查找最小值/最大值
给定大小为 2 的列表列表，我试图找到通过索引确定最小/最大值的最快方法。目标是确定一系列 XY 点的边界/范围。子列表未排序(按一个索引排序并不能保证另一个索引已排序)。目前我正在做以下事情:

首页

博学

6Ren·AI

商城

r - 根据R dplyr中的多列选择每组中具有最大值的行