r - 给定列的最小值，在另一列中找到最小值(dplyr)-6ren

r - 给定列的最小值，在另一列中找到最小值(dplyr)

转载作者：行者123 更新时间：2023-12-04 12:21:50

27

4

假设我们在 R 中有以下数据集:

> td
  Type Rep Value1 Value2
1    A   1      7      1
2    A   2      5      4
3    A   3      5      3
4    A   4      8      2
5    B   1      5     10
6    B   2      6      1
7    B   3      7      1
8    C   1      8     13
9    C   2      8     13

> td <- structure(list(Type = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 
3L, 3L), .Label = c("A", "B", "C"), class = "factor"), Rep = c(1L, 
2L, 3L, 4L, 1L, 2L, 3L, 1L, 2L), Value1 = c(7L, 5L, 5L, 8L, 5L, 
6L, 7L, 8L, 8L), Value2 = c(1L, 4L, 3L, 2L, 10L, 1L, 1L, 13L, 
13L)), .Names = c("Type", "Rep", "Value1", "Value2"), class = "data.frame",
row.names = c(NA, -9L))

我想生成下表:

  Type MinValue1 MinValue2 MeanValue1 MeanValue2
1    A         5         3       6.25        2.5
2    B         5        10       6.00        4.0
3    C         3        13       8.00       13.0

在此表中，数据按“类型”汇总。列“MinValue1”是特定类型的最小值，列“MinValue2”是“Value2”的最小值，给定列“Value1”的最小值。列均值*是所有观察值的一般平均值。

实现此目的的一种方法是实现迭代每种类型并进行数学计算的循环。但是，我正在寻找一种更好/更简单/更漂亮的方法来执行此类操作。

我玩过“tidyverse”中的工具:

> library(tidyverse)
> td %>% 
     group_by(Type) %>% 
     summarise(MinValue1 = min(Value1), 
               MeanValue1 = mean(Value1),
               MeanValue2 = mean(Value2))
# A tibble: 3 × 4
    Type MinValue1 MeanValue1 MeanValue2
  <fctr>    <int>       <dbl>      <dbl>
1      A        5        6.25        2.5
2      B        5        6.00        4.0
3      C        8        8.00       13.0

请注意，我们这里没有列“MinValue2”。另请注意，“summarise(..., MinValue2 = min(Value2), ...)”不起作用，因为此解决方案采用一种类型的所有观察值中的最小值。

我们可以玩“切片”，然后合并结果:

> td %>% group_by(Type) %>% slice(which.min(Value1))
Source: local data frame [3 x 4]
Groups: Type [3]

    Type   Rep Value1 Value2
  <fctr> <int>  <int>  <int>
1      A     3      5      4
2      B     1      5     10
3      C     1      8     13

但请注意，“切片”工具在这里对我们没有帮助:“类型 A，值 1 5”应该具有“值 2”== 3，而不是切片返回的 == 4。

那么，你们有没有优雅的方法来实现我想要的结果？谢谢!

最佳答案

一种方法是使用 order 函数的属性来断开与另一个向量的联系:

get_min_at_min <- function(vec1, vec2) {
  return(vec2[order(vec1, vec2)[1]])
}

这将返回 vec2 的最小值，其中索引对应于 vec1 的最小值。使用此功能管道很简单:

td %>% 
  group_by(Type) %>% 
  summarise(MinValue1 = min(Value1),
            MinValue2 = get_min_at_min(Value1, Value2),
            MeanValue1 = mean(Value1),
            MeanValue2 = mean(Value2))

或者只是简单地利用这样一个事实，即可以在 dplyr 函数中处理计算变量:

td %>% 
  group_by(Type) %>% 
  summarise(MinValue1 = min(Value1),
            MinValue2 = min(Value2[Value1 == MinValue1]),
            MeanValue1 = mean(Value1),
            MeanValue2 = mean(Value2))

关于r - 给定列的最小值，在另一列中找到最小值(dplyr)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41664449/

27

4

0

文章推荐： r - 在 coord_flip 之后翻转分组条形图中数据的顺序

文章推荐： r - 使用 doParallel 时的范围问题

文章推荐： firebug - 如何禁用 firebug 对重复的控制台输出进行分组？

文章推荐： python - 更新python中多个键的值

perl - 给定/当值未定义时
在下面的代码中，我得到一个 uninitialized value警告，但仅限于第二个 given/when例子。为什么是这样？ #!/usr/bin/env perl use warnings; u
perl - 给定/何时的哪些部分是实验性的？
整个“开关”功能是否已成为实验性的？在没有 Perl 的 future 版本破坏我的代码的情况下，我可以依赖其中的某些部分吗？一般来说，将稳定功能更改为实验性的政策是什么？背景use feature
c++ - 条件语句(给定)
有没有办法在一个条件语句中写出如下语句？ a和b不能同时等于5。 (a可以是5，b可以是5，但是a AND b不能是5) 最佳答案正如克里斯指出的那样，您要查找的是逻辑异或，相当于逻辑不等于 !=:
给定 n 条线查找所有线段交点的算法
我正在寻找一种算法来找到给定 n 条线段的所有交点。以下是来自 http://jeffe.cs.illinois.edu/teaching/373/notes/x06-sweepline.pdf 的伪
python - 给定 k 个标记的最大项目
数组中有 N 个元素。我可以选择第一项最多 N 次，第二项最多选择 N-1 次，依此类推。我有 K 个 token 要使用并且需要使用它们以便我可以拥有最大数量的项目。 arr = [3, 4, 8
python - 给定 Spacy 中的引理是否有可能获得单词列表？
我正在尝试修复法语文本中的语法性别，想知道是否有办法从某个词条中获取所有单词的列表，以及是否可以在此类列表中进行查找？最佳答案尝试: import spacy lemma_lookup = spa
winapi - 给定 HWND，如何从所有者绘制的窗口中提取文本信息？
我正在为 Win32 编写一个简单的自动化测试应用程序。它作为一个单独的进程运行，并通过 Windows API 访问目标应用程序。我可以阅读窗口层次结构，查找标签和文本框，并通过发送/发布消息等来单
javascript - 给定 JSON 中的第一行是什么？
在 nodeJs 中使用 Sequelize 时，我从 Sequelize 收到此错误，如下所示: { [SequelizeUniqueConstraintError: Validation erro
python - 给定 CNN 的回归激活映射
本文https://arxiv.org/pdf/1703.10757.pdf使用回归激活映射 (RAM) - 而不是类激活映射 (CAM) 来解决问题。有几篇文章描述了如何实现 CAM。但是我找不到
ios - 给定 mach_header 我如何找到二进制图像名称？
我正在研究 Mach 动态链接器 dyld。这个问题适用于所有 Apple 平台，但很高兴得到特定于平台的答案；我正在使用 ObjC，但如果对你有用的话，我也很乐意翻译 Swift。 The rele
instagram - 给定 user_id，如何找到用户名？
我有一个包含数千个 Instagram 用户 ID 的列表。我如何获得他们的 Instagram 用户名/句柄？最佳答案你必须使用这个 Instagram API: https://api.ins
scala - 给定 Elasticsearch 无效模式
我在下面的代码: def main(args: Array[String]) { val sparkConf = new SparkConf().setAppName("Spark-Hbase").s
excel - 给定 2 个日期时查找单元格范围
我有一个表格，其中包含从 1 到 10 的数字。(从 D2 到 M2) 假设A1中有03/09/2019 并且在B1中有06/09/2019 并且在C1中有Hello 在A 列中，我有多个系列的单词，
java - 给定 URI 的注释检索
我想在给定服务对应的 URI 的情况下检索服务的注释(特别是 @RolesAllowed )。这是一个例子: 服务: @GET @Path("/example") @RolesAllowed({ "B
oracle - 给定 JDBC 连接上的并发查询？
我看到 OraclePreparedStatementexecuteQuery() 表现出序列化。也就是说，我想使用相同的连接对 Oracle 数据库同时运行两个查询。然而，OraclePrepare
java - 给定 k，使用递归求几何和
import java.util.Scanner; public class GeometricSumFromK { public static int geometricSum(int k,
java - 给定 HttpServletRequest 的网页服务的良好模式是什么？
我创建了一个抽象基类Page，它说明了如何构建动态网页。我正在尝试想出一种基于作为 HttpServletRequest 传入的 GET 请求生成 Page 的好方法。例如... public cla
java - 给定 SMS 字符串的正则表达式是什么
我的字符串是一条短信，采用以下两种格式之一: 潜在客户短信: 您已收到 1 条线索标题:我的领导潜在客户 ID:12345-2365 警报设置 ID:890 短信回复: 您已收到 1 条回复标题
python - 给定 python 中的字符串列表
我在 python 中有以下代码: class CreateMap: def changeme(listOne, lisrTwo, listThree, listFour, listfive):
java - 给定 id 的多个实体的高效缓存感知获取
这是在 Hibernate 上运行的 JPA2。我想检索相同实体类型的多个实例，给定它们的 ID。其中许多已经在持久性上下文和/或二级缓存中。我尝试了几种方法，但似乎都有其缺点: 当我使用 ent

首页

博学

6Ren·AI

商城

r - 给定列的最小值，在另一列中找到最小值(dplyr)