r - 如何使用 tapply 并保留值的顺序-6ren

r - 如何使用 tapply 并保留值的顺序

转载作者：行者123 更新时间：2023-12-02 23:50:55

26

4

希望这不是一个太愚蠢的问题，但作为一个 R 初学者，我对 tapply 有一个严重的问题。可以说

factors <- as.factor( c("a", "b", "c", "a", "b", "c", "a", "b", "c") )
values  <- c( 1, 2, 3, 4, 5, NA, 7, NA, NA )
tapply(
  values,
  factors,
  function(x){
    if( sum(is.na(x)) == 1 ){
      x[ is.na(x) ] <- 0
    }
    return(x)
  }
)

结果是

$a
[1] 1 4 7

$b
[1] 2 5 0

$c
[1]  3 NA NA

但是，我需要的是获取一个保留值原始顺序的向量，即:

c( 1,2,3,4,5,NA,7,0,NA )

提前非常感谢。

最佳答案

在这种情况下，您应该使用 ave 函数:

> ave(values, factors, FUN=function(x) {
+     if( sum(is.na(x)) == 1 ){
+       x[ is.na(x) ] <- 0
+     }
+     return(x)
+   }
+ )
[1]  1  2  3  4  5 NA  7  0 NA

关于r - 如何使用 tapply 并保留值的顺序，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6103879/

26

4

0

文章推荐： git-svn - msysgit 从 1.7.11 开始就被破坏了？

文章推荐： eclipse - Flex eclipse 插件不是免费的吗？

文章推荐： bash - 如何通过 sed 或 awk 替换文件中的两个代码块

文章推荐： xml - Bash 将 XML 解析为逗号分隔列表

r - ave vs tapply。 unique(ave)==tapply 总是吗？如果是这样，为什么其中之一存在？
考虑以下 - set.seed(1) x mean 使用 ave、dplyr 和 data.table 方法的组列)。 set.seed(24) df1 % group_b
r - 对数据的子集组使用 tapply
我有一组汽车销售数据，我将我的数据分成不同的组，如下所示: 汽车品牌和销售年份。 toyota=subset(car, brand=="Toyota") toyota.yr = cut(toyota$
r - `tapply()` 返回数据帧
我有一个包含日期时间 (POSIXct)、“节点”(因子)和“c”(数字)列的数据集，例如: date node c 1 2011-08-14 1
r - 使用 tapply 将多个函数应用于列
有人可以指出我们如何使用tapply(或任何其他方法，plyr等)将多个函数应用于同一列，以便可以在不同的列中获得结果)。例如，如果我有一个数据框 User MoneySpent Joe
r - 使用 tapply 按组对多列求和
我想按组汇总各个列，我的第一个想法是使用 tapply . 但是，我无法获得 tapply上类。可以 tapply用于对多列求和？如果没有，为什么不呢？我广泛搜索了互联网，发现发布了许多类似的问题
r - 单个 tapply 或聚合语句中的多个函数
是否可以在单个 tapply 或聚合语句中包含两个函数？下面我使用了两个 tapply 语句和两个聚合语句:一个用于均值，一个用于 SD。我更愿意结合这些陈述。 my.Data = read.ta
R 函数 which.max with tapply
我正在尝试制作一个数据框，其中的最大记录数是一个因子。我想要一个包含 4 行(每个 G 行)的数据框，其中该组中 X 的最大值和相应的 Y 值。我知道我可以写一个循环，但宁愿不写。 Data%
r - 如何使用 tapply 并保留值的顺序
希望这不是一个太愚蠢的问题，但作为一个 R 初学者，我对 tapply 有一个严重的问题。可以说 factors ave(values, factors, FUN=function(x) { +
r - 排序和呈现我的数据的问题 - tapply 和图形问题
我目前正尝试展示我在放置实验中收集的一些数据。只是让我们继续前进的东西。我们从 12 个土壤样本中收集了 DNA，每个样本都经过三种不同的处理，正在寻找 14 个基因。还有一个 limed/unlim
r - 如何将 tapply 结果添加到现有数据框
这个问题在这里已经有了答案: Calculating statistics on subsets of data [duplicate] (3 个回答) 5年前关闭。我要加tapply结果到原始数据
r - tapply() 函数依赖于 R 中的多列
在电话，我有一个包含位置、样本年和计数的表。所以， Location sample_year count A 1995 1 A 1995
R 的带有 null 函数的 tapply
我无法理解当 FUN 参数为 null 时 tapply 函数的作用。 documentation说: If FUN is NULL, tapply returns a vector which ca
r - 绘制来自 tapply 输出的数据 - R 脚本
我正在使用 tapply 获取某些值的平均值，我得到的输出如下所示: 5 6 7 8 3066.892 1804.489 1754.675
r - tapply 函数提示 args 的长度不相等，但它们似乎匹配
这里是失败的调用、错误消息和一些显示有问题的长度: it <- tapply(molten, c(molten$Activity, molten$Subject, molten$variable),
r - 如何将 na.rm 作为参数传递给 tapply？
我想从数据框中计算均值和标准差，其中一列用于参数，一列用于组标识符。使用 tapply 时如何计算它们?我可以用 sd(v1, group, na.rm=TRUE) ，但不适合 na.rm=TRUE使
r - 将 tapply 输出转换为 R 中的数据帧
我有一些来自 tapply 调用的输出，看起来像 1 2 4 678.2 19.3 716.2 我想把它变成一个看起来像的数据框 key valu
R - "linearizing"tapply 的结果(到一个单一向量，按列解包)
在数据框中，我有一个包含一些值的向量，以及每个值所属类别的向量。我想对“按类别”运行的值应用一个函数，所以我使用 tapply。例如，在我的例子中，我想重新调整每个类别中的值。然而，tapply 的
r - 在 R 中绘制来自 tapply 输出的数据
我是一个真正的初学者，正在尝试为我的硕士论文分析一些金属管 Material 损失的数据。我想比较不同管材在一段时间内 Material 损失的标准偏差。我创建了一些子矩阵并执行了一个tapply 来
r - 分组函数(tapply、by、aggregate)和 *apply 系列
每当我想在 R 中做一些“map”py 时，我通常会尝试使用 apply 中的函数家庭。然而，我从来没有完全理解它们之间的区别——如何{ sapply , lapply等} 将函数应用于输入/分组输
r - 了解 dplyr group_by 与 tapply 之间的结果差异
我原本期望在这两次运行之间看到相同的结果，但它们是不同的。让我怀疑我是否真的了解 dplyr 代码是如何工作的(我已经阅读了几乎所有我能在包和网上找到的关于 dplyr 的内容)。谁能解释为什么结果不

首页

博学

6Ren·AI

商城

r - 如何使用 tapply 并保留值的顺序