- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我无法将自己的注意力集中在ave
函数上。我阅读了帮助并搜索了网络,但仍然无法理解它的作用。我了解它在观察的子集上应用了某些功能,但与tapply
不同
有人可以举个小例子给我启发吗?
谢谢,请原谅我一个不寻常的请求。
最佳答案
tapply
针对每个因子水平返回单个结果。 ave
还在每个因子水平上产生单个结果,但是它将此值复制到原始数据中的每个位置。ave
便于在带有摘要数据的数据框中生成新列。
一个简短的例子:
tapply(iris$Sepal.Length, iris$Species, FUN=mean)
setosa versicolor virginica
5.006 5.936 6.588
ave
上的
iris
产生150个结果,该结果与原始数据帧对齐:
ave(iris$Sepal.Length, iris$Species, FUN=mean)
[1] 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006
[17] 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006
[33] 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006 5.006
[49] 5.006 5.006 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936
[65] 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936
[81] 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936 5.936
[97] 5.936 5.936 5.936 5.936 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588
[113] 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588
[129] 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588 6.588
[145] 6.588 6.588 6.588 6.588 6.588 6.588
d <- data.frame(a=rep(1:2, each=5), b=1:10)
ave(d$b, d$a, FUN=rev)
[1] 5 4 3 2 1 10 9 8 7 6
关于r - tapply和ave之间的功能有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22289258/
考虑以下 - set.seed(1) x mean 使用 ave、dplyr 和 data.table 方法的组列)。 set.seed(24) df1 % group_b
我有一组汽车销售数据,我将我的数据分成不同的组,如下所示: 汽车品牌和销售年份。 toyota=subset(car, brand=="Toyota") toyota.yr = cut(toyota$
我有一个包含日期时间 (POSIXct)、“节点”(因子)和“c”(数字)列的数据集,例如: date node c 1 2011-08-14 1
有人可以指出我们如何使用tapply(或任何其他方法,plyr等)将多个函数应用于同一列,以便可以在不同的列中获得结果)。例如,如果我有一个数据框 User MoneySpent Joe
我想按组汇总各个列,我的第一个想法是使用 tapply . 但是,我无法获得 tapply上类。可以 tapply用于对多列求和? 如果没有,为什么不呢? 我广泛搜索了互联网,发现发布了许多类似的问题
是否可以在单个 tapply 或聚合语句中包含两个函数? 下面我使用了两个 tapply 语句和两个聚合语句:一个用于均值,一个用于 SD。 我更愿意结合这些陈述。 my.Data = read.ta
我正在尝试制作一个数据框,其中的最大记录数是一个因子。我想要一个包含 4 行(每个 G 行)的数据框,其中该组中 X 的最大值和相应的 Y 值。我知道我可以写一个循环,但宁愿不写。 Data%
希望这不是一个太愚蠢的问题,但作为一个 R 初学者,我对 tapply 有一个严重的问题。可以说 factors ave(values, factors, FUN=function(x) { +
我目前正尝试展示我在放置实验中收集的一些数据。只是让我们继续前进的东西。我们从 12 个土壤样本中收集了 DNA,每个样本都经过三种不同的处理,正在寻找 14 个基因。还有一个 limed/unlim
这个问题在这里已经有了答案: Calculating statistics on subsets of data [duplicate] (3 个回答) 5年前关闭。 我要加tapply结果到原始数据
在 电话 ,我有一个包含位置、样本年和计数的表。所以, Location sample_year count A 1995 1 A 1995
我无法理解当 FUN 参数为 null 时 tapply 函数的作用。 documentation说: If FUN is NULL, tapply returns a vector which ca
我正在使用 tapply 获取某些值的平均值,我得到的输出如下所示: 5 6 7 8 3066.892 1804.489 1754.675
这里是失败的调用、错误消息和一些显示有问题的长度: it <- tapply(molten, c(molten$Activity, molten$Subject, molten$variable),
我想从数据框中计算均值和标准差,其中一列用于参数,一列用于组标识符。使用 tapply 时如何计算它们?我可以用 sd(v1, group, na.rm=TRUE) ,但不适合 na.rm=TRUE使
我有一些来自 tapply 调用的输出,看起来像 1 2 4 678.2 19.3 716.2 我想把它变成一个看起来像的数据框 key valu
在数据框中,我有一个包含一些值的向量,以及每个值所属类别的向量。我想对“按类别”运行的值应用一个函数,所以我使用 tapply。例如,在我的例子中,我想重新调整每个类别中的值。 然而,tapply 的
我是一个真正的初学者,正在尝试为我的硕士论文分析一些金属管 Material 损失的数据。我想比较不同管材在一段时间内 Material 损失的标准偏差。我创建了一些子矩阵并执行了一个tapply 来
每当我想在 R 中做一些“map”py 时,我通常会尝试使用 apply 中的函数家庭。 然而,我从来没有完全理解它们之间的区别——如何{ sapply , lapply等} 将函数应用于输入/分组输
我原本期望在这两次运行之间看到相同的结果,但它们是不同的。让我怀疑我是否真的了解 dplyr 代码是如何工作的(我已经阅读了几乎所有我能在包和网上找到的关于 dplyr 的内容)。谁能解释为什么结果不
我是一名优秀的程序员,十分优秀!