- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
希望这不是一个太愚蠢的问题,但作为一个 R 初学者,我对 tapply 有一个严重的问题。可以说
factors <- as.factor( c("a", "b", "c", "a", "b", "c", "a", "b", "c") )
values <- c( 1, 2, 3, 4, 5, NA, 7, NA, NA )
tapply(
values,
factors,
function(x){
if( sum(is.na(x)) == 1 ){
x[ is.na(x) ] <- 0
}
return(x)
}
)
结果是
$a
[1] 1 4 7
$b
[1] 2 5 0
$c
[1] 3 NA NA
但是,我需要的是获取一个保留值原始顺序的向量,即:
c( 1,2,3,4,5,NA,7,0,NA )
提前非常感谢。
最佳答案
在这种情况下,您应该使用 ave
函数:
> ave(values, factors, FUN=function(x) {
+ if( sum(is.na(x)) == 1 ){
+ x[ is.na(x) ] <- 0
+ }
+ return(x)
+ }
+ )
[1] 1 2 3 4 5 NA 7 0 NA
关于r - 如何使用 tapply 并保留值的顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6103879/
考虑以下 - set.seed(1) x mean 使用 ave、dplyr 和 data.table 方法的组列)。 set.seed(24) df1 % group_b
我有一组汽车销售数据,我将我的数据分成不同的组,如下所示: 汽车品牌和销售年份。 toyota=subset(car, brand=="Toyota") toyota.yr = cut(toyota$
我有一个包含日期时间 (POSIXct)、“节点”(因子)和“c”(数字)列的数据集,例如: date node c 1 2011-08-14 1
有人可以指出我们如何使用tapply(或任何其他方法,plyr等)将多个函数应用于同一列,以便可以在不同的列中获得结果)。例如,如果我有一个数据框 User MoneySpent Joe
我想按组汇总各个列,我的第一个想法是使用 tapply . 但是,我无法获得 tapply上类。可以 tapply用于对多列求和? 如果没有,为什么不呢? 我广泛搜索了互联网,发现发布了许多类似的问题
是否可以在单个 tapply 或聚合语句中包含两个函数? 下面我使用了两个 tapply 语句和两个聚合语句:一个用于均值,一个用于 SD。 我更愿意结合这些陈述。 my.Data = read.ta
我正在尝试制作一个数据框,其中的最大记录数是一个因子。我想要一个包含 4 行(每个 G 行)的数据框,其中该组中 X 的最大值和相应的 Y 值。我知道我可以写一个循环,但宁愿不写。 Data%
希望这不是一个太愚蠢的问题,但作为一个 R 初学者,我对 tapply 有一个严重的问题。可以说 factors ave(values, factors, FUN=function(x) { +
我目前正尝试展示我在放置实验中收集的一些数据。只是让我们继续前进的东西。我们从 12 个土壤样本中收集了 DNA,每个样本都经过三种不同的处理,正在寻找 14 个基因。还有一个 limed/unlim
这个问题在这里已经有了答案: Calculating statistics on subsets of data [duplicate] (3 个回答) 5年前关闭。 我要加tapply结果到原始数据
在 电话 ,我有一个包含位置、样本年和计数的表。所以, Location sample_year count A 1995 1 A 1995
我无法理解当 FUN 参数为 null 时 tapply 函数的作用。 documentation说: If FUN is NULL, tapply returns a vector which ca
我正在使用 tapply 获取某些值的平均值,我得到的输出如下所示: 5 6 7 8 3066.892 1804.489 1754.675
这里是失败的调用、错误消息和一些显示有问题的长度: it <- tapply(molten, c(molten$Activity, molten$Subject, molten$variable),
我想从数据框中计算均值和标准差,其中一列用于参数,一列用于组标识符。使用 tapply 时如何计算它们?我可以用 sd(v1, group, na.rm=TRUE) ,但不适合 na.rm=TRUE使
我有一些来自 tapply 调用的输出,看起来像 1 2 4 678.2 19.3 716.2 我想把它变成一个看起来像的数据框 key valu
在数据框中,我有一个包含一些值的向量,以及每个值所属类别的向量。我想对“按类别”运行的值应用一个函数,所以我使用 tapply。例如,在我的例子中,我想重新调整每个类别中的值。 然而,tapply 的
我是一个真正的初学者,正在尝试为我的硕士论文分析一些金属管 Material 损失的数据。我想比较不同管材在一段时间内 Material 损失的标准偏差。我创建了一些子矩阵并执行了一个tapply 来
每当我想在 R 中做一些“map”py 时,我通常会尝试使用 apply 中的函数家庭。 然而,我从来没有完全理解它们之间的区别——如何{ sapply , lapply等} 将函数应用于输入/分组输
我原本期望在这两次运行之间看到相同的结果,但它们是不同的。让我怀疑我是否真的了解 dplyr 代码是如何工作的(我已经阅读了几乎所有我能在包和网上找到的关于 dplyr 的内容)。谁能解释为什么结果不
我是一名优秀的程序员,十分优秀!