gpt4 book ai didi

r - R中基于不等式的条件累积和

转载 作者:行者123 更新时间:2023-12-05 01:34:44 26 4
gpt4 key购买 nike

我一直在尝试编写这样的代码:对于每个

equation?

到目前为止,我想出的最好方法是使用循环。这是一个示例

y=rnorm(10)
x=c(1,1,1,2,2,2,3,3,3,4)
z=c(5,5,6,6,7,7,8,8,9,9)
data=data.frame(y,x,z)
n=10

s=rep(NA,length(unique(x))*length(unique(z)))
dim(s)=c(length(unique(x)),length(unique(z)))
for (i in 1:length(unique(x))){
for (j in 1:length(unique(z))){
s[i,j]=sum(y*as.numeric((x<=unique(x)[i]))*
as.numeric((z<=unique(z)[j])))
}
}

这样的输出还可以,但是当我的尺寸增加时,这变得效率低下。因为对于给定的 z,这看起来像是一个条件累积和,所以我 100% 确信有一种更有效的方法可以做到这一点,而无需循环。

你们有什么建议吗?如果我没有 z,我知道我可以使用 data.table:

 s=data[order(x)][,lapply(.SD, sum),by=c("x"), .SDcols=c("y")]
s=s[,lapply(.SD, cumsum), .SDcols=c("y")]

但有多个索引(x 和 z,而不仅仅是 x)我无法制定程序。

最佳答案

我认为您不需要 data.table ,因为您为每个组使用了整个“y”。这会更容易通过一些线性代数来完成:

t(y*outer(x, unique(x), '<=')) %*% outer(z, unique(z), '<=')
[,1] [,2] [,3] [,4] [,5]
[1,] 0.3538152 0.1762013 0.1762013 0.1762013 0.1762013
[2,] 0.3538152 -0.7308157 -1.2421102 -1.2421102 -1.2421102
[3,] 0.3538152 -0.7308157 -1.2421102 -1.1770919 -1.8315592
[4,] 0.3538152 -0.7308157 -1.2421102 -1.1770919 -4.1171477

这是您的 3 维代码版本:

set.seed(1)
y=rnorm(10)
x=c(1,1,1,2,2,2,3,3,3,4)
z=c(5,5,6,6,7,7,8,8,9,9)
w=c(7,7,8,8,9,9,10,10,11,11)
n=10

s=rep(NA,length(unique(w))*length(unique(z))*length(unique(x)))
dim(s)=c(length(unique(w)),length(unique(z)), length(unique(x)))
for (i in 1:length(unique(w))) {
for (j in 1:length(unique(z))) {
for (k in 1:length(unique(x))) {
s[i,j, k]=sum(y*as.numeric((w<=unique(w)[i]))*
as.numeric((z<=unique(z)[j]))*
as.numeric((x<=unique(x)[k])))
}
}
}

以下是您可以使用与我之前的答案相同的想法来完成此操作的方法:

t1 <- outer(x, unique(x), '<=')
t2 <- outer(z, unique(z), '<=')
t3 <- outer(w, unique(w), '<=')
lapply(seq_along(unique(x)), function(idx) t(y*t1[,idx]*t2) %*% t3)

这里输出的是一个列表(而不是数组),但是输出是一样的,你可以用“s”来比较结果。你应该可以从这里拿走它。

关于r - R中基于不等式的条件累积和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19990096/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com