作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个非常大的数据框,我的目标是按用户 ID 列出累计美元。数据框看起来像这样,但它要大得多:
dt<-sample(seq(as.Date("2013-01-01"),as.Date("2013-05-01"),by="days"),10)
s<-c(rep(5252525,5),rep(1313131,5))
usd<-round(rnorm(10,100),2)
money<-data.frame(dt,s,usd)
money<-money[order(money$dt),]
money$Cumulative<-NA
users<-unique(money$s)
我从一个 for 循环开始,但是它很慢:
for (i in 1:length(users)){
temp=which(money$s==users[i])
money$Cumulative[temp]=cumsum(money$usd[temp])
}
我在 StackOverflow 上读到我可以使用 data.table 来提高整体速度,这在一定程度上有所帮助:
money<-data.table(money)
setkey(money,s)
for (i in 1:length(users)){
temp=which(money$s==users[i])
money$Cumulative[temp]=cumsum(money$usd[temp])
}
我想让这个计算更快。接下来我该做什么?
最佳答案
由于 money
已经按 dt
列排序,您可以只使用 ave
:
money$Cumulative <- ave(money$usd, money$s, FUN=cumsum)
或者你可以使用data.table:
moneyDT <- as.data.table(money[,1:3])
moneyDT[,cumulative := cumsum(usd), by=s]
关于r - 加快大型数据帧的 For 循环,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17884296/
我是一名优秀的程序员,十分优秀!