r - 自适应移动平均线-R中的最佳性能-6ren

r - 自适应移动平均线-R中的最佳性能

转载作者：行者123 更新时间：2023-12-03 14:30:43

我正在寻找R中滚动/滑动窗口功能方面的一些性能提升。这是非常常见的任务，可以在任何有序观测数据集中使用。我想分享我的一些发现，也许有人可以提供反馈以使其更快。
重要说明是，我专注于案例align="right"和自适应滚动窗口，因此width是一个向量（与我们的观察向量长度相同）。如果我们将width作为标量，则zoo和TTR软件包中已经有非常完善的函数，将很难克服（4年后：它比我预期的要容易），因为其中一些函数是即使使用Fortran（但使用wapply下面提到的用户定义的FUN仍然可以更快）。
RcppRoll软件包由于其出色的性能而值得一提，但是到目前为止，还没有函数可以回答该问题。如果有人可以扩展它来回答问题，那就太好了。

考虑我们有以下数据：

x = c(120,105,118,140,142,141,135,152,154,138,125,132,131,120)
plot(x, type="l")

并且我们想在具有可变滚动窗口 x的 width向量上应用滚动功能。

set.seed(1)
width = sample(2:4,length(x),TRUE)

在这种特殊情况下，我们将具有适应 sample的 c(2,3,4)的滚动功能。
我们将应用 mean函数，预期结果：

r = f(x, width, FUN = mean)
print(r)
##  [1]       NA       NA 114.3333 120.7500 141.0000 135.2500 139.5000
##  [8] 142.6667 147.0000 146.0000 131.5000 128.5000 131.5000 127.6667
plot(x, type="l")
lines(r, col="red")

可以采用任何指标来产生 width自变量作为自适应移动平均值或其他任何函数的不同变体。

寻找顶级性能。

最佳答案

2018年12月更新

自适应滚动功能的有效实现已在
data.table最近-?froll手册中的更多信息。此外，已经确定了使用碱基R的有效替代解决方案（以下fastama）。不幸的是，凯文·乌谢（Kevin Ushey）的答案并未解决该问题，因此未包含在基准测试中。
基准的规模已经增加，因为比较微秒毫无意义。

set.seed(108)
x = rnorm(1e6)
width = rep(seq(from = 100, to = 500, by = 5), length.out=length(x))
microbenchmark(
  zoo=rollapplyr(x, width = width, FUN=mean, fill=NA),
  mapply=base_mapply(x, width=width, FUN=mean, na.rm=T),
  wmapply=wmapply(x, width=width, FUN=mean, na.rm=T),
  ama=ama(x, width, na.rm=T),
  fastama=fastama(x, width),
  frollmean=frollmean(x, width, na.rm=T, adaptive=TRUE),
  frollmean_exact=frollmean(x, width, na.rm=T, adaptive=TRUE, algo="exact"),
  times=1L
)
#Unit: milliseconds
#            expr          min           lq         mean       median           uq          max neval
#             zoo 32371.938248 32371.938248 32371.938248 32371.938248 32371.938248 32371.938248     1
#          mapply 13351.726032 13351.726032 13351.726032 13351.726032 13351.726032 13351.726032     1
#         wmapply 15114.774972 15114.774972 15114.774972 15114.774972 15114.774972 15114.774972     1
#             ama  9780.239091  9780.239091  9780.239091  9780.239091  9780.239091  9780.239091     1
#         fastama   351.618042   351.618042   351.618042   351.618042   351.618042   351.618042     1
#       frollmean     7.708054     7.708054     7.708054     7.708054     7.708054     7.708054     1
# frollmean_exact   194.115012   194.115012   194.115012   194.115012   194.115012   194.115012     1

ama = function(x, n, na.rm=FALSE, fill=NA, nf.rm=FALSE) {
  # more or less the same as previous forloopply
  stopifnot((nx<-length(x))==length(n))
  if (nf.rm) x[!is.finite(x)] = NA_real_
  ans = rep(NA_real_, nx)
  for (i in seq_along(x)) {
    ans[i] = if (i >= n[i])
      mean(x[(i-n[i]+1):i], na.rm=na.rm)
    else as.double(fill)
  }
  ans
}
fastama = function(x, n, na.rm, fill=NA) {
  if (!missing(na.rm)) stop("fast adaptive moving average implemented in R does not handle NAs, input having NAs will result in incorrect answer so not even try to compare to it")
  # fast implementation of adaptive moving average in R, in case of NAs incorrect answer
  stopifnot((nx<-length(x))==length(n))
  cs = cumsum(x)
  ans = rep(NA_real_, nx)
  for (i in seq_along(cs)) {
    ans[i] = if (i == n[i])
      cs[i]/n[i]
    else if (i > n[i])
      (cs[i]-cs[i-n[i]])/n[i]
    else as.double(fill)
  }
  ans
}

旧答案：

我选择了4种不需要C ++的解决方案，很容易找到或使用google。

# 1. rollapply
library(zoo)
?rollapplyr
# 2. mapply
base_mapply <- function(x, width, FUN, ...){
  FUN <- match.fun(FUN)
  f <- function(i, width, data){
    if(i < width) return(NA_real_)
    return(FUN(data[(i-(width-1)):i], ...))
  }
  mapply(FUN = f, 
         seq_along(x), width,
         MoreArgs = list(data = x))
}
# 3. wmapply - modified version of wapply found: https://rmazing.wordpress.com/2013/04/23/wapply-a-faster-but-less-functional-rollapply-for-vector-setups/
wmapply <- function(x, width, FUN = NULL, ...){
  FUN <- match.fun(FUN)
  SEQ1 <- 1:length(x)
  SEQ1[SEQ1 <  width] <- NA_integer_
  SEQ2 <- lapply(SEQ1, function(i) if(!is.na(i)) (i - (width[i]-1)):i)
  OUT <- lapply(SEQ2, function(i) if(!is.null(i)) FUN(x[i], ...) else NA_real_)
  return(base:::simplify2array(OUT, higher = TRUE))
}
# 4. forloopply - simple loop solution
forloopply <- function(x, width, FUN = NULL, ...){
  FUN <- match.fun(FUN)
  OUT <- numeric()
  for(i in 1:length(x)) {
    if(i < width[i]) next
    OUT[i] <- FUN(x[(i-(width[i]-1)):i], ...)
  }
  return(OUT)
}

以下是 prod功能的时序。 mean函数可能已经在 rollapplyr内部进行了优化。所有结果均相等。

library(microbenchmark)
# 1a. length(x) = 1000, window = 5-20
x <- runif(1000,0.5,1.5)
width <- rep(seq(from = 5, to = 20, by = 5), length(x)/4)
microbenchmark(
  rollapplyr(data = x, width = width, FUN = prod, fill = NA),
  base_mapply(x = x, width = width, FUN = prod, na.rm=T),
  wmapply(x = x, width = width, FUN = prod, na.rm=T),
  forloopply(x = x, width = width, FUN = prod, na.rm=T),
  times=100L
)
Unit: milliseconds
                                                       expr       min        lq    median       uq       max neval
 rollapplyr(data = x, width = width, FUN = prod, fill = NA) 59.690217 60.694364 61.979876 68.55698 153.60445   100
   base_mapply(x = x, width = width, FUN = prod, na.rm = T) 14.372537 14.694266 14.953234 16.00777  99.82199   100
       wmapply(x = x, width = width, FUN = prod, na.rm = T)  9.384938  9.755893  9.872079 10.09932  84.82886   100
    forloopply(x = x, width = width, FUN = prod, na.rm = T) 14.730428 15.062188 15.305059 15.76560 342.44173   100

# 1b. length(x) = 1000, window = 50-200
x <- runif(1000,0.5,1.5)
width <- rep(seq(from = 50, to = 200, by = 50), length(x)/4)
microbenchmark(
  rollapplyr(data = x, width = width, FUN = prod, fill = NA),
  base_mapply(x = x, width = width, FUN = prod, na.rm=T),
  wmapply(x = x, width = width, FUN = prod, na.rm=T),
  forloopply(x = x, width = width, FUN = prod, na.rm=T),
  times=100L
)
Unit: milliseconds
                                                       expr      min       lq   median       uq      max neval
 rollapplyr(data = x, width = width, FUN = prod, fill = NA) 71.99894 74.19434 75.44112 86.44893 281.6237   100
   base_mapply(x = x, width = width, FUN = prod, na.rm = T) 15.67158 16.10320 16.39249 17.20346 103.6211   100
       wmapply(x = x, width = width, FUN = prod, na.rm = T) 10.88882 11.54721 11.75229 12.19790 106.1170   100
    forloopply(x = x, width = width, FUN = prod, na.rm = T) 15.70704 16.06983 16.40393 17.14210 108.5005   100

# 2a. length(x) = 10000, window = 5-20
x <- runif(10000,0.5,1.5)
width <- rep(seq(from = 5, to = 20, by = 5), length(x)/4)
microbenchmark(
  rollapplyr(data = x, width = width, FUN = prod, fill = NA),
  base_mapply(x = x, width = width, FUN = prod, na.rm=T),
  wmapply(x = x, width = width, FUN = prod, na.rm=T),
  forloopply(x = x, width = width, FUN = prod, na.rm=T),
  times=100L
)
Unit: milliseconds
                                                       expr       min       lq   median       uq       max neval
 rollapplyr(data = x, width = width, FUN = prod, fill = NA) 753.87882 781.8789 809.7680 872.8405 1116.7021   100
   base_mapply(x = x, width = width, FUN = prod, na.rm = T) 148.54919 159.9986 231.5387 239.9183  339.7270   100
       wmapply(x = x, width = width, FUN = prod, na.rm = T)  98.42682 105.2641 117.4923 183.4472  245.4577   100
    forloopply(x = x, width = width, FUN = prod, na.rm = T) 533.95641 602.0652 646.7420 672.7483  922.3317   100

# 2b. length(x) = 10000, window = 50-200
x <- runif(10000,0.5,1.5)
width <- rep(seq(from = 50, to = 200, by = 50), length(x)/4)
microbenchmark(
  rollapplyr(data = x, width = width, FUN = prod, fill = NA),
  base_mapply(x = x, width = width, FUN = prod, na.rm=T),
  wmapply(x = x, width = width, FUN = prod, na.rm=T),
  forloopply(x = x, width = width, FUN = prod, na.rm=T),
  times=100L
)
Unit: milliseconds
                                                       expr      min       lq    median        uq       max neval
 rollapplyr(data = x, width = width, FUN = prod, fill = NA) 912.5829 946.2971 1024.7245 1071.5599 1431.5289   100
   base_mapply(x = x, width = width, FUN = prod, na.rm = T) 171.3189 180.6014  260.8817  269.5672  344.4500   100
       wmapply(x = x, width = width, FUN = prod, na.rm = T) 123.1964 131.1663  204.6064  221.1004  484.3636   100
    forloopply(x = x, width = width, FUN = prod, na.rm = T) 561.2993 696.5583  800.9197  959.6298 1273.5350   100

关于r - 自适应移动平均线-R中的最佳性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21368245/

文章推荐： haskell - 在 StateT 中组合多个状态

文章推荐： laravel - 使用 Laravel 4 的 Cron 作业

html - 如何创建这样的元素(自适应)？
我不知道如何创建这样的元素，以便点之间的距离始终适应屏幕尺寸。这是我的代码的结果: .line-list { display: flex; justify-content: space-be
Paypal 自适应 API
最终用户的 paypal 自适应支付流程有点奇怪。而不是像 paypal express 流程那样工作: 用户完成结帐过程用户前往 paypal 以授权付款用户被重定向回网站以确认付款通知从网
html - 自适应 Google 广告未显示在我的网站上
我在我们的游戏网站上添加了一个响应式 Google 广告，这是一个简单的基于静态 bootstrap 的网站: http://dealoround.com这将解决 https://mrcsabatot
Angular |响应式 |自适应 |重置配置
简短的问题使用 routes.resetConfig(newRouteArray) 切换路线的/或更好的方法有什么区别？对比在 resize 事件上重新加载 Angular 应用程序并根据屏幕宽
javascript - 自适应 slider 的问题
我在尝试仅使用纯 JS 制作自适应 slider 时遇到一些问题。任务是: 在移动设备中， slider 仅显示文本信息或大幻灯片的一小部分当宽度增加(通过媒体查询)时， slider 会变大并显
symfony - 自适应 Symfony2 形式选择
我刚刚创建了一个表单类类型，它有一个选择类型，其中 choice_list 必须根据登录的用户角色进行更改，因此表单类类型需要访问当前用户角色，然后根据它更改 choice_list。有人能指出一种
symfony - 自适应 Symfony2 形式选择
我刚刚创建了一个表单类类型，它有一个选择类型，其中 choice_list 必须根据登录的用户角色进行更改，因此表单类类型需要访问当前用户角色，然后根据它更改 choice_list。有人能指出一种
autosar - 自适应 AutoSAR 的目标是什么
引入自适应 Autosar 的主要动机是什么？ Information provided by Autosar consortium is "AP provides mainly high-perfo
ios - 自适应 UICollectionView 单元格宽度
我是 Collection View 和自动布局的新手，我在让单元格大小适应模拟器中的各种设备时遇到了问题。我正在使用流式布局，并在尺寸检查器中设置尺寸。我提供的图像显示了我需要单元格在所有设备上的外
html - 自适应 2 列布局
我在使用自适应布局的网站上工作，这意味着网站会适应用户屏幕宽度。有三张图片说明了我的想法，图片显示了浏览器窗口从宽到窄调整大小的三个步骤。宽屏紫色区域贴在页面左侧，绿色区域适合屏幕的其余部分。中等
css - 自适应 flexbox 不适用于三列
目前我在 flexbox 中有三列(目前在 Plunkr 中的情况)。当屏幕变小时，我希望第二列位于其他两列之上(Plunkr 中的理想情况)。我在 https://plnkr.co/edit/Z
html - 自适应 svg 背景
我试图让 svg 根据屏幕尺寸显示不同的图像，因此较小的设备显示较小的图像。例如，如果我想要一个覆盖整个 svg 区域的背景图像，就像这样: #t
javascript - 自适应 AngularJS 指令
这是我们的 jQuery 代码: $(document).ready(function(){ $(window).on("load resize", function(){ i
ruby-on-rails - 自适应 Paypal
我正在尝试使用 this gem 用于使用 paypal 自适应支付，它需要 development: environment: "sandbox" username: "sandbox_userna
php - Paypal 自适应/链式支付工作流程
首先，我对 paypal 自适应支付有点陌生，直到现在我只使用 REST api。在实现自适应支付时，我无法理解应用程序的完整流程。在 REST api 中，我将用户导航到他付款的 paypal
ios - 自适应 uitextview 直到特定高度
我有一个具有聊天功能的应用程序，其中 UITextview 用于输入消息。 UITextview 高度必须是动态的(如果用户输入消息，高度必须根据文本长度更改，直到特定高度)。我怎样才能做到这一点？
php - MySql 自适应 ID
我有一个表设置了一个自动递增的 ID。假设我有 ID 1、2、3、4 和 5。当我删除 ID 号 3 时，我希望 ID 4 降为 3，ID 5 降为 4。这可能吗？这是怎么做到的？最佳答案我想你
jquery - 自适应 bxSlider 宽度或中心图像
我有一个幻灯片，其中包含许多不同纵横比的图片。我希望图像在幻灯片中居中。我该怎么做，或者更好的是，我如何自动调整 slider 的大小？最佳答案解决中心问题 .bx-wrapper img {
Android 自适应 ImageView 尺寸到屏幕尺寸
我有一个想要实现的特定布局，但我不知道如何让它在多种屏幕尺寸上稳健地工作。关键思想是 TextViews 中的信息很重要，而 ImageView 是装饰性的。我希望根据用户屏幕尺寸(最大尺寸)调整
javascript - 自适应 adSense 广告 - 动态重新加载
我在响应式网站 ( http://goo.gl/asEovC ) 上运行了来自 labnol.org 的代码: ad = document.getElementById('google-a

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

r - 自适应移动平均线-R中的最佳性能