r - 在 R : script works, 中的移动日期窗口上缩放变量，但速度慢得令人无法接受。优化方法？ rstats-6ren

r - 在 R : script works, 中的移动日期窗口上缩放变量，但速度慢得令人无法接受。优化方法？ rstats

转载作者：行者123 更新时间：2023-12-03 15:09:17

25

4

我有一个数据框，其中每一行代表特定日期特定类别的数据:

set.seed(1)
k <- 10
df <- data.frame(
    name = c(rep('a',k), rep('b',k)), 
    date = rep(seq(as.Date('2017-01-01'),as.Date('2017-01-01')+k-1, 'days'),2),
    x = runif(2*k,1,20),
    y = runif(2*k,100,300)
    )
View(df)

头:

 head(df)
  name       date         x        y
1    a 2017-01-01  6.044665 286.9410
2    a 2017-01-02  8.070354 142.4285
3    a 2017-01-03 11.884214 230.3348
4    a 2017-01-04 18.255948 125.1110
5    a 2017-01-05  4.831957 153.4441
6    a 2017-01-06 18.069404 177.2228

结构:

str(df)
'data.frame':   20 obs. of  4 variables:
 $ name: Factor w/ 2 levels "a","b": 1 1 1 1 1 1 1 1 1 1 ...
 $ date: Date, format: "2017-01-01" "2017-01-02" "2017-01-03" "2017-01-04" ...
 $ x   : num  6.04 8.07 11.88 18.26 4.83 ...
 $ y   : num  287 142 230 125 153 ...

我需要在特定日期窗口内缩放此数据的 x 和 y 变量。我想出的脚本如下:

library(dplyr)
library(lubridate)
df2 <- df
moving_window_days <- 4

##Iterate over each row in df
for(i in 1:nrow(df)){ 
    df2[i,] <- df %>% 
        ##Give me only rows for 'name' on the current row 
        ##which are within the date window of interest
        filter(date <= date(df[i,"date"]) & 
               date >= date(df[i,"date"]) - moving_window_days & 
               name == df[i,"name"]
               ) %>% 
        ##Now scale x and y on this date wondow
        mutate(x = percent_rank(x), 
               y = percent_rank(y)
        ) %>% 
        ##Get rid of the rest of the rows - leave only the row we are looking at
        filter(date == date(df[i,"date"])) 
}

它按预期工作(好吧，我最初想在移动窗口中获取每个观察值的百分位数，但缩放后的值就可以正常工作)问题是真实的数据集要大得多:

'name'栏有30个地方分公司
'date' 是每个分支至少一年的数据
我有 6 个变量，而不是 'x' 和 'y'
移动窗口为 90 天

我在真实数据上运行了这个脚本，在30,000 行 中，它在4 小时 中只能超过5,000。 ..这是我第一次遇到这样的问题。

我确定我的脚本效率非常低(我确定是因为我不是 R 专家。我只是假设总有更好的方法)

有什么方法可以优化/改进此脚本？

有什么方法可以“purrrify”(使用 purrr 中的一些 map 函数)？
嵌套数据框？ 嵌套()？认为这是一个解决方案...不确定如何实现...

我能做些什么来以不同的方式解决这个问题？

最佳答案

您可以做的一件事是并行处理。为此，我使用了 future 包。这可能会惹恼一些人，他们可能认为这是一种 hack，因为 future 包的目的是......好吧......对于 future (或者“ promise ”，如果你是前端开发人员)。这种方法很挑剔，但效果很好。

    library(future)

    # Create a function that iterates over each row in the df:
    my_function <- function(df, x) {
          x <- df
      for(i in 1:nrow(df)){ 
          x[i, ] <- df %>% 
              ##Give me only rows for 'name' on the current row 
              ##which are within the date window of interest
              filter(date <= date(df[i,"date"]) & 
                     date >= date(df[i,"date"]) - moving_window_days & 
                     name == df[i,"name"]
                     ) %>% 
              ##Now scale x and y on this date wondow
              mutate(x = percent_rank(x), 
                     y = percent_rank(y)
              ) %>% 
              ##Get rid of the rest of the rows - leave only the row we are looking at
              filter(date == date(df[i,"date"])) 
      }
          return(x)
    }

    plan(multiprocess) # make sure to always include this in a run of the code.

    # Divide df evenly into three separate dataframes:
    df1 %<-% my_function(df[1:7, ], df1)
    df2 %<-% my_function(df = df[(8 - moving_window_days):14, ], df2) # But from here on out, go back 4 days to include that data in the moving average calculation.
    df3 %<-% my_function(df = df[(15 - moving_window_days):20, ], df3)

# See if your computer is able to split df into 4 or 5 separate dataframes. 

    # Now bind the dataframes together, but get the indexing right:
    rbind(df1, df2[(nrow(df2) - 6):nrow(df2), ], df3[(nrow(df3) - 5):nrow(df3), ])

并行处理是优化代码以提高效率的众多方法之一。过去，正是这种技术显着为我加速了代码。它将程序的运行时间从一天半缩短到 3 或 4 小时!

现在，理想情况下，我们希望使用 apply 族和矩阵。这个答案只是我们可以加速代码的众多方法之一。此外，future 包允许我们在不学习新的循环结构的情况下并行处理，例如在 parallel 包中(尽管如此，它仍然是一个了不起的包)。

另请查看 Rcpp 包。学习它需要一些时间，但对于释放 C++ 的速度来说是不可思议的。

关于r - 在 R : script works, 中的移动日期窗口上缩放变量，但速度慢得令人无法接受。优化方法？ rstats，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45353784/

25

4

0

文章推荐： asp.net - 'ModelClientValidationRule' 类型存在于两个 dll 中

文章推荐： f# - 在连续传递风格和记忆化之间进行选择

文章推荐： python-2.7 - 如何在arch linux中用python 2完全替换python 3

文章推荐： symfony - 禁用奏鸣曲管理包 CRUD 中的操作

javascript - 使用 Javascript 缩放/缩放/调整多个图像大小的最佳方法？
我在 div 和 jquery ui slider 中有一个图像列表，当用户滑动栏时，图像应该调整大小/缩放(无论你想怎么调用它)，我尝试选择所有图像并更改 css 的宽度和使用 jquery 的高度
javascript - 工具提示随 d3 地理 map 缩放(缩放)
我正在制作一张具有缩放和平移功能的世界地图。我在某些城市上画了圆圈，圆圈的半径由数据决定。当鼠标悬停在这些圆圈上时，将出现一个工具提示来显示数据。代码结构为 //在此选择上调用缩放行为 - 让我们调
jQuery UI slider 小部件 + fancybox + 缩放/缩放
我正在使用 jquery UI slider (http://jqueryui.com/slider/)。我需要对整个站点进行缩放。使用 css 样式在 IE+Chrome im 中缩放 - “缩放
ios - 如何将 UIView 缩放(缩放)到给定的 CGPoint
我花了很多时间试图找到一种使用 CGAffineScale 将 View 转换为给定点的方法，包括摆弄 anchor 、在转换前后移动 View 的中心以及全面的谷歌搜索。我知道使用 UIScroll
android - 使用 onTouchEvent Android 旋转、缩放/缩放、拖动位图
我希望能够用手指旋转和缩放/缩放我的位图，我已经为此寻找了所有示例项目，但它们都与我的代码不匹配。这是我的 onTouchListener 代码。 public class MyView extend
html - 使用 CSS3 变换 scale() 缩放/缩放 DOM 元素及其占用的空间
在我的页面中间，我有一个 div 元素，其中包含一些内容(其他 div、图像等)。 before something inside another something
javascript - 缩放/缩放 Div 后在 Google Maps API v3 上使用绘图管理器？
我一直在尝试使用 google maps API V3 的绘图管理器(绘制矩形)。使用 -webkit-transform 缩放谷歌地图 Canvas (包含 div)后像这样 var transf
ios模拟器窗口缩放/缩放
这个问题在这里已经有了答案: How to resize the iPhone/iPad Simulator? (12 个答案) 关闭 5 年前。我正在编写 iOS 应用我使用 Xcode 6.
docker - 自动化微服务负载平衡/缩放
这几天一直在研究微服务，我想知道人们是如何着手自动化负载平衡和扩展这些东西的？我心中有一个特定的场景，我想实现什么，但不确定是否可行，或者我的想法有误。就这样吧…… 假设我有一个由 3 台名为 A、
FFMPEG 缩放、缩放和连接过滤器
我正在使用 ffmpeg for android 来制作 mp4 格式的视频。我无法让这个命令在 FFMPEG 中工作，基本上我正在尝试添加两个图像，缩放它们，添加缩放效果，最后将结果连接到一个视频文
opengl - 缩放、平移和旋转如何工作？
使用 OpenGL 我正在尝试绘制我校园的原始 map 。谁能向我解释一下平移、缩放和旋转通常是如何实现的？例如，通过平移和缩放，这仅仅是我调整我的视口(viewport)吗？所以我绘制并绘制了构
iphone - 缩放/旋转界面中的按钮
我需要在 iphone sdk 界面生成器中将按钮旋转 30 度，该怎么做？最佳答案您无法在 Interface Builder 中执行此操作，但代码非常简单。确保您已将 IB 中的按钮连接到
javascript - 检测触摸设备捏合程度(缩放)
假设默认级别等于“1”，是否可以检测触摸设备的捏合(缩放)级别？原因是我希望根据捏合级别禁用页面元素(显示:无)。如果可以将其放在一个设置缩放级别值的函数中，那就太好了，例如: var ZOOM =
javascript - 在鼠标位置缩放/缩放
我正在努力找出并确定如何根据这个例子放大我的鼠标位置。 (https://stackblitz.com/edit/js-fxnmkm?file=index.js) let node, scal
ios - UIWebView 缩放
我已将 UIWebView 的“scalesPageToFit”属性设置为 YES。它正在缩放，但是当页面加载时，内容的字体很小，不捏就无法阅读。我们可以将缩放比例设置为默认值吗？最佳答案这更多
mobile - 如何在图像上进行捏合/缩放
我仍在学习 jQuery mobile 的技巧，并且在 data-role="page"上放大和缩小图片/图像时遇到问题。有没有办法使用 jquery mobile 在 iPhone 上的图像上进行捏
python - 缩放/旋转成对平方欧氏距离的矢量化计算
给定一组 n 个维度为 d 的向量，存储在 (n,d) 数组中，以及第二组 m 相同维度的向量(存储在 (m,d) 数组中)我想计算向量之间的平方点距离，由大小为的某个矩阵 A 缩放>(d,d)。
jQuery 悬停功能缩放/缩放
我想知道是否有人可以指出我正确的方向。我使用 CSS3 过渡创建了缩放效果。将鼠标悬停在该对象上，它会转换为更大的版本。这看起来很棒并且效果很棒，但问题是这种效果在 IE 中不起作用，所以我需要在
javascript - 缩放/取消缩放时标记从其位置移动
mapbox-gl-js 版本:0.38.0在 ionic 2.2.11 上通过 npm repo 使用正如您在这张 gif 上看到的 https://giphy.com/gifs/ionic-an
android - 缩放 Activity
所以我花了几个小时在网上搜索帮助，但所有论坛和文档都没有向我正确解释我应该采取的最佳方式。目前我有一个具有 XML 相对布局的 Activity (背景设置为 map 图片)，我想实现多手势缩放功能

首页

博学

6Ren·AI

商城

r - 在 R : script works, 中的移动日期窗口上缩放变量，但速度慢得令人无法接受。优化方法？ rstats