R - 矢量化条件替换-6ren

R - 矢量化条件替换

转载作者：行者123 更新时间：2023-12-02 07:40:45

25

4

您好，我正在尝试操作一个数字列表，我想在没有 for 循环的情况下使用 R 中的快速 native 操作来这样做。操作的伪代码是:

By default the starting total is 100 (for every block within zeros)

From the first zero to next zero, the moment the cumulative total falls by more than 2% replace all subsequent numbers with zero.

Do this far all blocks of numbers within zeros

The cumulative sums resets to 100 every time

例如，如果以下是我的数据:

d <- c(0,0,0,1,3,4,5,-1,2,3,-5,8,0,0,-2,-3,3,5,0,0,0,-1,-1,-1,-1);

结果将是:

0 0 0 1 3 4 5 -1 2 3 -5 0 0 0 -2 -3 0 0 0 0 0 -1 -1 -1 0

目前我有一个带有 for 循环的实现，但由于我的向量非常长，性能很差。

提前致谢。

这是一个运行示例代码:

d <- c(0,0,0,1,3,4,5,-1,2,3,-5,8,0,0,-2,-3,3,5,0,0,0,-1,-1,-1,-1);
ans <- d;
running_total <- 100;
count <- 1;
max <- 100;
toggle <- FALSE;
processing <- FALSE;

for(i in d){
  if( i != 0 ){  
       processing <- TRUE; 
       if(toggle == TRUE){
          ans[count] = 0;  
       }
       else{
         running_total = running_total + i;
  
          if( running_total > max ){ max = running_total;}
          else if ( 0.98*max > running_total){
              toggle <- TRUE;  
          }
      }
   }

   if( i == 0 && processing == TRUE )
   { 
       running_total = 100; 
       max = 100;
       toggle <- FALSE;
   }
   count <- count + 1;
}
cat(ans)

最佳答案

我不确定如何将您的循环转换为矢量化操作。但是，有两个相当简单的选项可以提高性能。第一种是简单地将循环放入 R 函数中，并使用 compiler 包对其进行预编译。第二个稍微复杂一些的选项是将 R 循环转换为 c++ 循环，并使用 Rcpp 包将其链接到 R函数。然后调用 R 函数，将其传递给快速的 c++ 代码。我展示了这些选项和时间。我非常感谢来自 Rcpp listserv 的 Alexandre Bujard 的帮助，他帮助我解决了一个我不明白的指针问题。

首先，这是作为函数的 R 循环，foo.r。

## Your R loop as a function
foo.r <- function(d) {
  ans <- d
  running_total <- 100
  count <- 1
  max <- 100
  toggle <- FALSE
  processing <- FALSE

  for(i in d){
    if(i != 0 ){
      processing <- TRUE
      if(toggle == TRUE){
        ans[count] <- 0
      } else {
        running_total = running_total + i;
        if (running_total > max) {
          max <- running_total
        } else if (0.98*max > running_total) {
          toggle <- TRUE
        }
      }
    }
    if(i == 0 && processing == TRUE) {
      running_total <- 100
      max <- 100
      toggle <- FALSE
    }
    count <- count + 1
  }
  return(ans)
}

现在我们可以加载compiler包并编译函数并将其命名为foo.rcomp。

## load compiler package and compile your R loop
require(compiler)
foo.rcomp <- cmpfun(foo.r)

这就是编译路线所需的全部内容。这都是 R 并且显然非常简单。现在对于 c++ 方法，我们使用 Rcpp 包以及 inline 包，它允许我们“内联” c++ 代码。也就是说，我们不必制作源文件并编译它，我们只需将它包含在 R 代码中，编译就会为我们处理。

## load Rcpp package and inline for ease of linking
require(Rcpp)
require(inline)

## Rcpp version
src <- '
  const NumericVector xx(x);
  int n = xx.size();
  NumericVector res = clone(xx);
  int toggle = 0;
  int processing = 0;
  int tot = 100;
  int max = 100;

  typedef NumericVector::iterator vec_iterator;
  vec_iterator ixx = xx.begin();
  vec_iterator ires = res.begin();
  for (int i = 0; i < n; i++) {
    if (ixx[i] != 0) {
      processing = 1;
      if (toggle == 1) {
        ires[i] = 0;
      } else {
        tot += ixx[i];
        if (tot > max) {
          max = tot;
        } else if (.98 * max > tot) {
            toggle = 1;
          }
      }
    }

   if (ixx[i] == 0 && processing == 1) {
     tot = 100;
     max = 100;
     toggle = 0;
   }
  }
  return res;
'

foo.rcpp <- cxxfunction(signature(x = "numeric"), src, plugin = "Rcpp")

现在我们可以测试我们是否得到了预期的结果:

## demonstrate equivalence
d <- c(0,0,0,1,3,4,5,-1,2,3,-5,8,0,0,-2,-3,3,5,0,0,0,-1,-1,-1,-1)
all.equal(foo.r(d), foo.rcpp(d))

最后，通过重复 10e4 次来创建一个更大版本的 d。然后我们可以运行三个不同的函数，纯 R 代码，编译后的 R 代码，以及链接到 c++ 的 R 函数> 代码。

## make larger vector to test performance
dbig <- rep(d, 10^5)

system.time(res.r <- foo.r(dbig))
system.time(res.rcomp <- foo.rcomp(dbig))
system.time(res.rcpp <- foo.rcpp(dbig))

在我的系统上，给出:

> system.time(res.r <- foo.r(dbig))
   user  system elapsed 
  12.55    0.02   12.61 
> system.time(res.rcomp <- foo.rcomp(dbig))
   user  system elapsed 
   2.17    0.01    2.19 
> system.time(res.rcpp <- foo.rcpp(dbig))
   user  system elapsed 
   0.01    0.00    0.02

已编译的 R 代码在 250 万向量上运行时所用时间约为未编译 R 代码的 1/6，仅需 2 秒。 c++ 代码比编译后的 R 代码快几个数量级，只需 0.02 秒即可完成。除了初始设置之外，基本循环的语法在 R 和 c++ 中几乎相同，因此您甚至不会失去清晰度。我怀疑即使您的部分或全部循环可以在 R 中进行矢量化，您也很难超越链接到 c++ 的 R 函数的性能。最后，只是为了证明:

> all.equal(res.r, res.rcomp)
[1] TRUE
> all.equal(res.r, res.rcpp)
[1] TRUE

不同的函数返回相同的结果。

关于R - 矢量化条件替换，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11377677/

25

4

0

文章推荐： graphics - 用于视锥体剔除的松散八叉树 - 需要一些建议

文章推荐： php - 用 php 搜索和替换 base64 图像字符串

string - 列表[字符串] -> 矢量[矢量[字符]]
我正在尝试将字符串列表转换为字符向量的向量: import collection.breakOut def stringsToCharVectors(xs: List[String]) = x
python - Pytorch:如何从 2D 矢量/图像预测 1D 矢量？
我正在尝试使用 Pytorch 通过 2D 向量(嘈杂语音帧序列)的回归来预测 1D 向量(干净语音数据帧) data) - 之前已经完成过。帧序列为帧提供时间上下文，以更准确地预测干净帧。这些向量可
c# - 获取错误 "Operator ' + =' is ambiguous on operands of type ' 矢量 3' and ' 矢量 2'"
在尝试构建时，我收到此错误: Operator '+=' is ambiguous on operands of type 'Vector3' and 'Vector2' 这是问题出处的脚本代码: u
R圆形阵列/矢量
是否存在实现 FIFO 意义上的循环数组或向量的 R 包？假设我们有这个数组: 2 4 7 1 当在位置 1 插入一个新的观察值(比如 3)时，我希望第 n 个元素被第 n-1 个元素替换: 3 2
c# - 矢量/角度数学
我在游戏中有两个对象，为此可以将其视为 2d 平面上的点，但我使用 Vector3s，因为游戏本身是 3d。我有一个游戏相机，我想将其与两个物体垂直(也在平面上)对齐，以便它们都在相机的视野中。由于
python - 采样音频不保留波(矢量)!
我做了一个Telegram robot ，它的工作之一是从音频文件创建样本。现在对于发送给它的大多数音频，样本都非常好；像这样: 但是，对于一些音频，样本看起来有点奇怪: 如您所见，此文件中的波形未显
JavaScript + JQuery 矢量 map
由于对 JavaScript 非常陌生，我在使用 JQuery VectorMaps 时遇到了以下问题: 当我用这种语法突出显示一个国家时，一切都很完美: jQuery('#vmap').vector
javascript - ChartJS 矢量 map
我正在使用 ChartJS 在我的网站中包含一些 map ，但 ChartJS 库没有我想要的 map 。我想知道这种类型的矢量 map 是否很容易在网上免费找到，还是必须从头开始构建？ Chart
vector - Clojure 列表 -> 矢量
我需要创建一个函数。在此范围内，我需要发生以下事情: List 1: '(a 5 6) List 2: '(c 8 10) List 3: '(d 4 9) 以上是列表。我需要忽略每个列表的第一列(这
math - 计算垂直于由点和真北航向描述的平面的 3d 矢量
我在地球表面有一个点，我正在将其从地球中心转换为向量。我有一个以度数表示的真北航向，描述了该点将在地球表面行进的路径。我需要计算一个向量，该向量垂直于该点沿地球表面的路径所创建的平面。我尝试
javascript - 矢量 map 中不同端口的不同样式
大家好，这是我的 JavaScript 代码，用于为矢量 map 制作 ip 标记以显示在线 ip.. 所有 ips 都有 3 个不同的端口，例如:ip1:1020 或 ip2:5050 或 ip3:
javascript - 相机 lookAt 矢量
我正在使用 Three.js 透视相机，我需要了解相机所注视的点。如何使用相机的矩阵/旋转向量计算它？最佳答案相机向下看它的内部负 z 轴。所以选择相机负 z 轴上的任意点，如下所示: var
ios - Scenekit - 矢量/切线置换贴图
重要提示:请注意这个问题是关于 VECTOR map 的。不是高度图。我正在尝试在 Scenekit 中实现 Vector 位移，如 apple 演示文稿中所述: https://www.youtu
python - 是否可以更新 Doc2Vec 矢量？
我正在处理一个稳定增长的语料库。我使用用 Python 实现的 Doc2Vec 来训练我的文档向量。是否可以更新文档向量？我想使用文档向量进行文档推荐。最佳答案单个向量可以更新，但是 gens
matlab - 衡量两个不同(矢量)信号的相似度
我正在努力寻找一种比较(测量)两个不同信号之间相似性的好方法。我不想找出一个信号到另一个信号的时间延迟，但我想看看它们之间有何相似之处。例如，我有以下两个信号，比如说 s1 ans s2。这两个信号看
python - 叠加在图上的 Quiver 矢量
我想绘制 y 与 x 线，然后在它上面我想绘制向量。我可以使用 matplotlib 的 plot 和 quiver 函数来做到这一点。但是，矢量将始终绘制在线的后面，而不是在线的顶部。也就是说，线将
快速矢量-矢量 (a * a^H) 乘法的算法？
包含复数的向量 a 的大小为 N×1。任务是找到乘法a * a^HA (N-by-N) >，其中 H 是 Hermitian 算子(共轭转置)，因此矩阵 A 是 Hermitian。有没有比 O(N
android - KSOAP2 处理复杂响应(矢量)
三天来，我一直在努力从我的响应中获取复杂类型(列表)，但总是收到 ClassCastException D/SOAPEnvelope(1552): Error: java.lang.ClassCast
android osmdroid 矢量 map
在我的 android 项目中，我想要离线 map 。使用图 block ，我的 map 占用 500 MB 的空间，我还想在 map 上离线搜索地址。我认为减小尺寸并使搜索成为可能的唯一方法是矢量
Android Compose - 如何平铺/重复位图/矢量？
什么是 Android Compose 方法来平铺图像以用小图案填充我的背景？没有旋转的位图的天真方法可能是这样的: @Composable fun TileImage() { val pa

首页

博学

6Ren·AI

商城

R - 矢量化条件替换