r - 优化列表函数以避免 R 中的循环-6ren

r - 优化列表函数以避免 R 中的循环

转载作者：行者123 更新时间：2023-12-02 18:21:55

26

4

我正在使用 R 中的大量值。我需要对列表的每个元素应用一些函数。我使用的列表是 i1 并由以下代码生成:

i1=list(0)
i1[1:120000]=runif(120000,min = 10000,max = 100000)

在i1中，我必须应用一些函数才能使用列表中的每个值作为输入来获取新的数据帧。接下来的函数是:f_1 通过使用某些条件，使用 i1 中的每个值作为输入来计算新值。在此函数中，我使用了一些条件来获取值。该功能如下:

f_1=function(x)
{
  y=ifelse((x/18)>20,x-(x/18),ifelse(x>20,x-20,ifelse(x==0,0,x)))
  return(y)
}

第二个函数是f_2。该函数使用 f_1 作为输入，它由一个 for 结构组成，其中有 160 次迭代。在此函数中创建一个空向量。然后，通过应用 f_1 函数来增长向量。 f_2 的最终结果是一个数据帧，其中包含 for 结构中生成的所有元素。该功能如下:

f_2=function(v)
{
  x=c()
  y=v
  x[1]=y
  for(i in 2:160)
  {
    x[i]=f_1(x[i-1])
  }
  x=x[!duplicated(x)]
  x=c(x,0)
  z=as.data.frame(t(abs(diff(x))))
  return(z)
}

最后，要将 f_1 和 f_2 应用于 i1，我使用包 plyr 来应用将功能添加到列表中。我为该事件构建了这个函数:

compute=function(x)
{
  y=f_2(x)
  return(y)
}

通过使用compute，我可以将函数应用于列表中的所有元素。我使用此代码:

L2=llply(i1,compute)

一切工作正常，但需要很长时间才能产生最终结果:

system.time(llply(i1,compute))
   user  system elapsed 
 436.71    0.92  447.70

我认为这个过程太慢的原因与函数f_2有关，因为它内部使用了循环。我已经寻找了一些想法来避免这种结构，但我不清楚如何更改 f_2 以提高效率。请问您能提供一些解决此问题的指导吗？我了解函数，但在本例中，我在函数内部使用了 for 来创建我想要的结果。

感谢您的帮助!

最佳答案

您的代码存在几个问题。例如，您犯了在循环中增长对象的经典错误。

但是，如果您对代码的性能不满意，则应该开始对其进行分析:

Rprof()
L2=llply(i1,compute)
Rprof(NULL)
summaryRprof()$by.self
#                       self.time self.pct total.time total.pct
#"ifelse"                    3.38    35.58       4.06     42.74
#"f_2"                       2.28    24.00       9.48     99.79
#"f_1"                       1.46    15.37       5.52     58.11
#"as.vector"                 0.86     9.05       0.86      9.05
#"as.data.frame.matrix"      0.32     3.37       1.44     15.16
#"paste0"                    0.20     2.11       0.22      2.32
#"is.na"                     0.20     2.11       0.20      2.11
#</snip>

您会看到大部分时间都花在 ifelse 、 as.vector 和 as.data.frame.matrix 上。 as.vector 的调用位置不太明显^[1]，但其他两个很明显。

使用 if 和 else 代替 ifelse 可以获得稍微更好的性能，但没有多大帮助。我会使用 Rcpp 将 f1 和 f2 中的 for 循环转换为编译代码(使用 RStudio 非常简单)。显然你需要工具链，即安装 Rtools在 Windows 上。

#include <Rcpp.h>
using namespace Rcpp;

double f1 (const double x) {
  if((x/18)>20) return x-(x/18); 
  if(x>20) return x-20; 
  if(x==0) return 0; 
  return x; 
}

// [[Rcpp::export]]
NumericVector f2_1 (const double init, const int n){ 
  NumericVector res(n);
  res(0) = init;
  for (int i=1; i<n; i++) res(i) = f1(res(i-1));
  return res;
}

这比提出矢量化纯 R 解决方案(假设存在)要快。

我们可以将 f2 的其余部分定义为:

f_2a=function(v)
{
  x = f2_1(v, 160)
  x=x[!duplicated(x)]
  x=c(x,0)
  z=abs(diff(x))
  return(z)
}

请注意我是如何省略 t 和 as.data.frame 的，因为如果性能很重要，则应避免使用 data.frames。它们的设计更多的是为了方便而不是为了性能。向量可以存储单行全数字 data.frame 的等效信息，但我无法想象返回单行 data.frame 列表的好理由。

现在我们调用该函数:

L2a = lapply(i1, f_2a)

让我们测试一下结果是否相等:

all.equal(L2[[1]], as.data.frame(t(L2a[[1]])))
#[1] TRUE

现在比较时间:

system.time(llply(i1,compute))
# user  system elapsed 
#13.91    0.00   13.93 

system.time(lapply(i1, f_2a))
#user  system elapsed 
#0.26    0.00    0.27

<小时/>

[1] 它在 as.data.frame.matrix 中的循环中调用，将矩阵拆分为列向量列表。

关于r - 优化列表函数以避免 R 中的循环，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36369123/

26

4

0

文章推荐： haskell - 将 --reinstall 标志与 cabal-dev 一起使用

文章推荐： Symfony2 DQL 如何连接 OneToMany 关系中的最后一行

文章推荐： neo4j - 删除neo4j中重复的节点及其关系

Python 这段代码做了什么？列表=列表[列表!=值]
如标题所示，ans_list是一个答案列表，ans_index是一个数字(答案在词汇表中的索引，但与atm无关) 这里生成的 tree.anslist 是什么？ (例如，仅针对第一个)，忽略迭代。 f
MySQL 列表 IN 列表
我目前将用户的输入存储在逗号分隔的列表中，如下所示: Userid | Options 1 | 1,2,5 用户在一个数组形式中勾选一组选项，然后用逗号连接起来 1,2,5 然后 MySQ
MySQL 列表 IN 列表
我目前将用户的输入存储在逗号分隔的列表中，如下所示: Userid | Options 1 | 1,2,5 用户在一个数组形式中勾选一组选项，然后用逗号连接起来 1,2,5 然后 MySQ
list - 我怎样才能完全展平一个列表(列表(列表)......)
我想知道如何完全展平列表和包含它们的东西。除其他外，我想出了一个解决方案，它可以将具有多个元素的东西滑倒并将它们放回原处，或者在滑倒后将具有一个元素的东西拿走。这与 How do I “flatte
list - 我怎样才能完全展平一个列表(列表(列表)......)
我想知道如何完全展平列表和包含它们的东西。除其他外，我想出了一个解决方案，它可以将具有多个元素的东西滑倒并将它们放回原处，或者在滑倒后将带有一个元素的东西拿走。这与 How do I “flatte
java - 列表<列表<字符串>>到字符串[][]
这个问题已经有答案了: Convert nested list to 2d array (3 个回答) 已关闭 7 年前。 java中有没有快捷方式可以转换 List> 到 String[][] ？
java - 列表<列表<对象>>排序
我在排序时遇到问题 List> 。我创建了一个自定义比较器，在其中编写了对数据进行排序的代码。 public class CustomComparator implements Comparator
java - 列表数组列表转换
这个问题已经有答案了: 已关闭10 年前。 Possible Duplicate: Java Generics: Cannot cast List to List? 我只是想知道为什么下面的java代
c# - 列表<逗号分隔的字符串> => 列表<字符串>?
试图想出一个 LINQy 方法来做到这一点，但我什么也没想到。我有一个对象列表<>，其中包含一个属性，该属性是逗号分隔的字母代码列表: lst[0].codes = "AA,BB,DD" lst[1
python - 列表 += 元组与列表 = 列表 + 元组
假设我有这些任务: points = [] point = (1, 2) 我怎么会这样做: points += point 它工作得很好，并且给了我点 = [1, 2]。但是，如果我这样做: poin
scala - 将列表[任务[列表[A]]]转换为任务[列表[A]]
如何在 scala 中将 List[Task[List[Header]]] 类型转换为 Task[List[Header]]。我有一个方法返回 Task[List[Header]] 并多次调用 do
java - 如何在Java中获取二维列表的元素？例如，列表<列表<整数>>
如何在 Java 中查找二维列表的元素？我有一个参数为 List> 的函数我想知道如何找到这个列表的行和列。最佳答案如果你喜欢 List> obj 然后你就可以像这样访问 obj.get(cur
java - 列表<列表没有按预期工作
分配 List到 List工作正常。分配 List>到 List>不编译。代码 public class Main { public static void main(String[] a
java - 列表<可序列化> vs 列表
我正在用 Java 编写一个方法，该方法必须接收并迭代 Serializable 的 List。有什么区别: public void myMethod(List list) { } 和 public
java - 通知网格/列表/树内网格/列表/树的更改
我看到很多人想用 mvvm 更新网格/列表/树的一部分，但他们不想刷新整个列表。对于所有遇到此问题的人，我做了以下示例。希望这对你有用。最佳答案这是一个简单的例子。整个代码中最重要的是: Bi
C++ 列表到 Python 列表
我正在为现有的 C++ 库编写包装器，该库使用列表，其中 T 是自定义结构。我被建议使用 vector 而不是列表，但我试图避免修改库。为了更好地理解这个场景，我做了一个简单的应用程序，使用一个列表
java - 列表 VS 列表<基础>
List list List list 这两种声明有什么区别吗？谢谢，最佳答案是的。 List可以包含所有派生自 Base 的不同事物的混合物. List包含同质项(从某种意义上说，它们必须全部
Java 泛型 : List, 列表<对象>、列表
有人可以尽可能详细地解释以下类型之间的区别吗？ List List List 让我更具体一点。我什么时候想使用 // 1 public void CanYouGiveMeAnAnswer(List l
python - 是否有任何 python 模块可以计算(列表，列表)元组的频率？
我有一个元组列表，每个元组都是一对列表。所以我的数据看起来像: mylist = [(['foo', 'bar'], ['bar', 'bar']),(['bar', 'bar'],['bar', '
list - 给定一个 (a * b) 列表，返回一个 (a * b list) 列表
也许是一个时髦的标题，但我遇到了以下问题: 给定一个类型为 (a * b) list 的列表，我想创建一个类型为 (a * b list) list 的新列表。一个例子: 给定列表 let testL

首页

博学

6Ren·AI

商城

r - 优化列表函数以避免 R 中的循环