gpt4 book ai didi

algorithm - R 中存在哪些并行算法,处理大数据

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:49:45 25 4
gpt4 key购买 nike

我正在尝试找出 CRAN/github/R-Forge 上的 R 或 R 包中存在哪些统计/数据挖掘算法,这些算法可以在一台服务器上并行处理大型数据集,也可以按顺序处理,而不会遇到问题内存问题或同时在多台机器上工作。这是为了评估我是否可以轻松地将它们移植到 ff/ffbase 中,例如 ffbase::bigglm.ffdf。

我想将它们分成 3 个部分:

  1. 并行更新或处理参数估计的算法

  2. 按顺序工作的算法(在 R 中获取数据但只使用 1 个进程并且只有 1 个进程更新参数)

  3. 处理部分数据

我想排除简单的并行化,例如通过超参数优化。交叉验证。还有其他指向这些模型/优化器或算法的指针吗?也许贝叶斯?也许是一个名为 RGraphlab (http://graphlab.org/) 的包?

最佳答案

你读过 High Performance Computing 了吗? CRAN 上的任务 View ?

它涵盖了您提到的许多要点,并概述了这些领域的软件包。

关于algorithm - R 中存在哪些并行算法,处理大数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13569884/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com