- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我想在多台机器 - Windows 或 Ubuntu -(一个任务只在一台机器上)上安排和分发 R 脚本的执行(例如使用 RServe)。
我不想重新发明轮子,而是想使用一个已经存在的系统以最佳方式分配这些任务,理想情况下有一个 GUI 来控制脚本的正确执行。
1/是否有可用于此目的的 R 包或库?
2/一个似乎被广泛使用的库是带有 Apache Hadoop 的 mapReduce。我对这个框架没有经验。你会为我的目的建议什么安装/插件/设置?
编辑:以下是有关我的设置的更多详细信息:
我确实有一个充满机器(小型服务器或工作站)的办公室,这些机器有时也用于其他目的。我想使用所有这些机器的计算能力并在它们上分发我的 R 脚本。
我还需要一个调度程序,例如。一种在固定时间或定期安排脚本的工具。我同时使用 Windows 和 Ubuntu,但目前在其中一个系统上使用一个好的解决方案就足够了。最后,我不需要服务器来取回脚本的结果。脚本执行访问数据库、保存文件等操作,但不返回任何内容。如果有的话,我只想取回错误/警告。
最佳答案
如果你想做的是在你有物理访问权限的机器上分配并行执行的作业,我强烈推荐 foreach 的 doRedis 后端。您可以阅读 vignette PDF获取更多详细信息。要点如下:
Why write a doRedis package? After all, the foreach package already has available many parallel back end packages, including doMC, doSNOW and doMPI. The doRedis package allows for dynamic pools of workers. New workers may be added at any time, even in the middle of running computations. This feature is relevant, for example, to modern cloud computing environments. Users can make an economic decision to \turn on" more computing resources at any time in order to accelerate running computations. Similarly, modernThe doRedis Package cluster resource allocation systems can dynamically schedule R workers as cluster resources become available
如果运行 Hadoop 的机器专用于集群而不是借用,则 Hadoop 运行最佳。设置 Hadoop 也有相当大的开销,如果您需要 Hadoop 提供的 map/reduce 算法和分布式存储,那么值得付出努力。
那又怎样,你的配置到底是什么?您的办公室里是否满是要分配 R 作业的机器?你有专用集群吗?这将是基于 EC2 或其他“云”的吗?
细节决定成败,细节明确才能得到更好的答案。
如果您希望工作人员执行工作并将工作结果重新配置回一个主节点,您最好使用专用的 R 解决方案,而不是像 TakTuk 或 dsh 这样更通用的并行化系统工具。
关于r - R脚本的分布式调度系统,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8664630/
我有这个代码: System.err.print("number of terms = "); System.out.println(allTerms.size()); System.err
我有以下问题:在操作系统是 Linux 的情况下和在操作系统是 MacOs 的情况下,我必须执行不同的操作。 所以我创建了以下 Ant 脚本目标: /u
我正在调用 system("bash ../tools/bashScript\"This is an argument!\"&"),然后我正在调用 close(socketFD) 直接在 system
使用最初生成的随机元素来约束随机数组的连续元素是否有效。 例如:我想生成一组 10 个 addr、size 对来模拟典型的内存分配例程并具有如下类: class abc; rand bit[5:0
我正在创建一个必须使用system(const char*)函数来完成一些“繁重工作”的应用程序,并且我需要能够为用户提供粗略的进度百分比。例如,如果操作系统正在为您移动文件,它会为您提供一个进度条,
我即将编写一些项目经理、开发人员和业务分析师会使用的标准/指南和模板。目标是更好地理解正在开发或已经开发的解决方案。 其中一部分是提供有关记录解决方案的标准/指南。例如。记录解决/满足业务案例/用户需
在开发使用压缩磁盘索引或磁盘文件的应用程序时,其中部分索引或文件被重复访问(为了论证,让我们说一些类似于 Zipfian 分布的东西),我想知道什么时候足够/更好地依赖操作系统级缓存(例如,Debia
我们编写了一个 powershell 脚本,用于处理来自内部系统的图像并将其发送到另一个系统。现在,业务的另一部分希望加入其中,对数据进行自己的处理,并将其推送到另一个系统。打听了一下,公司周围有几个
我正在尝试朗姆酒我的应用程序,但我收到以下错误:System.Web.HttpUnhandledException:引发了“System.Web.HttpUnhandledException”类型的异
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
所以我在其他程序中没有收到此错误,但我在这个程序中收到了它。 这个程序是一个我没有收到错误的示例。 #include int main() { system("pause"); } // en
我在 c# System.URI.FormatExption 中遇到问题 为了清楚起见,我使用的是 Segseuil 的 Matlab 方法,并且它返回一个图片路径 result。我想为其他用户保存此
我正在尝试像这样设置文本框的背景色: txtCompanyName.BackColor = Drawing.Color.WhiteSmoke; 它不喜欢它,因为它要我在前面添加系统,例如: txtCo
请帮助我解决 System.StackOverflowException我想用 .aspx 将记录写入数据库我使用 4 层架构来实现这一切都正常但是当我编译页面然后它显示要插入数据的字段时,当我将数据
我使用了一些通常由系统调用的API。 因此,我将 android:sharedUserId="android.uid.system" 添加到 manifest.xml, 并使用来自 GIT 的 And
我正在尝试创建一个小型应用程序,它需要对/system 文件夹进行读/写访问(它正在尝试删除一个文件,并创建一个新文件来代替它)。我可以使用 adb 毫无问题地重新挂载该文件夹,如果我这样做,我的应用
我想从没有 su 的系统 priv-app 将/system 重新挂载为 RW。如何以编程方式执行此操作?只会用 Runtime.getruntime().exec() 执行一个 shell 命令吗
我正在尝试制作一个带有登录系统的程序我对此很陌生,但我已经连续工作 8 个小时试图解决这个问题。这是我得到的错误代码 + ServerVersion 'con.ServerVersion' threw
当我“构建并运行”Code::Blocks 中的程序时,它运行得非常好!但是当我从“/bin”文件夹手动运行它时,当它试图用 system() 调用“temp.bat”时,它会重置。这是为什么?它没有
我想使用 system/pipe 命令来执行具有特殊字符的命令。下面是示例代码。通过系统/管道执行命令后,它通过改变特殊字符来改变命令。我很惊讶地看到系统命令正在更改作为命令传递的文本。 run(ch
我是一名优秀的程序员,十分优秀!