- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我想在多台机器 - Windows 或 Ubuntu -(一个任务只在一台机器上)上安排和分发 R 脚本的执行(例如使用 RServe)。
我不想重新发明轮子,而是想使用一个已经存在的系统以最佳方式分配这些任务,理想情况下有一个 GUI 来控制脚本的正确执行。
1/是否有可用于此目的的 R 包或库?
2/一个似乎被广泛使用的库是带有 Apache Hadoop 的 mapReduce。我对这个框架没有经验。你会为我的目的建议什么安装/插件/设置?
编辑:以下是有关我的设置的更多详细信息:
我确实有一个充满机器(小型服务器或工作站)的办公室,这些机器有时也用于其他目的。我想使用所有这些机器的计算能力并在它们上分发我的 R 脚本。
我还需要一个调度程序,例如。一种在固定时间或定期安排脚本的工具。我同时使用 Windows 和 Ubuntu,但目前在其中一个系统上使用一个好的解决方案就足够了。最后,我不需要服务器来取回脚本的结果。脚本执行访问数据库、保存文件等操作,但不返回任何内容。如果有的话,我只想取回错误/警告。
最佳答案
如果你想做的是在你有物理访问权限的机器上分配并行执行的作业,我强烈推荐 foreach 的 doRedis 后端。您可以阅读 vignette PDF获取更多详细信息。要点如下:
Why write a doRedis package? After all, the foreach package already has available many parallel back end packages, including doMC, doSNOW and doMPI. The doRedis package allows for dynamic pools of workers. New workers may be added at any time, even in the middle of running computations. This feature is relevant, for example, to modern cloud computing environments. Users can make an economic decision to \turn on" more computing resources at any time in order to accelerate running computations. Similarly, modernThe doRedis Package cluster resource allocation systems can dynamically schedule R workers as cluster resources become available
如果运行 Hadoop 的机器专用于集群而不是借用,则 Hadoop 运行最佳。设置 Hadoop 也有相当大的开销,如果您需要 Hadoop 提供的 map/reduce 算法和分布式存储,那么值得付出努力。
那又怎样,你的配置到底是什么?您的办公室里是否满是要分配 R 作业的机器?你有专用集群吗?这将是基于 EC2 或其他“云”的吗?
细节决定成败,细节明确才能得到更好的答案。
如果您希望工作人员执行工作并将工作结果重新配置回一个主节点,您最好使用专用的 R 解决方案,而不是像 TakTuk 或 dsh 这样更通用的并行化系统工具。
关于r - R脚本的分布式调度系统,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8664630/
我有一个带有一些功能的perl对象。每个功能从主程序中调用一次。我想并行运行某些功能以节省时间。由于某些功能取决于先前功能的结果,因此我无法将它们全部一起运行。 我想到了这样的事情: 对于每个函数,保
首先,我的代码在这里: import schedule # see https://github.com/dbader/schedule import crawler def job(): p
从 11 月 1 日开始,我必须使用quartz调度程序每4个月安排一次任务。我使用 cronExpression 来实现同样的目的。但 cronExpression 每年都会重置。所以我的任务将在
我有以下代码块,它调用两个请求,但略有延迟。 final ActorRef actor1 = getContext().actorOf( ActorClass.prop
考虑到 Linux 的情况,我们为每个用户堆栈都有一个内核堆栈,据我所知,每当发生上下文切换时,我们都会切换到当前进程的内核模式。 这里我们保存当前进程的当前状态,寄存器,程序数据等,然后调度器(不确
我有将东西移植到 OpenBSD 的奇怪爱好。我知道它有 pthreads 问题,但在 2013 年 5 月发布版本之前我不会升级。我使用的是 5.0,我对 pthreads 还很陌生。我已经学习了
给定一组任务: T1(20,100) T2(30,250) T3(100,400) (execution time, deadline=peroid) 现在我想将截止日期限制为 Di = f * Pi
使用 Django 开发一个小型日程安排 Web 应用程序,在该应用程序中,人们被分配特定的时间与他们的上级会面。员工存储为模型,与表示时间范围和他们有空的星期几的模型具有 OneToMany 关系。
我想了解贪婪算法调度问题的工作原理。 所以我一直在阅读和谷歌搜索一段时间,因为我无法理解贪心算法调度问题。 我们有 n 个作业要安排在单个资源上。作业 (i) 有一个请求的开始时间 s(i) 和结束时
这是流行的 El Goog 问题的变体。 考虑以下调度问题:有 n 个作业,i = 1..n。有 1 台 super 计算机和无限的 PC。每个作业都需要先经过 super 计算机的预处理,然后再在P
假设我有一个需要运行多次的蜘蛛 class My_spider(Scrapy.spider): #spider def 我想做这样的事 while True: runner = Cra
我已将 podAntiAffinity 添加到我的 DeploymentConfig 模板中。 但是,pod 被安排在我预计会被规则排除的节点上。 我如何查看 kubernetes 调度程序的日志以了
我已经使用 React - Redux - Typescript 堆栈有一段时间了,到目前为止我很喜欢它。但是,由于我对 Redux 很陌生,所以我一直在想这个特定的话题。 调度 Redux 操作(和
我想按照预定的计划(例如,周一至周五,美国东部时间晚上 9 点至 5 点)运行单个 Azure 实例以减少账单,并且想知道最好的方法是什么。 问题的两个部分: 能否使用服务管理 API [1] 按预定
假设最小模块安装(为了简单起见),Drupal 的 index.php 中两个顶级功能的核心“职责”是什么? ? drupal_bootstrap(DRUPAL_BOOTSTRAP_FULL); me
我正在尝试使用 Racket(以前称为 PLT Scheme)连接 URL 调度。我查看了教程和服务器文档。我不知道如何将请求路由到相同的 servlet。 具体例子: #lang 方案 (需要网络服
我想在 Airflow (v1.9.0) 上运行计划。 我的DAG需要在每个月底运行,但我不知道如何编写设置。 my_dag = DAG(dag_id=DAG_ID, cat
我正在尝试在“httpTrigger”类型函数的 function.json 中设置计划字段,但计时器功能似乎未运行。我的目标是拥有一个甚至可以在需要时进行调度和手动启动的功能,而不必仅为了调度而添加
我正在尝试制定每周、每月的 Airflow 计划,但不起作用。有人可以报告可能发生的情况吗?如果我每周、每月进行安排,它就会保持静止,就好像它被关闭一样。没有错误信息,只是不执行。我发送了一个代码示例
我希望每两周自动更新一次我的表格。我希望我的函数能够被 firebase 调用。 这可能吗? 我正在使用 Angular 2 Typescript 和 Firebase。 最佳答案 仅通过fireba
我是一名优秀的程序员,十分优秀!