- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我的 Heroku Rails 应用维护着一个经常变化的大型关键字列表。
我想派生出 N 个工作人员,这些工作人员将平均分配这个关键字列表并对其进行处理,直到它们重新启动(每次关键字列表更改时我都会重新启动它们)。重新启动后,它们会再次划分关键字并流失。
例如:假设我有 1,000 个关键字。
工作人员基本上只是为他们的关键字集打开与 Twitter 的连接,并处理与这些关键字匹配的传入推文。
关于如何设置 Procfile 并在 N 个工作人员之间委托(delegate) X 关键字有什么想法吗?
这是一个仅用于演示的天真/伪手动方法。但是,我希望能够产生任意数量的工作人员,这些工作人员会自动在他们之间拆分关键字。
简介:
keywordstreamer0: bundle exec ruby keyword_streamer.rb 0
keywordstreamer1: bundle exec ruby keyword_streamer.rb 1
keyword_streamer.rb
streamer_id = ARGV.shift # 0 or 1
# Split all keywords into array of two groups and take the group
# that matches this worker id (so the two workers take different groups)
keywords = Keyword.all.split_into_groups_of(2)[streamer_id]
# Example work loop
TwitterStream.track(keywords).each do |incoming_tweet|
process(incoming_tweet)
end
然后,在我的应用中,当我需要重新启动我的关键字 worker 时:
["keywordstreamer0", "keywordstreamer1"].each do |streamer|
restart(streamer)
end
我希望能够产生 N 数量的这些 worker ,但我在分配解决方案时遇到了问题。如果有任何高级概述建议,我将不胜感激!
最佳答案
如果您一次只处理一个关键字,没有特定的顺序或分组,您可以只使用队列。
每个工作人员只需从队列中取出下一个关键字(或者可能是下一批关键字,以提高性能),完成工作,然后将结果保存在某个地方。您无需担心工作负载的划分问题,因为工作人员会在准备就绪时简单地请求更多工作,从而允许您扩展到 N 个工作人员,而无需每个工作人员都知道可用工作负载的总大小。
您可以通过多种方式为您的数据实现队列。 AMQP 和 Redis 是我之前使用过的几个更专业的工具,但这并不是一个详尽的列表。
我要猜测一下,因为您的示例代码中有 Keyword.all
,并且您使用的是 Heroku,所以您使用的是 postgres。您也可以在 postgres 中模拟一个队列而不会有太多困难,尽管它显然不会像专门构建的队列那样执行。
这是一种实现方式:
为您的关键字添加一个status
列。它将有 3 个值:就绪、进行中和完成。状态列的默认值为就绪。
您的工作人员的伪代码如下所示:
loop do
keyword = Keyword.where(:status => "ready").limit(1).first
keyword.update_attributes!(:status => "in-progress")
result = process(keyword)
save_result_somewhere(result)
keyword.update_attributes!(:status => "complete")
end
我省略了一堆实现细节,例如优雅地处理空队列、队列的初始设置、批处理等等。但这就是它的要点。对于中等规模的 N,可能至少有 10 个或更多的 worker ,这应该足以执行。除此之外,您可能需要考虑一种专门构建的排队技术。
设置好队列后,每个工作人员都是相同且自主的。只需 heroku ps:scale worker=N
即可完成!
关于ruby-on-rails - 我将如何产生 Heroku 工作人员来分而治之关键字列表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13182571/
sanitize 是什么意思在 Rails 中是什么意思? 我正在阅读 CanCanCan 的文档.它说: When using strong_parameters or Rails 4+, you
在过去的几个月里,我感觉自己对 Ruby on Rails (RoR) 开发的了解达到了极限。我为大/小客户和 friend /爱好项目开发了大大小小的应用程序。我知道如何开发这些应用程序,但开始感觉
我昨天参加了一个关于扩展 Rails 的聚会,其中一个主题是 Hexagonal Rails。然而,我只做了一年的 Rails,对 MVC 结构非常满意(也许太舒服了),所以我不太了解适配器和消息队列
我使用多个 Rails 应用程序,一些在 Rails 3.2/Ruby 2.0 上,一些在 Rails 2.3/Ruby 1.8.7 上。 他们的共同点是,随着他们的成长和添加更多的依赖项/ gem
这个问题在这里已经有了答案: Using Rails-UJS in JS modules (Rails 6 with webpacker) (5 个答案) 关闭 3 年前。 我正在尝试使用 UJS
我正在开发一个当前使用 Rails 1.2 的 Rails 应用程序,所以我现在离最新的稳定版本(Rails 2.3)还有很长的路要走。 我应该如何进行迁移到更新版本的 Rails 的过程? 我应该一
尝试按照 Ryan Bates Backbone.js 教程构建抽奖应用程序,但我已经遇到了第一段代码的问题。在 application.js 的 init 函数中,他初始化了 Raffler 路由的
我正在使用 Rails 3.2 并且我有一个数据库表,我想在其中找到符合以下条件的所有行: a = true and b = true and ( 0 true, :b =>
我有一个用户类和一个联系人,其中联系人是用户的子类。这两个类都存储在用户表中。 我的联系人可能有也可能没有电子邮件地址,而我的用户需要一个电子邮件地址(我的用户模型定义中有 validates_pre
我正在编写一个教程,我在其中演示了一些 rails 命令。在我的机器上 rails和 script/rails两者都同样有效。有“首选”形式吗?两者中哪一个更普遍? 最佳答案 当您运行 rails 时
我正在寻找有关通过我的应用程序前进的最佳方式的建议,这是我首次开始集成Elasticsearch。我是一名初学者,但是热衷于深入研究,以便原谅任何明显的错误! 我遵循了http://www.sitep
我刚刚用 Rails new 启动了一个新的 Rails 应用程序,将默认数据库设置更改为 PostgresSQL。我用 bin/rails s 启动服务器,结果很奇怪 2016-04-21 05:0
我收到一个参数并希望它是这样的字符串: "abc,efg" 或者像这样的数组 ["abc","efg"] 在第一种情况下,我想将它转换成一个数组,什么是好的方法? 这是我的想法 if params[:
我刚刚用 Rails new 启动了一个新的 Rails 应用程序,将默认数据库设置更改为 PostgresSQL。我用 bin/rails s 启动服务器,结果很奇怪 2016-04-21 05:0
我收到一个参数并希望它是这样的字符串: "abc,efg" 或者像这样的数组 ["abc","efg"] 在第一种情况下,我想将它转换成一个数组,什么是好的方法? 这是我的想法 if params[:
我有 Rails 4,这是我的默认版本(我仍然希望它是)。但我不想在我的电脑上添加 rails 3.2。在以下命令中:gem install rails -v 3.2.16 我有这个警告: railt
您好,我想使用 Sheevaplug 构建一个“Rails Brick”来自 Marvell(操作系统是开箱即用的 Ubuntu,但您可以在其上安装其他发行版)。它将成为家庭服务器和静音、低成本(99
我需要能够从 Rails 控制台发送我的 Rails 应用程序的 Postgres 数据库中所有未接受的邀请。 (我有一个名为 Invitations 的表,其中包含一个名为 accepted 的 b
validate :cannot_modify_if_locked, on: :update def cannot_modify_if_locked if self.locked erro
我正在学习教程(学习 Rails 播客),需要更改以下路由语法,以便它与 Rails 3.0 兼容。谁能帮忙? map.view_page ':name', :controller => 'viewe
我是一名优秀的程序员,十分优秀!