- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我的 Heroku Rails 应用维护着一个经常变化的大型关键字列表。
我想派生出 N 个工作人员,这些工作人员将平均分配这个关键字列表并对其进行处理,直到它们重新启动(每次关键字列表更改时我都会重新启动它们)。重新启动后,它们会再次划分关键字并流失。
例如:假设我有 1,000 个关键字。
工作人员基本上只是为他们的关键字集打开与 Twitter 的连接,并处理与这些关键字匹配的传入推文。
关于如何设置 Procfile 并在 N 个工作人员之间委托(delegate) X 关键字有什么想法吗?
这是一个仅用于演示的天真/伪手动方法。但是,我希望能够产生任意数量的工作人员,这些工作人员会自动在他们之间拆分关键字。
简介:
keywordstreamer0: bundle exec ruby keyword_streamer.rb 0
keywordstreamer1: bundle exec ruby keyword_streamer.rb 1
keyword_streamer.rb
streamer_id = ARGV.shift # 0 or 1
# Split all keywords into array of two groups and take the group
# that matches this worker id (so the two workers take different groups)
keywords = Keyword.all.split_into_groups_of(2)[streamer_id]
# Example work loop
TwitterStream.track(keywords).each do |incoming_tweet|
process(incoming_tweet)
end
然后,在我的应用中,当我需要重新启动我的关键字 worker 时:
["keywordstreamer0", "keywordstreamer1"].each do |streamer|
restart(streamer)
end
我希望能够产生 N 数量的这些 worker ,但我在分配解决方案时遇到了问题。如果有任何高级概述建议,我将不胜感激!
最佳答案
如果您一次只处理一个关键字,没有特定的顺序或分组,您可以只使用队列。
每个工作人员只需从队列中取出下一个关键字(或者可能是下一批关键字,以提高性能),完成工作,然后将结果保存在某个地方。您无需担心工作负载的划分问题,因为工作人员会在准备就绪时简单地请求更多工作,从而允许您扩展到 N 个工作人员,而无需每个工作人员都知道可用工作负载的总大小。
您可以通过多种方式为您的数据实现队列。 AMQP 和 Redis 是我之前使用过的几个更专业的工具,但这并不是一个详尽的列表。
我要猜测一下,因为您的示例代码中有 Keyword.all
,并且您使用的是 Heroku,所以您使用的是 postgres。您也可以在 postgres 中模拟一个队列而不会有太多困难,尽管它显然不会像专门构建的队列那样执行。
这是一种实现方式:
为您的关键字添加一个status
列。它将有 3 个值:就绪、进行中和完成。状态列的默认值为就绪。
您的工作人员的伪代码如下所示:
loop do
keyword = Keyword.where(:status => "ready").limit(1).first
keyword.update_attributes!(:status => "in-progress")
result = process(keyword)
save_result_somewhere(result)
keyword.update_attributes!(:status => "complete")
end
我省略了一堆实现细节,例如优雅地处理空队列、队列的初始设置、批处理等等。但这就是它的要点。对于中等规模的 N,可能至少有 10 个或更多的 worker ,这应该足以执行。除此之外,您可能需要考虑一种专门构建的排队技术。
设置好队列后,每个工作人员都是相同且自主的。只需 heroku ps:scale worker=N
即可完成!
关于ruby-on-rails - 我将如何产生 Heroku 工作人员来分而治之关键字列表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13182571/
如果我创建一个对象时没有使用 new 关键字,例如“Object s(someval)”,但该对象的构造函数使用了 new,当该对象超出范围时,是否会调用析构函数为其分配新的空间?我感觉好像是,但我不
在 SQL 语法中,我发现奇怪的规则表明 select * from ONLY (t1)是有效的 SQL。 我的问题是:什么是 ONLY在这种情况下是什么意思? 它在规范的“7.6 table ref
为什么使用 $(this) 而不是重新选择类很重要? 我在代码中使用了大量的动画和 CSS 编辑,并且我知道可以使用 $(this) 来简化它。 最佳答案 当您通过 jQuery 执行 DOM 查询(
我正在尝试使用 IN 关键字编写查询。 表A 属性标识、属性名称 表B key 、属性标识、属性值 根据提供的 key ,我想返回所有 attrName、attrVal 组合。结果将包含两个表中的列。
这个问题在这里已经有了答案: Why would you use "AS" when aliasing a SQL table? (8 个答案) 关闭 9 年前。 我不擅长写查询,但是从我开始使用
我读过,在 Java 中,您不必将 this 关键字显式绑定(bind)到对象,它由解释器完成。它与 Javascript 相反,在 Javascript 中你总是必须知道 this 的值。但是 Ja
Swift 中“with”关键字的用途是什么?到目前为止,我发现如果您需要覆盖现有的全局函数,例如 toDebugString,可以使用该关键字。 // without "with" you
这个问题在这里已经有了答案: What does the keyword "where" in a class declaration do? (7 个答案) 关闭 9 年前。 在下面的一段代码中(
免责声明:swift 菜鸟 您好,我刚刚开始学习 Swift,正在学习 Swift 编程语言(Apple 在 WWDC 期间发布的书籍),并且想知道“where”关键字是什么。它用于 let vege
深入研究文档后,我找不到以下问题的答案: 是否有任何理由反对使用 this 来引用当前对象,如下例所示? type MyStruct struct { someField string } fun
前言 最近在做THINKPHP开发项目中,用到了 parent:: 关键字,实际上 parent::关键字 是PHP中常要用到的一个功能,这不仅仅是在 THINKPHP 项目开发中,即使是一个小型
我们都知道且经常用到 unsigned 关键字,但有没有想过,与此对应的 signed 关键字有啥用? 复制代码 代码如下: int i = 0; signed
this关键字再java里面是一个我认为非常不好理解的概念,:)也许是太笨的原因 this 关键字的含义:可为以调用了其方法的那个对象生成相应的句柄。 怎么理解这段话呢? thinking i
一 什么是 synchronized synchronized 关键字提供了一种锁机制,能够确保共享变量互斥访问,从而防止数据不一致问题的出现。 synchronized 关键字包括 monitor
最近看了几篇 synchronized 关键字的相关文章,收获很大,想着总结一下该关键字的相关内容。 1、synchronized 的作用 原子性:所谓原子性就是指一个操作或者多个操作,要么全部执行并
在本教程中,您将借助示例了解 JavaScript 对象方法和 this 关键字。 在 JavaScript 中,对象也可以包含函数。例如, // object containing meth
有人可以解释一下 PHP“with”的作用吗? 示例开始: 假设我有一个类: \App\fa_batch 这句话有什么区别: $w = (with (new \App\fa_batch))
这个问题在这里已经有了答案: What is the difference between using the colon and as syntax for declaring type? (2
如果我在 WHERE 子句中使用以下任一项,是否会有很大不同: WHERE [Process Code] = 1 AND ([Material ID] = 'PLT' OR [Material ID]
This question is unlikely to help any future visitors; it is only relevant to a small geographic are
我是一名优秀的程序员,十分优秀!