- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个 Rails 应用程序,让用户上传一个 CSV 文件,其中包含要抓取的 URL 列表(有时是 200k)。然后在 Controller 中我会去这个文件的每一行,然后调用另一个方法,该方法接受 URL 和一些参数,然后在爬行方法完成后,将一些变量保存到几个模型中。下面是我的 Controller 的样子:
def import
if request.post? && params[:inputfile].present?
infile = params[:inputfile].read
CSV.parse(infile) do |row|
@crawler = Crawler.new(row[0])
@crawler.crawl #do the actual crawling using Mechanize Gem and set a few variable in the crawler object
#when crawl is done save a few stuff into some models
end
end
end
最佳答案
听起来你做了足够多的挖掘,最终找到了正确的方向!我也会考虑到一个单独的后台工作系统。
Sidekiq 现在得到了更好的维护,多线程对您的用例非常有用,所以我会选择它。好的起点是 the Sidekiq homepage和 this Railscast ,这两者都为您提供了大量信息,让您立即开始工作。
关于ruby-on-rails - 将网络爬虫移动到后台 : Resque or Sidekiq,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12732782/
我用coffee-resque创建了一些worker,并尝试使用resque-web的ruby版本查看worker,但只看到间歇性的worker闪进闪出。 我注意到咖啡风格在暂停时会取消对 worke
假设这是我的 worker : class FooWorker @queue = :foo def self.perform User.all.each do |u| ..
我对 resque 很陌生,但它看起来非常适合我的需求。 实际上,我正在尝试设置一个简单的测试应用程序,例如: require 'resque' require 'resque/job_with_st
我正在使用 Resque 和 Resque 调度程序,但是当我输入命令时 resque-web它没有运行。而是提示错误: bash: resque-web: command not found So
我正在使用 ruby on rails 构建一个 webapp,它需要在后台运行 C++ exe 程序。我为此比较了 3 个最常用的 gem(Delayed_Jobs、Resque、Sidekiq
我想知道 resque-scheduler 是否需要一个 resque 实例来运行特定队列中的作业,或者 resque-scheduler 必须使用 resque:work 任务。 提前致谢。 最佳答
我正在使用 Resque、Resque-Status 和 Resque-Retry 来处理 bkg 作业。以下是一个示例作业。它针对 4-5 个模型执行查询。现在我想尝试使用 Sidekiq它以其超过
我正在开发一个使用 resque 的 rails 应用程序和 resque-scheduler 安排电子邮件发送。 有没有办法获得所有预定作业的列表,或者更好的具有特定参数的作业列表? 我尝试了一些类
将 Resque 与 Redis 结合使用 我一直收到 Redis 的 OOM 命令在使用内存时不允许 > 'maxmemory' 错误。现在很明显,我似乎应该将 redis 的内存从当前的 500M
此外,管理内置“管理结构”(如标题中的结构)的 Resque 的最佳实践是什么?我应该用 jedis.del(String key) 或类似的东西清除它们吗? 最佳答案 resque:failed 是
我有 resque-scheduler 在 Rails 应用程序中运行良好。现在我需要能够从队列中跟踪状态并删除作业。我简要地查看了 resque-status,据我所见,如果我能让它与 resque
我都关注了 instructions on resque-scheduler repo在 resque-web 界面上显示“延迟”和“计划”选项卡,但什么也没有! 这是进口的 gem : gem 'r
我已经为我的应用程序设置了 Resque.redis.namespace,现在 resque-web 不再显示工作人员和队列。 有什么方法可以让 resque-web 知道 redis.namespa
我一直试图让 Resque(使用 Resque 服务器)和 RedisToGo 在 heroku(cedar)上工作一段时间,但我一直遇到这个错误: Redis::CannotConnectError
我在 resque 工作中遇到了一个奇怪的问题,我想知道是否有其他人遇到过。 我们在 jruby 1.6.2 下运行 resque 我们有一个长时间 运行任务,它从各种 URL 下载一堆文件,使用 F
我刚刚看了这个关于 Resque 的惊人的 railscast .在我启动 redis 服务器并启动 workers 之后: rake environment resque:work QUEUE="*
我使用 resque-history 插件来监控已完成的任务。 首先,我将这个字符串 require 'resque-history/server' 包含到路由文件中,然后我在仪表板中看到了新的历史记
我需要启动 4 个 resque 工作人员,所以我使用了以下命令 bundle exec rake environment resque:workers RAILS_ENV=production CO
我有几个 Resque 作业在运行,每个都在一个单独的终端窗口中启动,如下所示: QUEUE=queue_1 rake environment resque:work QUEUE=queue_2 ra
我有以下代码。它的工作是根据通过浏览器(使用 Sinatra)提供的数据发送电子邮件。它会在 20 秒后向给定的地址发送一封电子邮件。当我运行该程序时,它会立即发送电子邮件,而无需等待时间。谁能帮我解
我是一名优秀的程序员,十分优秀!