- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在开发一个 Rails 应用程序,它通过从第 3 方网站(类似于 http://railscasts.com/episodes/190-screen-scraping-with-nokogiri)抓取价格来提供各种产品的定价数据。
由于我是编程新手,现在我通过将我的代码放入 rake 任务来手动执行此操作。这些任务遍历我数据库中的所有产品,并通过抓取更新它们的价格。它需要几个小时才能完成(因为有 1000 种产品),但大部分时间都花在调用 sleep 上,所以我可以限制自己的速度。现在我正在从命令行手动调用 rake 任务,但我希望有一个每周定期在后台自动运行的作业。
经过一些研究,似乎有几种方法可以做到这一点(Resque、DelayedJob、Cron/Whenever),但我不确定哪种方法最适合我的需要。此外,我正在通过 Heroku 进行部署,所以我想确保我不会在 worker dynos 上浪费金钱;现在这只是一个副业,所以我不想花那么多钱。
执行此操作的简单且经济高效的方法是什么?
最佳答案
我目前正在使用 Heroku Scheduler .它可以每天、每小时或每 10 分钟运行一次任务。它非常易于使用:
heroku addons:add scheduler:standard
安装附加组件rake name_of_your_task
)、频率和下一次运行来做到这一点。完成了。但是,有几个问题:
您需要提供有效的信用卡才能使用此插件,即使它原则上是免费的。
调度程序运行一次性进程,这些进程将计入您的测功机小时数。
Heroku 仅为每个应用提供 750 个免费测功小时。
这就是 Scheduler 的 wiki 对 Long-running jobs 的描述:
Scheduled jobs are meant to execute short running tasks or enqueue longer running tasks into a background job queue. Anything that takes longer than a couple of minutes to complete should use a worker dyno to run.
所以我的建议是:
将您的 rake 任务分解成更小的 block ,只运行几分钟。
更定期地运行这些任务(您甚至没有使用调度程序的每周选项)。
留意您的测功时间。你可以这样做here . 750 小时等于 31 天零 6 小时。因此,在这 31 天的月份中,您至少有 6 个小时可以工作。如果您的应用未被使用,您还可以使用以下命令将其关闭,以停止计算常规测功机小时数。
heroku ps:scale web=0
你可以用
heroku ps:scale web=1
不幸的是,没有免费计算能力这样的东西。
关于ruby-on-rails - Rails 和 Heroku 上的定期后台作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13812642/
我是 .NET 编程的新手,目前我正在开发一个计算机健康监控系统,该系统目前处于初级阶段。我将使用 C# 2010 并使用 WMI 查询来查询计算机信息。 在进一步开发应用程序之前,我创建了一个迷你测
我正在考虑开发一个站点,服务器将定期抓取另一个站点,以便为我的数据库中的某些条目收集内容。我的问题如下... 如何让服务器及时执行抓取? 你能让它执行 php 还是你用什么语言来执行抓取? 有什么好的
使用 JobScheduler , 我设置了一个简单的 JobService如下: @TargetApi(21) public class SimpleJobService extends JobSe
我想定期从我的 JavaFX 应用程序执行任务。该任务从远程流中提取数据。 虽然我知道我可以按照下面的建议使用计时器: JavaFX periodic background task 我相信这应该能够
上下文 我们使用多个具有相同工作流程的 git 存储库,涉及两个分支,并且想知道如何最好地将一个提交“同步”到另一个。 简单地说,我们的 git 存储库包含: 长寿枝 两个分支: master(持续开
我正在编写一个需要以高精度和低频率进行后台位置更新的应用程序。解决方案似乎是一个后台 NSTimer 任务,它启动位置管理器的更新,然后立即关闭。之前有人问过这个问题: How do I get a
我有一个包含产品的商业系统。产品被分类并且还具有属性组。 我想同步/更新将来自商务系统的产品转换为在 Orchard 中定义的产品项目的内容类型,以便将数据从商务系统推送到 Orchard 内容项目。
所以我想做的只是按时间间隔更新 Activity 的 View ,比如每秒一次。在这个特定的例子中有几个按钮,我想要改变的只是它们的文本。我在这里阅读了很多解决相同问题的问题,但我似乎比其他人更容易陷
我有一个项目的 recyclerView,(除其他外)包含从 WS 检索的游戏持续时间的时间戳。为了显示比赛的持续时间,我必须获取当前时间戳,做垫子并将其转换为可读格式(例如:5 分钟 5 秒)。只有
这可能是一个愚蠢的问题,但经过几个小时的谷歌搜索后我找不到合适的答案.. 我们有一个在 cloudbees 上运行的业务关键型应用程序。源代码已正确备份,我们希望我们的数据库也有相同的备份。 Clou
我一直在观察我的 PostgreSQL 只读副本显示复制滞后的周期性延迟。延迟似乎会增加到 30-40 分钟,然后自动下降到 0。这与 CPU 利用率 相关,但它远未接近 CPU 限制。 读取流量来自
我已完成 Keepalived + MySQL(master - master)设置。 我将 MASTER 和 BACKUP 的优先级保持不变,因为我不希望它们开始频繁抖动(一次切换 VIP 就足够了
我目前有一个图像,如果本地内容可用,它会被 ping 以仅显示一个 div。 但我认为更好的实现方式是以 30 秒为间隔定期检查 ping,如果图像未成功 ping,则显示 #offline div。
我正在尝试编写一项服务,该服务将每隔 X 分钟尝试获取设备的 GPS 位置,并在后台运行和记录,即使应用程序未处于焦点状态也是如此。 那么,是时候创建服务了。 我创建了一个服务,设置了 locatio
我在这里阅读了很多问题,但无法弄清楚问题是什么。 我正在为 Android 编写现场服务应用程序。在其中一个 Activity (MyActivity.java) 中,我有两个按钮:开始和停止。 当现
假设我有这样的代码: git fetch && git diff origin origin/master --quiet || echo "untracked" 我希望它定期运行。比方说,每秒一次
我想建立与 HTTPS 服务器(例如 google.com)的连接并定期获取新鲜内容。 我编写了简单的 HTTP 客户端: public class AsyncLoader { private
我想定期进行 wifi 扫描(可能每 5 分钟一次)并将结果导出到一个 txt 文件,以便它显示 AP SSID 和 MAC 以及接收到的信号强度。我是 Android 开发的新手,所以我只知道基础知
当手机处于 sleep 模式时,Workmanager 不会向我的服务器发送坐标。异步任务被杀死? 我使用 Workmanager (PeriodicWorkRequest) 每 15 分钟获取一次坐
目标 收集 LogCat 的定期更新并将这些文本 block 保存(附加)到 SD 卡上的文件中 问题 Log 类不提供自特定时间戳以来的更新 可能的解决方案 我的计划是定期运行类似于以下代码:htt
我是一名优秀的程序员,十分优秀!