- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我目前有一个 PHP 脚本,它从各种来源收集类似的数据,每个数据源每 120 秒被抓取和解析一次。目前我有 20 个数据源,但我希望在接下来的几周内再整合 100 个。
目前每个数据源都在它自己的线程中被抓取,有一个主要的 PHP 脚本将执行其他脚本来执行抓取工作。这种方法允许同时抓取所有源,但它也会给服务器带来压力,并对数据库 (MySQL) 造成瓶颈。
我正在寻找一种方法来扩展我当前的应用程序,我可以使用 AWS 做这样的事情吗?也许这些抓取脚本中的每一个都可以在它们自己的小型服务器实例中运行,这些实例中的每一个都将由“主”实例自动创建,然后在脚本完成后死亡。我没有任何使用 AWS 的经验,所以我不完全确定这是否可行,或者这可能只是一个坏主意。
这里的主要问题是:如何扩展我当前的抓取脚本以允许许多新数据源?我对任何解决方案都感兴趣,即使我需要购买额外的服务也是如此。
最佳答案
您正在描述一种工作人员/队列模式,您的主服务器同时执行入队和工作人员执行,这当然会给您的服务器带来巨大压力。
首先,您的工作人员需要异步:您不应该等待可能会或可能不会回来的事情。你真的应该看看ZeroMQ我可能会补充说,其中包含一些地球上最好的文档。如果您愿意学习,请查看其工作原理并遵循一些教程,那里有很多教程。让您的队列接受新工作并将其他工作分派(dispatch)到其他地方(即其他盒子)托管在您的主服务器上。
您可以创建某种实例 Controller 来处理 AWS 实例。你真的只需要坐下来思考你的逻辑(我什么时候想要这么多盒子,我什么时候想要关闭它们)。一旦您了解了 API,它就非常易于使用。 Here's some code我写了一段时间来包装亚马逊的 SDK for PHP .我不确定它是否 100% 与最新版本一起工作(我大约一年前使用它),但概念是存在的 - 你有简单的方法,如 startBox()
或 stopBox ()
你从你的队列中调用,并让你的盒子在启动后自动开始做它的事情。
您可以使用亚马逊的 t1.micro
实例 pricing here ,它有一个免费套餐 info here达到一定限度。
让它正常工作,在你的主服务器上有一个循环来决定在特定情况下你在任何时候需要工作多少个盒子(例如,你的数据库表中的工作数量),理论上你将有无限的缩放。以下是我为我的代码所做的:
记录一切。记录每一个出现的箱子,每一个掉落的箱子。 在您的代码中计算您的成本并将它们存储在数据库中,或者记录它们,这样您就可以确切地知道您花费了多少——您不希望事情失控。
确保打开您的数据库端口,以便您的实例可以与您的数据库对话,告知工作何时完成或您需要在“主”框和“从”框之间传递的任何其他信息。
此外,如果您为 Web 服务器付费,您将使用 aws 支付小时的费用,因此您需要了解启动盒子的时间以及关闭时间关闭,仅在 55 分钟左右后才真正关闭它 - 您还不如花钱获得这些额外的分钟数。
我真的想不出别的了。进行研究,找出构建排队系统的最佳方法,并在构建时考虑到可扩展性(它可以对您控制的数字使用react和更改)。
关于php - 如何扩展数据库/CPU 密集型脚本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21733084/
我是 magento 的新手,目前我在 magento 安装期间遇到“必须加载 PHP 扩展 curl ”错误。你能帮帮我吗? 最佳答案 如果您的服务器上没有安装 curl,您可以键入以下命令之一来安
我在 macOS Mojave/macOS Big Sur/macOS Monterey/macOS Ventura 上使用最新的 php 版本 7.2 并收到类似错误 $composer requ
这个问题已经有答案了: Why generic type is not applicable for argument extends super class for both? (5 个回答) 已关
我正在使用 NightWatch.js 并进行一些 UI 测试,我想用一些额外的 desiredCapabilities 启动默认浏览器实例(即启用扩展并应用一些特定值)。 p> 注意:我可以执行这些
有人知道为什么我在 java 8 中使用此代码时没有服务器扩展名称吗: try { URL url = new URL(urlString); URLC
扩展提供给我的类(class)。为现有的类提供新功能。或扩展现有的mixin s 或虚拟类,任何东西都可以工作。 也许是这样的: class FlatButton {} // maybe no
我有一个关于使用 c 代码和 mod_wsgi 扩展 python 的问题。 我在 apache 服务器中有一个 django 应用程序,它查询 postgresql 数据库以生成报告。在某些报告中,
testcafe支持在Chrome浏览器中加载crx扩展吗? 如果是这样,请告诉我需要尝试什么方法。 我尝试了下面的代码,但没有成功 await t.eval(new Function(fs.read
这个问题已经有答案了: What is a raw type and why shouldn't we use it? (16 个回答) 已关闭 3 年前。 有什么区别: // 1 class A c
我正在编写一个 chrome 扩展来记录单击开始按钮后触发的请求。 这是我的文件:1. list .json { "manifest_version": 2, "name": "recorde
我每天都在使用 vim 和 perforce 现在我的问题是,如果我想查看 perforce 文件修订版,则从命令模式下的 vim :!p4 打印文件#1 vim 试图让我获得缓冲区 #1。有没有办法
大家好,我有一个关于 NUnit 扩展(2.5.10)的问题。 我想做的是向 数据库。为此,我使用 Event 创建了 NUnit 扩展 听众。 我遇到的问题是公共(public)无效 TestFin
我有弹出窗口,而不是模态窗口。 如何通过单击页面的其他部分(不在窗口中)来关闭此窗口? 最佳答案 像这样的东西: function closeWin(e, t) { var el = win.
我通常非常谨慎地使用扩展方法。当我确实觉得有必要编写一个扩展方法时,有时我想重载该方法。我的问题是,您对调用其他扩展方法的扩展方法有何看法?不好的做法?感觉不对,但我无法真正定义原因。 例如,第二个
扩展 Ant Ant带有一组预定义的任务,但是你可以创建自己的任务,如下面的例子所示。 定制Ant 任务应扩展 org.apache.tools.ant.Task 类,同时也应该拓展 execut
我想要一个重定向所有请求的扩展: http://website.com/foo.js 到: http://localhost/myfoo.js 我无法使用主机文件将主机从 website.com 编辑
对于为什么 QChartView 放在 QTabWidget 中时会扩展,我有点迷惑。 这是 QChartView 未展开(因为它被隐藏)时应用程序的图片。 应用程序的黑色部分是 QOpenGLWid
如果在连接条件中使用 OR 运算符,如何优化以下查询以避免 SQL 调优方面的 OR 扩展? SELECT t1.A, t2.B, t1.C, t1.D, t2.E FROM t1 LEFT J
一旦加载插件的问题得到解决(在 .NET 中通过 MEF 的情况下),下一步要解决的是与它们的通信。简单的方法是实现一个接口(interface),使用插件实现,但有时插件只需要扩展应用程序的工作方式
在我的 Symfony2 包中,我需要检查是否定义了一个函数(一个扩展)。更具体地说,如果安装了 KnpMenuBundle,我会在我的包中使用那个,否则我将自己渲染插件。 我试过了,但这当然不起作用
我是一名优秀的程序员,十分优秀!