- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个简单的NodeJS Web应用程序,该应用程序异步调用多个api,并合并结果以返回一个大结果。现在让我们说我要优化它。我该怎么做呢?
我是NoeJS的新手,也是缩放系统的概念。我一直在阅读有关负载平衡,分布式系统等的信息。我认为这是正确的做法,但老实说我不知道。
我当时正在考虑做这样的事情-
设置一个具有多个服务器的系统,每个系统都有一个NodeJS Webapp实例,该实例通过给定路径进行api调用并返回结果。
拥有一个主服务器,该服务器从这些服务器中的每一个获取结果,然后合并结果并将其返回给客户端。
这是正确的方法吗?我使用什么技术?谢谢您的帮助。
最佳答案
我猜您正在尝试设置网络抓取或api抓取,以从第三方端点抓取数据。如果是这样,您将拥有一个用户/ ID列表或传递给您调用的Web服务并获取数据的类似内容。
首先,非常快速且稳定地发出大量请求非常棘手,并且要取决于稳定和可靠的几个因素。
是第三方API速率限制。
发出请求的客户端计算机上的网络连接。
API和客户端错误的错误处理,例如连接重置等。
您正在回取的数据量之大,就像您试图尽快从第三方API抓取数百万用户的数据一样。
您的直觉是正确的,您必须在具有大量资源的机器上扩展多个服务器或至少几个并行节点进程,但是建议从小做起,进行测试,然后进行扩展是我的建议。这里有几个步骤。
使用良好的健壮节点http客户端,例如axios
如果您要处理大量项目(用户名,ID,电子邮件等),则需要稳定的迭代方法。将它们放在PostgreSQL或MySQL之类的数据库中。
从这里开始,找出您的API支持调用的最快速率。并编写稳定的函数以遍历“输入”并调用API。
然后,您有两个选择。如果您收集的数据对于您的每个请求都是分开的。您可以为每个输入将其保存回数据库中。如果您确实想合并来自多个API调用的数据,则可以使用键值存储(例如Redis)。您可以为每个呼叫提供一个ID,并为input + request_id格式创建一个组合键,然后在完成所有请求后就可以合并它们。
当您使用小规模模型时,现在可以向组合中添加诸如Kue或Bull的良好作业管理器,并将数据库中的输入集从点(2)拆分为可以并行运行的多个作业。
一旦有了一个稳定的作业经理,就可以针对一系列输入重复此节点过程,那么现在您可以进行扩展。
在所有与同一数据库和Redis通信的服务器上部署相同的代码。安装Node进程以使用诸如PM2之类的进程管理器运行。
最后,安装程序的工作方式是,同一节点程序的每个副本从源数据库获取一组不同的输入(用户名/ ID等),并将结果写回数据库或Redis,具体取决于您要如何处理输出。
对redis的可选后处理,以获取键值对并合并按输入分组的响应。
在编写此问题时,您必须高度意识到一些重要的事情:
内存管理:使用可节省大部分内存的设计模式/代码/库。绝对将所需的最小内容加载到内存中。例如:在内存中包含一百万个用户名的数组上进行迭代比将它们保留在数据库中并对其进行分页要昂贵得多。
错误处理:会有很多。 API错误,无法预料的异常,内存泄漏,网络中断等。拥有强大的错误处理和恢复机制将节省很多时间。
日志记录:高质量的日志记录对于保持检查系统不同部分的运行状况至关重要。看winston。
限制API调用:切记在同一分钟内进行10,000个API调用可能会导致您的计算机甚至大多数API崩溃。至少由于内存过载,运行速度非常缓慢。但是,每10个并行调用之间增加一点延迟(例如10毫秒)将极大地提高速度,并使调用更加稳定。这种策略称为限制或速率限制API调用。找到适合您问题的最佳解决方案很重要。是的,慢慢来实际上可以使您更快地达到目标!
您的问题非常广泛,没有特定的代码问题,这是一个通用策略,希望可以为您提供一个很好的起点和参考资料的链接,以便您可以开始构建解决方案。
关于node.js - 如何将NodeJS请求分发到多个服务器并合并结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49962173/
我有几个长度不等的 vector ,我想对其进行cbind。我将 vector 放入列表中,并尝试结合使用do.call(cbind, ...): nm <- list(1:8, 3:8, 1:5)
合并(合并)两个 JSONObjects 的最佳方式是什么? JSONObject o1 = { "one": "1", "two": "2", "three": "3" }
我在一个表中有许多空间实体,其中有一个名为 Boundaries 的 geometry 字段。我想生成一个具有简化形状/几何图形的 GeoJson 文件。 这是我的第一次尝试: var entitie
谁能说出为什么这个选择返回 3.0 而不是 3.5: SELECT coalesce(1.0*(7/2),0) as foo 这个返回 3: SELECT coalesce(7/2,0) as foo
首先抱歉,也许这个问题已经提出,但我找不到任何可以帮助我的东西,可能是因为我对 XSLT 缺乏了解。 我有以下 XML: 0 OK
有时用户会使用 Windows 资源管理器复制文件并在他们应该执行 svn 存储库级别的复制或合并时提交它们。因此,SVN 没有正确跟踪这些变化。一旦我发现这一点,损坏显然已经完成,并且可能已经对相关
我想组合/堆叠 2 个不同列的值并获得唯一值。 如果范围相邻,则可以正常工作。例如: =UNIQUE(FILTERXML(""&SUBSTITUTE(TEXTJOIN(",",TRUE,TRANSPO
使用iTextSharp,如何将多个PDF合并为一个PDF,而又不丢失每个PDF中的“表单字段”及其属性? (我希望有一个使用来自数据库的流的示例,但文件系统也可以) 我发现this code可以正常
是否有一个合并函数可以优先考虑公共(public)变量中的非缺失值? 考虑以下示例。 首先,我们生成两个 data.frames,它们具有相同的 ID,但在特定变量上有互补的缺失值: set.seed
我们正在尝试实现 ALM Rangers 在最新的 Visual Studio TFS Branching and Merging Guide 中描述的“基本双分支计划”。 .从指导: The bas
我在不同目录(3个不同名称)中有很多(3个只是一个例子)文本文件,如下所示: 目录:A,文件名:run.txt 格式:txt制表符分隔 ; file one 10 0.2 0.5 0.
我有一张包含学生等级关系的表: Student Grade StartDate EndDate 1 1 09/01/2009 NULL 2
我在学习 https://www.doctrine-project.org/projects/doctrine-orm/en/2.6/reference/working-with-associatio
我觉得我有世界上最简单的 SVN 用例: 我有一个文件,Test.java在 trunk SVN的。 我分行trunk至 dev-branch . 我搬家Test.java进入 com/mycompa
我有两个数据框,其中一些列名称相同,而另一些列名称不同。数据框看起来像这样: df1 ID hello world hockey soccer 1 1 NA NA
Elasticsearch 中是否缺少以扁平化形式(多个子/子aggs)返回结果的方法? 例如,当前我正在尝试获取所有产品类型及其状态(在线/离线)。 这就是我最终得到的: aggs [ { key:
如何合并如下所示的 map : Map1 = Map(1 -> Class1(1), 2 -> Class1(2)) Map2 = Map(2 -> Class2(1), 3 -> Class2(2)
我试图通过从netezza服务器导入数据来合并两个数据集。 以下是数据集,其数字为,ID为,字母为,名称为: 下表都是使用命令从netezza导入的: sqoop import --connect n
我有两个数组 $array1 = array('first', 'second', 'third', 'fourth'); $array2 = array('first', 'third', 'fou
我正在 SQL Server 中运行合并。在我的更新中,我只想在值发生更改时更新该行。有一个版本行在每次更新时都会递增。下面是一个例子: MERGE Employee as tgt USING (SE
我是一名优秀的程序员,十分优秀!