scala - 如果我有一个 Actor 应该有很大的吞吐量怎么办？-6ren

scala - 如果我有一个 Actor 应该有很大的吞吐量怎么办？

转载作者：行者123 更新时间：2023-12-01 00:37:59

25

4

我有一个 Actor ，可以汇总一些信息并对其进行处理。它目前看起来像这样:

class MessageTracerActor extends Actor{

  override def receive: Receive = {
      case MyActor.TracableMessage(msg) => //send processed msg to another place
      case v: Any => //corner-case, has special handler
  }
}

参与者应该发送扩展 TracableMessage 的消息的踪迹。 .但是 TracableMessages由相当多的 Actor 发送并主持 MessageTracerActor在一台机器上不太好。

我看了 cluster shrading ，但情况似乎并非如此。他们说

Cluster sharding is typically used when you have many stateful actors that together consume more resources (e.g. memory) than fit on one machine. If you only have a few stateful actors it might be easier to run them on a Cluster Singleton node.

但是 Cluster Singleton 严格托管在一个不可扩展的节点上。

也许有一些配置选项可以指定用于处理参与者收到的消息的线程(甚至节点)数量？

最佳答案

有几个选项可以将消息处理扩展到单个参与者之外。

在单个节点中传播消息处理

如果跟踪消息处理是无状态的，您可以使用 routing 在跟踪消息处理参与者的多个实例之间分配工作。 .路由器是一个参与者，它建立一个处理参与者池，并在处理参与者之间分发每个传入的消息。

// create a round robin style router for actors
val router: ActorRef = context.actorOf(RoundRobinPool(5).props(Props[MessageTracerActor]), "tracer-router")

在上面的示例中，循环式路由器用于在跟踪器参与者之间均匀分配消息。这意味着您将失去发送到路由器的消息之间的排序保证:稍后入队的消息可能会在之前入队的消息之前处理。因为每个消息处理器只能看到传入消息的任意子集，所以也不能一致地完成像聚合这样的有状态处理。

为了使排序一致，您必须考虑哪些消息需要按顺序排列。如果所有可追踪的消息都需要按照它们进入路由器的顺序进行精确处理，那么路由器将无济于事。然而，一些可追踪的消息可能需要按照与某些消息相关的顺序进行处理，而不是其他消息。例如，您的可追踪消息可能包含消息的来源，并且排序必须仅在来自同一来源的消息之间得到保证。

确定消息之间的顺序允许您以一致的方式在消息处理器之间分发消息。 Akka 使用 consistent hashing pools 为此提供了功能。 .在一致性哈希池中，路由器根据哈希键机制将传入的消息分发给消息处理器。具有相同路由散列键的消息将被路由到相同的消息处理器，这意味着您可以一致地对传入消息的一部分可追踪消息进行聚合。

跨多个节点传播消息处理

如果一个 Akka 节点不足以处理可追踪的消息，您可以使用 Akka 的 clustering features 扩展消息处理。 .在集群中，您有多个 Akka 节点相互连接，通过跨集群分配工作而不是在单个节点中处理所有内容来协同工作。

在集群中，您可以使用前面描述的工具的分布式版本。对于消息的无状态和有状态路由，您可以使用 a cluster aware router .集群感知路由器创建跨集群成员节点的消息处理器池，而不是在单个节点中创建所有消息处理器。

除了集群感知路由器，您还可以使用 cluster sharding .就像在一致性哈希池中一样，您需要为集群分片指定一个哈希键，以便将消息一致地路由到正确的参与者。集群感知路由器和分片之间的区别在于分片自动为每个键创建一个actor，因此消息处理器actor不需要分别处理来自不同键的消息。

如果所有的可追踪消息都需要在同一个状态下聚合，你最后的选择是考虑 Akka 的 distributed data特征。在这个特性中，聚合工作分布在多个节点上，并在后期加入。请注意，分布式数据 API 在 Akka 2.4 中仍处于试验阶段。

其他需要研究的领域

跨多个节点分布消息处理意味着单个消息处理器丢失的风险更高(例如网络连接故障、节点崩溃)。为了保持节点之间状态的持久性和可转移性，您可能需要查看 Akka 的 persistence特征。

关于scala - 如果我有一个 Actor 应该有很大的吞吐量怎么办？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39120016/

25

4

0

文章推荐： jquery - 自动打开fancyBox？

文章推荐： java - jTextfield 和进度条不工作

文章推荐： f# - 在 F# 中使用关键字作为成员名称

文章推荐： email - 如何使用带有 gmail smtp 身份验证的用户别名？

haskell - 为什么GHC这么大/很大？
有没有一个简单的答案:为什么 GHC 这么大？ OCaml:2MB Python:15MB SBCL:9MB OpenJRE - 26MB GHC:113MB 对“如果 Haskell 是正确的工具，
apache - access_log 很大，没有被归档。如何重置？
我发现我的 access_log 占用了我的大部分硬盘。它的大小超过 200 GB。我怎样才能重置它？我在装有 Plesk 的 CentOS 服务器上使用 Apache 2.2.3。谢谢你们 !
java - 用解释器评估计算器，但值(value)很大
我正在使用 Java 中的 BeanShell 解释器来解决字符串计算问题。问题是我自己做了一些解释器无法完成的解析并将部分结果存储在 BigInteger 中。然后我将所有内容拼凑起来并交给解释器来
android - OpenCv android apk 很大
我在我的 android 项目中使用 OpenCV native 库。它是一个带有一个 CameraScreen 的 hello world 项目，它已经有 40mb。我怎样才能减少 apk 的大小，
node.js - npm 运行生产后，vendor.js 很大
我使用基于 Laravel 和 Vue.js 的 Laravue Dashboard，在在线服务器上运行，而不是本地主机，它是全新安装，没有进行任何编辑。我的问题是: 运行 npm run watc
hadoop - 如何将我的 Hbase 表(很大)分成相等的部分，以便我可以将它存储到本地文件系统中？
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 5 年前。 Improve this qu
c# - Kendo MVC ToDataSourceResult 非常慢，IQueryable 很大
我广泛使用了 Kendo DataSourceResult ToDataSourceResult(this IQueryable enumerable, DataSourceRequest reque
javascript - jQuery Mobile .ui-page min-height 很大
我使用 phonegap 构建 html\css 应用程序陪审团手机给我 div: 并且模拟器中的最小高度太大，我在底部看到黑线像这样: 如果我在 css 文件中更改 min-height: 736
MySQL:在两个表 A 和 B 中查找匹配的记录，其中 B 很大
以下工作正常但速度太慢。只需要知道B表中有匹配的记录，有什么技巧吗？ (奇怪的是相反的搜索:找到不加入的记录(IS NULL)非常快) SELECT TableA.id FROM TableA
vue.js - Bundle size 很大，如何减小 app.js 的大小？
我正在使用 Vue.js，我的项目中只有 4 个组件。我只导入了bootstrap、jquery 和lodash: import { map } from 'lodash'; import 'boo
algorithm - (2n log(n) + n) 变位词检测函数并不比 4n + 26 函数慢多少，尽管 n 很大
我有 2 个字谜检测功能；一个使用排序和比较，另一个跟踪每个字母字符出现的次数。这里假设传递给函数的两个字符串是相同的，第一个随机生成(未排序)，第二个 = 给第一个，这样两个函数都“一路”执行并返
perl - 使用 N 个并发异步 HTTP 客户端下载 M 个文件，其中 M 很大，N 是可配置的
我正在尝试编写一个脚本，该脚本将通过 HTTP 同时下载最多 N 个文件。我以前用过 AnyEvent::Worker::Pool管理阻塞任务池。我也用过 AnyEvent::HTTP结合AnyEv

首页

博学

6Ren·AI

商城

scala - 如果我有一个 Actor 应该有很大的吞吐量怎么办？