gpt4 book ai didi

apache-storm - Storm : when to use setNumTasks?

转载 作者:行者123 更新时间:2023-12-04 04:51:32 25 4
gpt4 key购买 nike

我很好奇需要使用 的情况。 setNumTasks 功能。文档说默认是每个执行程序的一项任务。

如果我有一个“昂贵的”数据库任务(调用需要时间的外部数据库)在一个 bolt 中运行,两边都有“快速”任务,我是否应该为此添加额外的任务?

或者这是“尝试一下,看看会发生什么”的场景之一?

最佳答案

  • 任务数总是 >= 执行者数
  • 可以更改执行程序的数量(不杀死拓扑),但必须遵守约束 num tasks >= num executors。也就是说,如果您的任务比执行程序多,您可以重新平衡拓扑并为其提供更多执行程序。

  • 如何决定您需要多少个执行者/任务?
  • 寻找瓶颈,您指出的瓶颈是一个很好的瓶颈,即访问外部数据源的延迟(查看 Storm UI 上的 bolt 进程延迟)。在这种情况下,你可以(可能应该)在这个 bolt 上有更多的执行单元;如果您有“备用”任务,您可以将它们提升为执行者。
  • 另一个瓶颈是 CPU 使用率(查看 Storm UI 上的 bolt 容量),CPU 密集程度更高的 bolt 将需要更多的执行单元。

  • 我建议你阅读 this page

    关于apache-storm - Storm : when to use setNumTasks?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30850460/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com