gpt4 book ai didi

apache-spark - 在 Spark Streaming 期间有多少台服务器在监听?

转载 作者:行者123 更新时间:2023-12-04 05:21:57 26 4
gpt4 key购买 nike

我正在检查我的集群的配置,我想通过最小化实际可以访问 http 协议(protocol)的机器数量来加强安全性

所以我的问题是:当进行 Spark 流式处理时(比如通过 Twitter 提要),驱动程序是唯一监听流的服务器,然后将数据作为 RDD 重新分发给执行程序,还是每个执行程序都在监听到流?

最佳答案

Spark Streaming 将为在 Spark Streaming 配置期间创建的每个接收器发出长时间运行的任务。这些接收器被分配在集群上的某个节点上。

如果要指定实例化每个接收器的主机,则必须扩展接收器实现并实现

def preferredLocation: Option[String]

关于apache-spark - 在 Spark Streaming 期间有多少台服务器在监听?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31165048/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com