gpt4 book ai didi

hadoop - 边缘或工作节点上的 Flume?

转载 作者:可可西里 更新时间:2023-11-01 16:42:22 24 4
gpt4 key购买 nike

对于数据摄取,我想使用 flume 并将其放在边缘节点(在集群外的安全 DMZ 中)或一个工作节点上。

  • 是否有放置位置的最佳实践?
  • 每种方法的优点/缺点是什么?

最佳答案

工作节点(即数据节点)上的 Flume 存在一个问题。使用 HDFS,当客户端在数据节点上运行时写入数据时,数据的第一个副本始终写入本地数据节点。

所以如果你有很多数据节点,然后你只在其中几个上运行 Flume,那么这些数据节点往往会比其他节点使用更多的空间。这实际上取决于您计划使用 Flume 写入多少数据,这是否会成为一个问题,以及您是否在写入数据后对其进行处理。

在边缘节点上安装 Flume 也可能有很好的防火墙/安全原因 - 这实际上取决于您的要求。

关于hadoop - 边缘或工作节点上的 Flume?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39604141/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com