gpt4 book ai didi

Flume 自动可扩展性和故障转移

转载 作者:行者123 更新时间:2023-12-04 18:49:30 25 4
gpt4 key购买 nike

我的公司正在考虑使用水槽进行一些相当大容量的日志处理。我们认为日志处理需要分布式,出于容量(可扩展性)和故障转移(可靠性)的原因,Flume 似乎是显而易见的选择。

然而,我们认为我们一定遗漏了一些明显的东西,因为我们没有看到 Flume 如何提供自动可伸缩性和故障转移。

我想定义一个流,说对于每个日志行,做 A,然后传递它并做 B,然后传递它并做 C,依此类推,这似乎与 Flume 很匹配。但是,我希望能够用纯粹的逻辑术语来定义这个流,然后基本上说,“嘿 Flume,这里是服务器,这里是流定义,开始工作!”。服务器会死,(运算符(operator)会重新启动它们),我们将向集群添加服务器,并淘汰其他服务器,flume 只会将工作引导到任何有可用容量的节点上。

这个描述是 Hadoop map-reduce 如何实现可扩展性和故障转移,我假设 Flume 也是一样的。但是,文档似乎暗示我需要手动配置每个逻辑节点在哪些物理服务器上运行,并为每个节点配置特定的故障转移方案。

我是对的,Flume 没有达到我们的目的,还是我错过了什么?

谢谢你的帮助。

最佳答案

根据您是否使用多个主机,您可以对配置进行编码以遵循故障转移模式。

这在指南中相当详细:http://archive.cloudera.com/cdh/3/flume/UserGuide/index.html#_automatic_failover_chains

回答你的问题,坦率地说,Flume 还没有自动找出故障转移方案的能力。

关于Flume 自动可扩展性和故障转移,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8436956/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com