gpt4 book ai didi

amazon-web-services - Kafka Connect 与 AWS Hadoop 实例的托管

转载 作者:可可西里 更新时间:2023-11-01 16:29:27 24 4
gpt4 key购买 nike

对于生产类型的设置,其中 TB 的记录将写入 KAFKA 主题,使用 KAFKA connect - HDFS 连接器的最佳实践是什么?

我的 kafka 实例在 AWS 主机名 a.b.c.d 上运行,我的 hadoop 名称节点在 AWS 主机名 p.q.r.s 上。出于开发/POC 的目的,我们在运行 kafka 实例的同一个盒子中保持融合,即在 a.b.c.d 上。 HDFS 集群大小为 500GB。

但是对于集群大小为 20-30 TB 的生产类型设置,是否建议在与 KAFKA 实例相同的盒子或名称节点盒子或单独的盒子中保持汇合?在这样的生产案例中,confluent 需要多少单独的磁盘大小?

最佳答案

当您说“汇合”时,我假设您指的是 Connect 工作人员,因此此评论基于该假设。最明智的做法是尽可能单独提供服务。 worker 与 broker 分开运行,与 NameNode 分开运行。 Connect worker 只需要很少的磁盘空间,因为它们不保存数据(独立模式下的偏移量数据除外)。在分布式模式下,您可以弹性扩展工作人员,因此分离事物对于长期可扩展设置也更好。

对于您的用例,如果您想在同一个盒子中运行所有东西,您确实需要进行基准测试以确保性能可以接受。弄清楚是否可以共同定位确实是一个咨询问题,需要您的用例详细信息达到可能不适合在线论坛的水平。

关于amazon-web-services - Kafka Connect 与 AWS Hadoop 实例的托管,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41800347/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com