gpt4 book ai didi

apache-kafka - 用于 Azure Blob 存储的 Kafka 连接器

转载 作者:行者123 更新时间:2023-12-04 12:50:52 24 4
gpt4 key购买 nike

我需要将推送到 Kafka 的消息存储在深层存储中。我们正在使用 Azure 云服务,所以我认为 Azure Blob 存储可能是更好的选择。我想使用 Kafka Connect 的接收器连接器 API 将数据推送到 Azure Blob。 Kafka 文档主要建议使用 HDFS 导出数据,但是,在那种情况下,我需要一个运行 Hadoop 的 Linux VM,我想这会很昂贵。我的问题是 Azure Blob 存储是存储 JSON 对象的合适选择,构建自定义接收器连接器是这种情况下的合理解决方案吗?

最佳答案

自定义接收器连接器绝对有效。 Kafka Connect 的设计绝对让您可以插入连接器。事实上,连接器开发是完全联合的。 Confluent 的 JDBC 和 HDFS 连接器首先被实现仅仅是因为这两个用例的流行,但还有更多(我们保留了我们知道的连接器列表 here

关于 Azure blob 存储是否合适,您提到了 JSON 对象。我认为您唯一要考虑的是对象的大小以及 Azure 存储是否能够很好地处理对象的大小和数量。我不确定 Azure 存储的特性,但在许多其他对象存储系统中,您可能需要将许多对象聚合到一个 blob 中以获得大量对象的良好性能(即您可能需要一种支持许多 JSON 对象的文件格式).

关于apache-kafka - 用于 Azure Blob 存储的 Kafka 连接器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38877026/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com