gpt4 book ai didi

apache-nifi - Apache Nifi - 使用 Kafka + 合并内容 + 放置 HDFS 以避免小文件

转载 作者:行者123 更新时间:2023-12-03 23:15:38 26 4
gpt4 key购买 nike

我在 Kafka 主题中有大约 2000000 条消息,我想使用 NiFi 将这些记录放入 HDFS,所以我使用 PutHDFS处理器以及 ConsumeKafka_0_10但它在 HDFS 中生成小文件,所以我使用合并内容处理器在推送文件之前合并记录。
enter image description here
如果配置需要更改,请提供帮助 这适用于少量消息,但当涉及具有大量数据的主题时,为每条记录写入一个文件。

谢谢!!

最佳答案

最小条目数设置为 1,这意味着它可以从 1 到最大条目数。尝试将其设置为更高,例如 100k。

关于apache-nifi - Apache Nifi - 使用 Kafka + 合并内容 + 放置 HDFS 以避免小文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51403511/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com