gpt4 book ai didi

java - 将流数据插入hive

转载 作者:太空宇宙 更新时间:2023-11-04 11:13:32 24 4
gpt4 key购买 nike

我的场景是在我的项目中,我们每分钟从 kafka 获取 200 条消息,需要使用 avro 格式存储在 hive 表中。

如果我们使用 insert scriptf 或每条消息,我相信为每条消息插入需要很长时间。对于这种流数据,我们是否有任何想法,我们必须使用哪种方式以良好的性能插入到配置单元中。

感谢您的帮助。

最佳答案

您是否有兴趣使用 Apache Storm 作为流媒体机制。这可以通过使用您可以轻松搜索的 Storm 的 kafka-to-hive bolt 来完成。如果您是,请告诉我,然后我可以为您指出正确的方向。

关于java - 将流数据插入hive,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45740322/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com