gpt4 book ai didi

hadoop - 如何实现Apache Storm监控HDFS目录

转载 作者:可可西里 更新时间:2023-11-01 15:34:33 25 4
gpt4 key购买 nike

我有一个 HDFS 目录,其中的文件将从许多来源连续复制(流式传输)。

如何构建用于监控 HDFS 目录的拓扑结构,即无论何时在该目录中创建新文件,都应该对其进行处理。

最佳答案

您希望监控 HDFS 文件/目录更改。

看看这个问题,它指向 Oozie 和 HBase 中的现有支持: How to know that a new data is been added to HDFS?当这些工具检测到新文件时,您可以将项目发送到拓扑中进行处理。

或者你可以在 storm 中编写自己的自定义逻辑,定期列出并检查是否有新文件添加到 HDFS 中。查看 Storm 中的刻度元组支持。

关于hadoop - 如何实现Apache Storm监控HDFS目录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27664993/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com