gpt4 book ai didi

hadoop - 如何在Hadoop集群的数据管道中设置监控系统?

转载 作者:行者123 更新时间:2023-12-02 21:11:21 27 4
gpt4 key购买 nike

流水线的数据输入来自数据库或Web记录器。管道对其进行处理,并将其放入HDFS中,然后将数据移至NoSQL数据库。监控系统将端到端进行监控。

最佳答案

您可以考虑使用ELK堆栈(ElasticSearch,Logstash,Kibana)。在每个节点上,提取,处理并插入db,请查看是否可以添加有关要处理的每个文件/记录的日志。

您可以在每个节点上部署logstash并为其编写解析逻辑,将其写入ElasticSearch并使用Kibana对其进行可视化。

您还可以考虑使用Elastic.co的Watcher插件在发生错误时生成警报。

以下是一些入门的链接。

Install EKL

Log Analysis

Alerting

关于hadoop - 如何在Hadoop集群的数据管道中设置监控系统?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40251292/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com