gpt4 book ai didi

monitoring - 如何使用 telegraf 监控远程系统指标?

转载 作者:行者123 更新时间:2023-12-02 14:53:30 26 4
gpt4 key购买 nike

对于如何构建一堆 telegraf + InfluxDB + Grafana 以监控一组机器,我将不胜感激。

我的场景

我已经在我称之为“监控实例”的机器上成功安装了堆栈 telegraf + InfluxDB + Grafana

我的系统是一个 API,由一台运行 nodejs 的机器和一个 postgres 实例组成。

我可以从我的 Postgresql 数据库(使用 postgres 的 telegraf 输入插件)和我的应用程序(我正在公开一些 telegraf 使用 prometheus 输入插件提取的 prometheus 格式的指标)收集指标。

我的问题和疑惑

  • 监控节点和 postgres 实例的系统指标(cpu、内存等)的最佳方法是什么?我应该在这台机器上安装 telegraf 代理吗?
  • 如何将本地数据发送给“监控实例”?
  • 本地 telefraf 代理应该直接写入 influxdb 还是应该将指标发送到安装在“监控实例”中的 telefraf?

提前致谢。

最佳答案

系统/服务器指标应由本地安装的 telegraf 收集。

您可以将指标从系统 telegraf 直接发送到 influxdb。但是,这使得涌入的监听器容易受到本地 telegraf 实例传输的数据量的影响。它无法优雅地缩放。

相反,您可以在系统 telegraf 实例和 influx 之间放置一个队列或 Kafka。这将平滑任何意外的负载,并应保持涌入的听众稳定。在 queue/Kafka 和 influx 之间,您可以有一组专用的 telegraf 实例,将数据从 queue/Kafka 加载到 influx 中。它们可以作为 Kafka 消费者组运行,并且应该可以轻松扩展。

系统telegraf —> Kafka —> telegraf —> influx —> Grafana

关于monitoring - 如何使用 telegraf 监控远程系统指标?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54267675/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com