gpt4 book ai didi

用于分布式累积批处理作业的 Prometheus 检测

转载 作者:行者123 更新时间:2023-12-02 02:53:21 28 4
gpt4 key购买 nike

我每天多次运行构建脚本。我的感觉是我和我的同事花费了大量时间等待这个脚本执行。现在想知道:我们每天花多少时间等待脚本执行? .我可以对总体平均值感到满意,即使我真的很想拥有每天的数据(例如“上周一我们花了 X 分钟等待脚本执行,周二......)

为了找到答案,我使用推送网关启动了 Prometheus。在构建脚本中,我向推送网关添加了一个 REST 调用,该调用发布标有机器名称和示例数据的指标(类型:counter),以及执行脚本所用的时间。

正在收集数据,但我意识到我收集的数据不足以回答我的问题,我需要将我推送的指标(即:当前运行时间)累积到以前的数据中。 Looking at the documentation ,我觉得这不会通过推送网关支持:

The Pushgateway is explicitly not an aggregator or distributed counter but rather a metrics cache



我的问题是:
  • 是否可以通过 Prometheus Push Gateway 收集我想要的指标。如果没有,我有什么选择?
  • 如果可能,我应该如何收集哪些指标?
  • 最佳答案

    总的来说,Pushgateway确实不是分布式计数器,但是……

    恕我直言,正确看待 Pushgateway 的方式就像“又一个抓取端点”。
    这意味着,它 不会聚合您插入的指标,并将“按原样”保留它们。
    但您实际上不需要将其聚合 - Prometheus 将 来自 PushGateway 的数据,您的所有数据都将在 Prometheus 中可用。

    之后 - 您可以通过 Prometheus 运行任何您想要的查询 - 直接从 Prometheus 使用 PromQL,或利用 Grafana。

    备注 :有几个关于 Pushgateway 的讨论,使用它有它的缺点。有一般guideline "non-goals" recommendation使用 Pushgateway 作为“ 最后一个选项 ” - 建议改为公开/metrics 路由,即使在工作中也是如此。

    附言如果您认为您确实需要聚合指标,可以查看 Weavework's aggregation gateway ,在同一篇文章中提到。但再一次 - 我认为这不是你要找的。

    关于用于分布式累积批处理作业的 Prometheus 检测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50923880/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com