gpt4 book ai didi

prometheus - Prometheus - 查询以获得事件增加的百分比

转载 作者:行者123 更新时间:2023-12-02 19:57:43 47 4
gpt4 key购买 nike

我有一个包含路径和状态代码的请求直方图...如果过去一小时内的错误比前一小时增加了 20%,我如何发出警报?

一个指标示例:

{instance="someIp",instance_hostname="someHost",job="someAppName",le="+Inf",method="GET",path="somePath",status_code="500"} 

我应该依赖速率函数吗?像这样:

rate(http_request_duration_seconds{job="someProject", status_code="500"}[60m])

最佳答案

取过去一小时的错误率与前一小时的错误率之比:

(
rate(http_request_duration_seconds_count{status_code="500"}[1h])
/
rate(http_request_duration_seconds_count{status_code="500"}[1h] offset 1h)
)
>
1.2

这将检查错误绝对数量的增加。如果您想检查错误相对数量的增加(例如,过去一小时内 10% 的请求失败,而前一小时内 5% 的请求失败),那么您需要在比较之前将错误率除以总请求率1 小时前同样的事情。

或者您可能想要将两者结合起来,如果错误的相对数量增加了 X%,并且绝对数量超过某个噪声阈值,则发出警报(这样,如果您收到超过 2 个请求,则不会触发该错误)过去一小时,其中一个失败了)。

关于prometheus - Prometheus - 查询以获得事件增加的百分比,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56653118/

47 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com