gpt4 book ai didi

prometheus - 如何在 prometheus predict_linear 中使用预测

转载 作者:行者123 更新时间:2023-12-05 08:31:40 25 4
gpt4 key购买 nike

我是普罗米修斯的新手,

我正在尝试预测节点 1 和节点 2 上接下来 5 小时的 CPU 使用情况。

我的代码是

'''

    predict_linear(cpu_usage[5m],5*3600)

'''由于 cpu_usage 包含两个节点,当我使用上面的等式时,我得到了两个预测结果,这是我不想要的。

所以我通过添加来改进我的代码'''

    sum(predict_linear(cpu_usage[5m],5*3600)).

'''我不确定这是不是正确的方法。我阅读了文档,其中提到 predic_linear 仅适用于 gauge。

谢谢大家,

最佳答案

主动监控并不真正适用于 cpu。它更适合系统资源耗尽,例如内存或驱动器空间。 100% 的 CPU 使用率没有任何问题,前提是这并不意味着您的应用程序存在性能问题。

如果您确实有一些基准显示 cpu 不应达到 100%,那么它是基于 react 的:如果 cpu 在给定时间内停留在 100% cpu,您希望收到警报。

关于您的问题,基于 5 分钟的数据预测 future 5 小时的预测会非常嘈杂。应用程序在几分钟(甚至几十分钟)内增加消耗并不少见。此外,即使应用程序内存使用的形状是一个完美的步骤,predic_linear() 函数使用线性回归 a 将计算步骤底部和顶部(在某个点)的平均速率。

如果内插到 5 小时,这个小消耗率会很快加起来。例如,如果您的节点配置为中等大小 (4GiB),并且您在 t0 时的内存消耗接近 0,则未检测到内存中断的最大速率将为 4*Gi/(5*60)=~13MB/分钟。如果您对此发出警报,就会出现大量误报。

我发现它对以下方面很有用:

  • 增加测量数据的范围(经验法则 ~ 20% 或 25% 的插值时间,因此 5 小时预测为 1 小时)
  • 调整规则中的 for 子句以减少误报
  • 添加电流消耗限制:如果电流水平低于 60%,检测到的断电很可能不是真实的

最后,你的问题有很多要点:

  • 计算 cpu 总和:您宁愿计算平均值,它会给出总体 cpu 使用情况 - 我从来没有发现它特别有用,因为应用程序可能会卡在 cpu 上并且受 cpu 限制
  • 两个预测结果:我希望这是你想要的,每个 cpu 应该单独提醒
  • predict_linear 仅用于测量:它可以应用于计数器,但如本答案开头所述,它更适合用于资源耗尽,您不会用计数器测量资源。

关于prometheus - 如何在 prometheus predict_linear 中使用预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56606452/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com