gpt4 book ai didi

datadog - 如何结合 datadog io 指标来识别磁盘瓶颈?

转载 作者:行者123 更新时间:2023-12-01 09:19:51 29 4
gpt4 key购买 nike

我正在尝试在 DataDog 中创建一个警报,当磁盘性能降低我们的机器速度时会提醒我们。

作为业务需求,我会说如果 IO 几乎饱和(超过 90%)超过 30 分钟,则应该触发警报。

以下是当前记录的一组指标:
系统.cpu.iowait
system.io.avg_q_sz
system.io.avg_rq_sz
系统.io.await
system.io.r_await
系统.io.r_s
system.io.rkb_s
system.io.rrqm_s
系统.io.svctm
系统.io.util
system.io.w_await
系统.io.w_s
system.io.wkb_s
system.io.wrqm_s
enter image description here

可以使用任何公式来组合这些值,包括 SUM 和 AVG 值。

最佳答案

这些 system.io 指标来自 system agent check在底层使用 iostat

根据iostat manpage %util 指标之一(在 Datadog 中报告为 system.io.util)似乎可以完成这项工作:

%util: Percentage of CPU time during which I/O requests were issued to the device (bandwidth utilization for the device). Device saturation occurs when this value is close to 100%.

您可以创建一个监视器,作为主机/设备上的多警报,当此指标在过去 30 分钟内平均超过 90 时,以下是此类示例的当前屏幕截图:

example monitor in Datadog

当然,也可以监控其他 iostat 指标来识别其他 I/O 性能故障模式。

关于datadog - 如何结合 datadog io 指标来识别磁盘瓶颈?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35224366/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com