gpt4 book ai didi

amazon-web-services - CloudWatch 警报不会因丢失数据而触发

转载 作者:行者123 更新时间:2023-12-03 08:06:46 25 4
gpt4 key购买 nike

我有一个具有以下配置的 AWS CloudWatch 警报:

Type
Metric alarm

State
OK

Threshold
METRIC_NAME <= 0 for 1 datapoints within 1 day

Last change
2022-04-14 23:30:54

Actions
Actions enabled

Metric name
METRIC_NAME

Statistic
Average

Period
1 day

Datapoints to alarm
1 out of 1

Missing data treatment
Treat missing data as bad (breaching threshold)

Percentiles with low samples
evaluate

过去几天,我们一直缺少该指标的数据,导致图表如下所示:

missing data

我的理解是,鉴于上述配置以及过去 3 天的缺失数据,该警报应该已触发。然而,事实并非如此。基于 AWS 文档:https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html 、周期为 1 天的警报、1 个数据点中的 1 个要警报以及违规的缺失数据处理应将警报状态从 OK -> ALARM 更改。我在这里缺少一个关键组件吗?谢谢!

最佳答案

重读他们的文档:https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html ,特别是标题为数据丢失时如何评估警报状态的部分,我相信我已经解决了这个问题。

CloudWatch 具有似乎不可配置的“评估范围”,他们在确定何时对丢失数据发出警报时使用该范围。实际上需要 3 左右?还是4?在警报转换为 ALARM 状态之前连续时段丢失数据。鉴于我们的周期为 1 天,这意味着直到出现此异常后的第三天或第四天我们才会收到丢失数据的通知,这在警报配置中没有解释。

为了解决此问题,我们将警报更改为使用指标数学 FILL 函数,该函数使用指定值填充该时间段内缺失的数据点。就我而言,我用违规值 0 填充了指标的缺失数据点。

Example其中 m1 是我们最初使用警报跟踪的指标。

关于amazon-web-services - CloudWatch 警报不会因丢失数据而触发,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72091997/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com