- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
当云函数在 30 分钟内为超过 90% 的执行返回非 OK 状态代码时,我希望收到警报。
我要过滤的系列是 cloudfunctions.googleapis.com/function/execution_count
。在所有记录中,我想计算那些满足 metric.status != 'ok'
的记录。如果过去 30 分钟内所有记录的 90% 满足此条件,我想发出警报。
我查看了 Google Cloud 的监控查询语言文档并找到了有关比率的部分:https://cloud.google.com/monitoring/mql/examples#qlx-ratio-ratio
这是我写条件的方式:
fetch cloud_function
| metric 'cloudfunctions.googleapis.com/function/execution_count'
| { filter metric.status != 'ok'
; ident }
| group_by [resource.function_name]
| ratio
| window 30m
| condition ratio >= 0.9 '1'
它似乎有效,图表显示了正确的值。但是,似乎只要函数返回错误代码,就会发出警报,即使还有其他成功的执行来弥补问题。
例如,这是发出警报时的指标图表,我在“监控”>“警报”>(单击事件部分中的最后一个警报)中获得
警报中报告的函数是 processPurchase
有什么我遗漏的东西可能会导致这个问题吗?查看图表,似乎不应触发警报。然而,我有关于警报的事件和通知。几分钟后解决。
最佳答案
我认为 ratio
不是您的最佳选择,因为 ratio
计算两个对齐输入表的值列的比率。
我想你可以试试下面的代码:
fetch cloud_function
| metric 'cloudfunctions.googleapis.com/function/execution_count'
| align rate(30m)
| every 30m
| group_by [metric.status],
[value_execution_count_percentile: percentile(value.execution_count, 90)]
如您所见,我使用了相同的指标 cloudfunctions.googleapis.com/function/execution_count
但是使用 30 分钟的周期和 90% 的百分比而不是条件比率。
我创建了一个简单的云函数来生成随机错误,
import random
def hello_world(request):
request_json = request.get_json()
x = random.randint(1,2)
if x%2 ==0:
raise NameError("my error x.x")
else:
return f'Hello World!'
然后我使用您发布的指标作为基础来生成我的指标:
fetch cloud_function
| metric 'cloudfunctions.googleapis.com/function/execution_count'
| { t_0:
filter metric.status != 'ok'
| align delta()
| group_by [resource.function_name],
[value_execution_count_aggregate: aggregate(value.execution_count)]
; t_1:
ident
| align delta()
| group_by [resource.function_name],
[value_execution_count_aggregate: aggregate(value.execution_count)] }
| ratio
| window 5m
| condition ratio >= 0.5 '1'
我只是将比率移动到 ratio >= 0.5 '1'
而不是 0.9,并将窗口减小到 5m,以免整天都在获取数据。
但在我的警报配置中,我使用了:如果所有时间序列都违反,则条件触发在查询编辑器中使用条件运算符编辑阈值 = 5
使用此配置,我只会在条件满足时收到警报,而不是在函数返回错误代码时立即收到警报。
关于google-cloud-functions - 如何用谷歌云监控监控云函数错误率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65617605/
我已经在 ubuntu 14.0 上成功安装了 Zabbix 3.2 服务器主机上的 Z 是绿色的。不幸的是,JMX 是红色的。 Zabbix 服务器:192.168.1.112 带有 tomcat
我想制作一个仪表板,显示我们的 Azure 服务总线队列的状态,并显示“添加到队列的消息”、“队列长度”和“已处理的消息”等的历史记录。使用 Azure 管理门户,我可以看到,这些统计信息大部分是手动
我的 MYSQL 每天晚上都有事件,但我不太确定发生了什么,因为即使我将其设置得早于其他事件,它仍然在早上运行。 问题是,我如何检查运行事件的历史记录或日志,哪一个晚上锁了,哪一个是跑了没跑? 谢谢
1、监控log文件大小超过10g的server 和db 复制代码代码如下: create procedure db_sendmail_mssqllogsize as&n
本教程讨论如何使用 AspectJ 开源框架监控 Spring 应用程序在方法执行方面的性能。 传统上,监控每个 Java 方法所花费的时间的最简单方法是在方法的开头和结尾包含一些跟踪行: publi
有什么可以帮助 msmq 监控的吗?当消息出现在队列中并且在休假时相同时,我想获得一些事件/监视器。 最佳答案 查看 Windows 管理性能计数器。 如果您查看管理工具并找到“性能计数器”,您将能够
我的 Tomcat 中的一个巨大的 web 应用程序有时会开始使用过多的 DBCP 连接,从而导致问题。 为了进行调查,我想在每个时间点准确地知道什么线程/方法持有池的连接。不需要是实时的,事后分析就
在浏览器的整个页面生命周期中监视 cookie 并在 cookie 更改时触发事件的最佳 JS 或 JQuery 特定方法是什么? 最佳答案 据我所知,不可能将 change (或类似)事件直接绑定(
我想尽可能详细地报告我的笔记本的执行情况。简而言之,我想实时查看我的笔记本正在执行的每个操作。例如,我的一个函数有一个 sleep 周期为 5 秒的循环,我希望看到程序实际上正在 sleep 并且循环
Azure 容器服务是否与 Azure Monitor 集成?想知道对 kubernetes 集群进行日志记录/监控的最佳方法是什么? 最佳答案 如果您正在 Azure 上寻找监视工具,您可能需要使用
我一直在尝试使用 erlang:monitor/2 来监视 gen_server。不幸的是,每次我尝试这个时,Erlang shell 都会进入无限循环。 这是我为测试这一点而编写的测试程序。 -mo
Azure 容器服务是否与 Azure Monitor 集成?想知道对 kubernetes 集群进行日志记录/监控的最佳方法是什么? 最佳答案 如果您正在 Azure 上寻找监视工具,您可能需要使用
我想使用 编写一个 shell 脚本来监控集群中的消费者滞后 bin/kafka-run-class.sh kafka.tools.ConsumerOffsetChecker --zkconnect
在 .NET 中,假设 thread A 锁定了一个对象。同时,线程B和线程C被阻塞,等待线程A解锁对象。 现在,线程 A 解锁了对象。接下来将选择哪个线程(B 或 C)?它是如何确定的? 最佳答案
我搜索过这个主题,但发现很少有有用的细节。有了这些细节,我尝试编写一些代码如下。 注意:在将此帖子标记为重复之前,请将此帖子中共享的详细信息与其他帖子进行比较,而不仅仅是按主题。 - (NSArray
目录 1、指标监控 2、常用的监控端点 3、定制EndPoint 4、spring boot admin(可以使用)
我们使用 Prometheus 和 Grafana 来监控我们的 Kafka 集群。 在我们的应用程序中,我们使用 Kafka 流,Kafka 流有可能因异常而停止。我们正在记录事件 setUnCau
我正在建立一个复杂的网络仿真,并试图捕捉一些重要的性能测量。 我在服务器上运行了 mininet,并且我将视频从一个 mininet 主机流式传输到另一个(使用 -nodisp 选项,因为我没有 GU
Jenkins 的 openstack-plugin 使用 openstack4j 与 openstack 云对话。我正在寻找一种方法,我们可以从客户端的角度监控 openstack4j 所做的 ht
我正在处理一项需要监控 Thunderbolt 端口连接变化的要求。 (当连接或断开 Thunderbolt 电缆时)。 我尝试使用 IOServiceMatching(kIOUSBInterface
我是一名优秀的程序员,十分优秀!