- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是 Prometheus 和 Micrometer 的新手。我试图在 JVM 的堆内存使用量超过某个阈值时发出警报。
- alert: P1 - Percentage of heap memory usage on environment more than 3% for 5 minutes.
expr: sum(jvm_memory_used_bytes{application="x", area="heap"})*100/sum(jvm_memory_max_bytes{application="x", area="heap"}) by (instance) > 3
for: 5m
labels:
priority: P1
tags: infrastructure, jvm, memory
annotations:
summary: "Percentage of heap memory is more than threshold"
description: "Percentage of heap memory for instance '{{ $labels.instance }}' has been more than 3% ({{ $value }}) for 5 minutes."
最佳答案
您希望随时间平均堆使用量。我想出了以下内容:
- name: jvm
rules:
- alert: jvm_heap_warning
expr: sum(avg_over_time(jvm_memory_used_bytes{area="heap"}[1m]))by(application,instance)*100/sum(avg_over_time(jvm_memory_max_bytes{area="heap"}[1m]))by(application,instance) >= 80
for: 1m
labels:
severity: warning
annotations:
summary: "JVM heap warning"
description: "JVM heap of instance `{{$labels.instance}}` from application `{{$labels.application}}` is above 80% for one minute. (current=`{{$value}}%`)"
关于jvm - 如何使用 Micrometer 和 Alertmanager 警告 Prometheus 中的 JVM 内存使用情况,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53008063/
我正在开发一个仪表板,它接收所有 Alertmanager 读数并处理它们。我在请求负载中寻找一个唯一的字段来在我的数据库中创建一个唯一的外部警报 ID。请求有效负载如下所示: { "status
我正在使用警报管理器来获取普罗米修斯指标的警报,我对不同的指标有不同的警报规则,是否可以为每个警报规则设置不同的间隔,例如对于 metric1,我有规则 1,我需要每天检查此规则间隔,对于 metri
我目前正在尝试设置 Prometheus 和 Alertmanager,我遇到但尚未找到解决方案的问题是我希望通过 oauth2 授权将警报发送到我们的自定义应用程序。 有什么方法可以构建/配置自己的
我面临一个问题,我在alert_rules.yml中使用以下规则 当我收到警报时,它不会返回容器正在运行的主机名。如何实现返回主机名而不是节点ID? 我尝试使用container_label_com_
我是 Loki 的新手,在 Loki 中发出了警报,但我在 Alertmanager 中没有看到任何通知。 Loki 工作正常(收集日志),Alertmanager 也正常(从其他来源获取警报),但来
我在这里看过这个问题/答案:Prometheus AlertManager - Send Alerts to different clients based on routes 这对我来说是一个很好的
我有 2 个服务 A 和 B 我想监视它们。此外,我有 2 个不同的通知 channel X 和 Y 在 AlertManager 配置文件中以 receivers 的形式。 如果服务 A 宕机,我想
虽然 Prometheus 说警报已被触发,但我的警报管理器没有收到任何警报。它说“没有警报”。 这只是为了在我的本地机器上进行测试。这是我的 prometheus.yml --- rule_file
我正在尝试通过 Prometheus 设置 Alertmanager。我已经编写了警报规则和 alertmanager.yaml 文件。我可以通过 alertmanager 向 slack 发送警报。
我创建了扩展警报管理器:界面 public interface AlertManagerExt extends AlertManager { void successCode(String m
我目前正在重新设计警报管理器的现有警报配置。只有一个小问题,我不完全了解警报管理器。 假设我有以下配置; routes: match: severity:"warning" receiver: "
我们使用 PrometheusOperator 在 kubernetes 集群中设置了 Prometheus。我们正在尝试使用 AlertManagerConfig 自定义资源配置 AlertMana
我的警报配置如下。 ALERT PoDHighCPUUsage IF sum(rate(container_cpu_usage_seconds_total{container_label_io_k
我有 Prometheus 运算符,它按预期工作 https://github.com/coreos/prometheus-operator 现在我想申请 alert manager从零开始 阅读文档
我用的是官方stable/prometheus-operator chart 确实使用 helm 部署 Prometheus。 到目前为止,它运行良好,除了烦人的 CPUThrottlingHigh为
情况:我设置了 Prometheus 和 Alertmanager,用于监控各种设备的 CPU 温度等。 Alertmanager 将警报从生产设备发送到 PagerDuty。 我正在监控的设备有不同
我们 Android 应用程序的一个主要组件是在特定时间使用 AlarmManager 向用户发送通知。 . 当用户创建新的“记录”时,我们会在现场排队发出警报。因此,如果下载应用程序、打开它并创建一
我想用 tls 和身份验证来保护我的 Alertmanager,这样在我的网络中,并不是每个人都能访问面向公众的端点。我不想使用 nginx 服务器作为代理。这将是我的普罗米修斯配置: global:
我试图在一个简单的设置中设置警报管理器,它会为收到的每个通知发送一个 Slack 通知。 我希望通过删除 group_by 配置来禁用分组。 问题是,当我一个接一个地发送 2 个警报时,即使警报管理器
我正在使用 Promtail + Loki 来收集我的日志,但我不知道如何提醒 每我的日志文件中的错误。我也在使用 Prometheus、Alertmanager 和 Grafana。我看到有些人已经
我是一名优秀的程序员,十分优秀!