prometheus - 如何使用 Promtail/Loki - AlertManager 为我的日志中的每个错误发送警报？-6ren

prometheus - 如何使用 Promtail/Loki - AlertManager 为我的日志中的每个错误发送警报？

转载作者：行者123 更新时间：2023-12-03 16:26:15

25

4

我正在使用 Promtail + Loki 来收集我的日志，但我不知道如何提醒每我的日志文件中的错误。我也在使用 Prometheus、Alertmanager 和 Grafana。我看到有些人已经成功地做到了这一点，但他们都没有解释细节。需要明确的是，我不是在寻找处于 FIRING 状态的警报或具有“警报”状态的 Grafana 仪表板。我所需要的就是每次在我的一个日志中出现错误时都知道。
如果不能完全以这种方式完成，下一个最佳解决方案是每 X 秒抓取一次，然后发出类似“6 条新错误消息”的警报。

最佳答案

Loki v2.0 提供了一种新的警报方式:https://grafana.com/docs/loki/latest/alerting/
您现在可以直接在 Loki 中配置它并将其发送到 Alertmanager。
更新:
根据要求提供一个简单的警报示例:

  groups:
  - name: NumberOfErrors
    rules:
    - alert: logs_error_count_kube_system
      expr: rate({namespace="kube-system"} |~ "[Ee]rror"[5m]) > 5
      for: 5m
      labels:
        severity: P4
        Source: Loki

关于prometheus - 如何使用 Promtail/Loki - AlertManager 为我的日志中的每个错误发送警报？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62247602/

25

4

0

文章推荐： python - 展开DataFrame的索引级别

文章推荐： r - dplyr的`cummean()`函数未提供预期的结果

文章推荐： typescript - 重新导出 typescript .d.ts 定义文件中的所有类型

文章推荐： encryption - 检查文件是否是有效的 pgp 加密文件

prometheus-alertmanager - Alertmanager 中的指纹字段是唯一的吗？
我正在开发一个仪表板，它接收所有 Alertmanager 读数并处理它们。我在请求负载中寻找一个唯一的字段来在我的数据库中创建一个唯一的外部警报 ID。请求有效负载如下所示: { "status
Alertmanager，不同警报规则的不同间隔
我正在使用警报管理器来获取普罗米修斯指标的警报，我对不同的指标有不同的警报规则，是否可以为每个警报规则设置不同的间隔，例如对于 metric1，我有规则 1，我需要每天检查此规则间隔，对于 metri
Prometheus alertmanager 自定义接收器
我目前正在尝试设置 Prometheus 和 Alertmanager，我遇到但尚未找到解决方案的问题是我希望通过 oauth2 授权将警报发送到我们的自定义应用程序。有什么方法可以构建/配置自己的
docker - AlertManager —容器警报在运行时未返回主机名
我面临一个问题，我在alert_rules.yml中使用以下规则当我收到警报时，它不会返回容器正在运行的主机名。如何实现返回主机名而不是节点ID？我尝试使用container_label_com_
yaml - Loki 没有提醒 Alertmanager
我是 Loki 的新手，在 Loki 中发出了警报，但我在 Alertmanager 中没有看到任何通知。 Loki 工作正常(收集日志)，Alertmanager 也正常(从其他来源获取警报)，但来
prometheus - 如何在 Alertmanager 中向一个接收者组发送多个警报？
我在这里看过这个问题/答案:Prometheus AlertManager - Send Alerts to different clients based on routes 这对我来说是一个很好的
monitoring - Prometheus AlertManager - 根据路由向不同客户端发送警报
我有 2 个服务 A 和 B 我想监视它们。此外，我有 2 个不同的通知 channel X 和 Y 在 AlertManager 配置文件中以 receivers 的形式。如果服务 A 宕机，我想
monitoring - Prometheus 不会将警报推送到 AlertManager
虽然 Prometheus 说警报已被触发，但我的警报管理器没有收到任何警报。它说“没有警报”。这只是为了在我的本地机器上进行测试。这是我的 prometheus.yml --- rule_file
kubernetes - CommonAnnotations 不适用于 AlertManager
我正在尝试通过 Prometheus 设置 Alertmanager。我已经编写了警报规则和 alertmanager.yaml 文件。我可以通过 alertmanager 向 slack 发送警报。
java - 如何覆盖 Tapestry AlertManager
我创建了扩展警报管理器:界面 public interface AlertManagerExt extends AlertManager { void successCode(String m
go - Prometheus alertmanager 的处理顺序
我目前正在重新设计警报管理器的现有警报配置。只有一个小问题，我不完全了解警报管理器。假设我有以下配置； routes: match: severity:"warning" receiver: "
kubernetes - AlertManager 没有将警报转发给 webhook 接收器
我们使用 PrometheusOperator 在 kubernetes 集群中设置了 Prometheus。我们正在尝试使用 AlertManagerConfig 自定义资源配置 AlertMana
prometheus - 在 Alertmanager webhook 中使用标签
我的警报配置如下。 ALERT PoDHighCPUUsage IF sum(rate(container_cpu_usage_seconds_total{container_label_io_k
kubernetes - K8S - 无法通过 - alertmanager 查看警报
我有 Prometheus 运算符，它按预期工作 https://github.com/coreos/prometheus-operator 现在我想申请 alert manager从零开始阅读文档
kubernetes - 如何使用配置文件使 Prometheus Alertmanager 静音？
我用的是官方stable/prometheus-operator chart 确实使用 helm 部署 Prometheus。到目前为止，它运行良好，除了烦人的 CPUThrottlingHigh为
monitoring - Prometheus-Alertmanager 警报的复杂规则/过滤器
情况:我设置了 Prometheus 和 Alertmanager，用于监控各种设备的 CPU 温度等。 Alertmanager 将警报从生产设备发送到 PagerDuty。我正在监控的设备有不同
java - Android AlertManager 通过重启、更新等
我们 Android 应用程序的一个主要组件是在特定时间使用 AlarmManager 向用户发送通知。 . 当用户创建新的“记录”时，我们会在现场排队发出警报。因此，如果下载应用程序、打开它并创建一
security - 为 Alertmanager 配置 HTTPS 和基本身份验证
我想用 tls 和身份验证来保护我的 Alertmanager，这样在我的网络中，并不是每个人都能访问面向公众的端点。我不想使用 nginx 服务器作为代理。这将是我的普罗米修斯配置: global:
prometheus-alertmanager - 普罗米修斯警报管理器 : How do I prevent grouping in notifications
我试图在一个简单的设置中设置警报管理器，它会为收到的每个通知发送一个 Slack 通知。我希望通过删除 group_by 配置来禁用分组。问题是，当我一个接一个地发送 2 个警报时，即使警报管理器
prometheus - 如何使用 Promtail/Loki - AlertManager 为我的日志中的每个错误发送警报？
我正在使用 Promtail + Loki 来收集我的日志，但我不知道如何提醒每我的日志文件中的错误。我也在使用 Prometheus、Alertmanager 和 Grafana。我看到有些人已经

首页

博学

6Ren·AI

商城

prometheus - 如何使用 Promtail/Loki - AlertManager 为我的日志中的每个错误发送警报？