kubernetes - Prometheus 未从 GKE 中的 cadvisor 接收指标-6ren

kubernetes - Prometheus 未从 GKE 中的 cadvisor 接收指标

转载作者：行者123 更新时间：2023-12-05 02:05:16

31

4

嘿嘿，

我已经在 GKE v1.16.x 中使用 kubernetes 部署了 prometheus、grafana、kube-state-metrics、alertmanager 等设置。我用过 https://github.com/do-community/doks-monitoring作为 yaml 文件的起点。

几天来我一直在尝试调试一种情况，如果能提供一些帮助，我将不胜感激。我的普罗米修斯节点没有从 cadvisor 获取指标。

部署中的所有服务和 pod 都在运行。 prometheus、kube-state-metrics、node-exporter，全部运行 - 没有错误。
prometheus UI 中的 cadvisor 目标显示为“up”。
Prometheus 能够从集群收集其他指标，但不能收集 pod/容器级别的使用指标。
我在查询 kubectl get --raw "/api/v1/nodes/<your_node>/proxy/metrics/cadvisor" 时可以看到 cadvisor 指标，但是当我在普罗米修斯中寻找 container_cpu_usage 时或 container_memory_usage , 没有数据。
我在 prometheus 中的 cadvisor 抓取作业配置

    - job_name: kubernetes-cadvisor
      honor_timestamps: true
      scrape_interval: 15s
      scrape_timeout: 10s
      metrics_path: /metrics/cadvisor
      scheme: https
      bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
      tls_config:
        ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
        insecure_skip_verify: true
      kubernetes_sd_configs:
      - role: node
      relabel_configs:
        - action: labelmap
          regex: __meta_kubernetes_node_label_(.+)

摘自 prometheus/docs/examples。

我在路径和抓取配置方面尝试了一大堆不同的变体，但没有成功。基于我可以使用 kubectl get 查询指标这一事实(它们存在)在我看来问题是普罗米修斯与 cadvisor 目标通信。

如果有人有过此配置的经验，我肯定会感谢一些帮助调试。

干杯

最佳答案

我找到了一个博客，其中包含适合我的示例配置。 cadvisor(和 kubelet)指标的 GKE 端点与文档示例中的标准端点不同。这是我工作的普罗米修斯工作的摘录:

    - job_name: kubernetes-cadvisor
      honor_timestamps: true
      scrape_interval: 15s
      scrape_timeout: 10s
      metrics_path: /metrics/cadvisor
      scheme: https
      bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
      tls_config:
        ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
        insecure_skip_verify: true
      kubernetes_sd_configs:
      - role: node
      relabel_configs:
        - action: labelmap
          regex: __meta_kubernetes_node_label_(.+)
        - target_label: __address__
          replacement: kubernetes.default.svc.cluster.local:443
        - source_labels: [__meta_kubernetes_node_name]
          regex: (.+)
          target_label: __metrics_path__
          replacement: /api/v1/nodes/${1}/proxy/metrics/cadvisor
    - job_name: kubernetes-kubelet
      honor_timestamps: true
      scrape_interval: 15s
      scrape_timeout: 10s
      metrics_path: /metrics
      scheme: https
      bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
      tls_config:
        ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
        insecure_skip_verify: true
      kubernetes_sd_configs:
      - role: node
      relabel_configs:
      - action: labelmap
        regex: __meta_kubernetes_node_label_(.+)
      - target_label: __address__
        replacement: kubernetes.default.svc.cluster.local:443
      - target_label: __metrics_path__
        source_labels: [__meta_kubernetes_node_name]
        regex: (.+)
        replacement: /api/v1/nodes/${1}/proxy/metrics

编辑:这是博文的链接 -> https://medium.com/htc-research-engineering-blog/monitoring-kubernetes-clusters-with-grafana-e2a413febefd .

关于kubernetes - Prometheus 未从 GKE 中的 cadvisor 接收指标，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63691208/

31

4

0

文章推荐： azure-devops - Azure Devops - 有没有办法在结帐前执行 taskkill

文章推荐： github - 我无法登录 Visual Studio Code 以进行 Live Share

文章推荐： julia - 如何从命令行更新 Julia？

文章推荐： azure - 验证 Azure APIM 策略中的多个颁发者

linux - cAdvisor 不显示所有容器的正常运行时间(Prometheus+cAdvisor+Grafana)
环境: Linux (Redhat7) 已部署 docker(cAdvisor、Prometheus、Grafana) cAdvisor 收集指标 > 传递给 Prometheus > 用 Grafa
kubernetes - cadvisor 错误报告容器内存使用情况
cAdvisor 报告 Prometheus 使用的内存为 14GB，而 top 报告为 6.xGB。有人可以解释为什么会出现这种差异吗？ container_memory_usage_bytes
kubernetes - 为什么容器内存使用量在 cAdvisor 指标中翻倍？
我测试了这些查询。第一个查询是第二个查询值的一半: sum(container_memory_working_set_bytes{image!="",name=~"^k8s_.*",pod=~"$po
docker - google/cadvisor:最新的图像监视器容器运行错误
我在bugzilla.redhat.com的上述“devicemapper”上发现了以下错误。它使我可以安装“device-mapper-persistent-data”软件包。但是，当我安装它时，出
docker - cAdvisor:如何使用远程Docker API运行它？
有没有办法在监视服务器中运行cAdvisor容器并在单独的服务器中监视docker容器？运行cAdvisor时可以包含一个命令吗？因为我希望能够监视单独服务器中的容器，但不确定如何实现… 任何建议或
docker - Prometheus cAdvisor docker 监控
我已经使用 Prometheus、Grafana 和 cAdvisor 设置了一个 docker 监控堆栈。使用此查询获取正在运行的容器时: count_scalar(container_last_s
docker - Docker图像> google/cadvisor:latest
我不记得启动这个容器: IMAGE COMMAND CREATED ST
docker - Openshift监控-cAdvisor + Prometheus-Docker
我尝试为基于Prometheus + node-exporter + grafana + cAdvisor的Openshift集群实现监视解决方案。我对cAdvisor组件有很大的疑问。我做了很多配
kubernetes - cAdvisor Web UI 是否已被弃用
似乎有混杂的信息，我找不到任何官方消息来源证实了这一点。来自 Kubernetes changelog , 似乎已弃用通过 kubelet 提供的 cAdvisor Web UI: The for
kubernetes - cAdvisor Prometheus container_cpu_load_average_10s 有两个值
我有一个运行在 digital ocean 上的 kubernetes 集群，我想监控它。在 /api/v1/nodes//proxy/metrics/cadvisor 上查询公开的 cAdvisor
docker - 我们如何从 CAdvisor docker 容器中收集性能指标？
抱歉我才刚开始学docker。对于你们中的一些人来说，我的问题可能看起来很愚蠢。事实上，我想知道是否有一种方法可以从“CAdvisor”容器(不是来自 cgroup)在运行时收集性能指标？我的意思是
未显示容器的 Prometheus 和 cadvisor 磁盘使用情况
我在使用 cadvior 监控的容器的 Prometheus 中找不到任何磁盘使用痕迹。它们的值都为 0。唯一有值的是 id="/"的值。所有非根条目都是0。我检查了查询 changes(conta
go - Cadvisor 支持 ELK 堆栈
ELK stack被大量使用，但cAdvisor只支持influxdb。所以我想基于 Lumberjack 协议(protocol)实现一个日志存储转发驱动器。我认为 cAdvisor 可以将指标数
Docker学习6 - Portainer可视化监控管理Docker工具（轻量级）、CAdvisor+InfluxDB+Granfana - Docker容器监控（重量级）
工具 Portainer - 可视化操作Docker（轻量级监控）官网： https://www.portainer.io/ 作用：可视化管理Docker操作、启动、拉取镜像、管理docker
与 cadvisor 相比，Docker stats 显示了不同的数据
我有 2 个 Docker 容器在 Centos 机器上运行出于 Docker 内存监控的目的，我通过 Docker 镜像在机器上安装了“ cadvisor ” 当我比较“ Docker stats
linux - 数以千计的 cAdvisor Docker 容器被创建，直到磁盘空间不足
Google Compute Engine 容器优化的 VM 镜像有一个自动启动的内置 cAdvisor 容器。在过去的三天里，一个无限循环开始创建大约 15000 个 cAdvisor 镜像容器，
kubernetes - Prometheus 未从 GKE 中的 cadvisor 接收指标
嘿嘿，我已经在 GKE v1.16.x 中使用 kubernetes 部署了 prometheus、grafana、kube-state-metrics、alertmanager 等设置。我用过 h
elasticsearch - cadvisor, elasticsearch, docker : no Elasticsearch node available
我正在尝试使用 docker 将 cadvisor 连接到 elasticsearch，但出现错误: cadvisor.go:113] Failed to initialize storage dri
docker - cAdvisor prometheus 集成将 container_cpu_load_average_10s 返回为 0
我已将 Prometheus 配置为从 cAdvisor 抓取指标。但是，指标“container_cpu_load_average_10s”仅返回 0。我能够在 cAdvisor Web UI 下正
kubernetes - 在 cAdvisor 的刮板中更改 Prometheus 作业标签会破坏 Grafana 仪表板
我使用 Helm 在我的 Kubernetes 集群上安装了 Prometheus，使用社区图表 kube-prometheus-stack - 我在捆绑的 Grafana 实例中得到了一些漂亮的仪表

首页

博学

6Ren·AI

商城

kubernetes - Prometheus 未从 GKE 中的 cadvisor 接收指标