kubernetes - kube-dns getsockopt 没有路由到主机-6ren

kubernetes - kube-dns getsockopt 没有路由到主机

转载作者：行者123 更新时间：2023-12-02 11:44:51

我正在努力了解如何在 kubernetes 1.10 上使用 flannel 正确配置 kube-dns，并将 containerd 作为 CRI。

kube-dns 无法运行，出现以下错误:

kubectl -n kube-system logs kube-dns-595fdb6c46-9tvn9 -c kubedns
I0424 14:56:34.944476       1 dns.go:219] Waiting for [endpoints services] to be initialized from apiserver...
I0424 14:56:35.444469       1 dns.go:219] Waiting for [endpoints services] to be initialized from apiserver...
E0424 14:56:35.815863       1 reflector.go:201] k8s.io/dns/pkg/dns/dns.go:192: Failed to list *v1.Service: Get https://10.96.0.1:443/api/v1/services?resourceVersion=0: dial tcp 10.96.0.1:443: getsockopt: no route to host
E0424 14:56:35.815863       1 reflector.go:201] k8s.io/dns/pkg/dns/dns.go:189: Failed to list *v1.Endpoints: Get https://10.96.0.1:443/api/v1/endpoints?resourceVersion=0: dial tcp 10.96.0.1:443: getsockopt: no route to host
I0424 14:56:35.944444       1 dns.go:219] Waiting for [endpoints services] to be initialized from apiserver...
I0424 14:56:36.444462       1 dns.go:219] Waiting for [endpoints services] to be initialized from apiserver...
I0424 14:56:36.944507       1 dns.go:219] Waiting for [endpoints services] to be initialized from apiserver...
F0424 14:56:37.444434       1 dns.go:209] Timeout waiting for initialization

kubectl -n kube-system describe pod kube-dns-595fdb6c46-9tvn9
  Type     Reason     Age                 From              Message
  ----     ------     ----                ----              -------
  Warning  Unhealthy  47m (x181 over 3h)  kubelet, worker1  Readiness probe failed: Get http://10.244.0.2:8081/readiness: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers)
  Warning  BackOff    27m (x519 over 3h)  kubelet, worker1  Back-off restarting failed container
  Normal   Killing    17m (x44 over 3h)   kubelet, worker1  Killing container with id containerd://dnsmasq:Container failed liveness probe.. Container will be killed and recreated.
  Warning  Unhealthy  12m (x178 over 3h)  kubelet, worker1  Liveness probe failed: Get http://10.244.0.2:10054/metrics: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers)
  Warning  BackOff    2m (x855 over 3h)   kubelet, worker1  Back-off restarting failed container

确实没有到 10.96.0.1 端点的路由:

ip route
default via 10.240.0.254 dev ens160 
10.240.0.0/24 dev ens160  proto kernel  scope link  src 10.240.0.21 
10.244.0.0/24 via 10.244.0.0 dev flannel.1 onlink 
10.244.0.0/16 dev cni0  proto kernel  scope link  src 10.244.0.1 
10.244.1.0/24 via 10.244.1.0 dev flannel.1 onlink 
10.244.2.0/24 via 10.244.2.0 dev flannel.1 onlink 
10.244.4.0/24 via 10.244.4.0 dev flannel.1 onlink 
10.244.5.0/24 via 10.244.5.0 dev flannel.1 onlink

什么负责配置集群服务地址范围和关联路由？是容器运行时、覆盖网络(在本例中为 flannel)还是其他什么？应该在哪里配置？
10-containerd-net.conflist配置主机和我的 pod 网络之间的网桥。服务网络也可以在这里配置吗？

cat /etc/cni/net.d/10-containerd-net.conflist 
{
  "cniVersion": "0.3.1",
  "name": "containerd-net",
  "plugins": [
    {
      "type": "bridge",
      "bridge": "cni0",
      "isGateway": true,
      "ipMasq": true,
      "promiscMode": true,
      "ipam": {
        "type": "host-local",
        "subnet": "10.244.0.0/16",
        "routes": [
          { "dst": "0.0.0.0/0" }
        ]
      }
    },
    {
      "type": "portmap",
      "capabilities": {"portMappings": true}
    }
  ]
}

编辑:

刚遇到 this从 2016 年开始:

As of a few weeks ago (I forget the release but it was a 1.2.x where x != 0) (#24429) we fixed the routing such that any traffic that arrives at a node destined for a service IP will be handled as if it came to a node port. This means you should be able to set yo static routes for your service cluster IP range to one or more nodes and the nodes will act as bridges. This is the same trick most people do with flannel to bridge the overlay.

It's imperfect but it works. In the future will will need to get more precise with the routing if you want optimal behavior (i.e. not losing the client IP), or we will see more non-kube-proxy implementations of services.

这仍然相关吗？我需要为服务 CIDR 设置静态路由吗？或者问题实际上是 kube-proxy而不是法兰绒或容器？

我的法兰绒配置:

cat /etc/cni/net.d/10-flannel.conflist 
{
  "name": "cbr0",
  "plugins": [
    {
      "type": "flannel",
      "delegate": {
        "hairpinMode": true,
        "isDefaultGateway": true
      }
    },
    {
      "type": "portmap",
      "capabilities": {
        "portMappings": true
      }
    }
  ]
}

和 kube-proxy:

[Unit]
Description=Kubernetes Kube Proxy
Documentation=https://github.com/kubernetes/kubernetes

[Service]
ExecStart=/usr/local/bin/kube-proxy \
  --cluster-cidr=10.244.0.0/16 \
  --feature-gates=SupportIPVSProxyMode=true \
  --ipvs-min-sync-period=5s \
  --ipvs-sync-period=5s \
  --ipvs-scheduler=rr \
  --kubeconfig=/etc/kubernetes/kube-proxy.conf \
  --logtostderr=true \
  --master=https://192.168.160.1:6443 \
  --proxy-mode=ipvs \
  --v=2
Restart=on-failure
RestartSec=5

[Install]
WantedBy=multi-user.target

编辑:

看过 kube-proxy debugging steps ，看来 kube-proxy无法联系主人。我怀疑这是问题的很大一部分。我在 HAProxy 负载均衡器后面有 3 个 Controller /主节点，绑定(bind)到 192.168.160.1:6443并将循环转发给 10.240.0.1[1|2|3]:6443 上的每个主人.这可以在上面的输出/配置中看到。

在 kube-proxy.service , 我已指定 --master=192.168.160.1:6443 .为什么尝试连接到端口 443？我可以改变这个 - 似乎没有端口标志吗？出于某种原因，它是否需要使用端口 443？

最佳答案

这个答案有两个组成部分，一个是关于运行 kube-proxy还有一个关于这些 :443 URL 的来源。

一、关于kube-proxy : 请不要跑kube-proxy作为这样的系统服务。它旨在由 kubelet 发起在集群中，以便 SDN 地址表现合理，因为它们实际上是“假”地址。通过运行 kube-proxy不受kubelet 的控制，除非你花费大量的精力来复制 kubelet 的方式，否则各种奇怪的事情都会发生。配置其从属 docker 容器。

现在，关于 :443 URL:

E0424 14:56:35.815863 1 reflector.go:201] k8s.io/dns/pkg/dns/dns.go:192: Failed to list *v1.Service: Get https://10.96.0.1:443/api/v1/services?resourceVersion=0: dial tcp 10.96.0.1:443: getsockopt: no route to host

...

Why are connections being attempted to port 443? Can I change this - there doesn't seem to be a port flag? Does it need to be port 443 for some reason?

10.96.0.1 来自集群的 Service CIDR，它(并且应该)与 Pod CIDR 分开，Pod CIDR 应该与节点的子网分开，等等。 .1集群的服务 CIDR 的一部分保留(或传统上分配)给 kubernetes.default.svc.cluster.local Service , 及其一个 Service.port如 443 .

我不太确定为什么 --master标志不会取代 /etc/kubernetes/kube-proxy.conf 中的值但由于该文件很明显只应该由 kube-proxy 使用，为什么不只是更新文件中的值以消除所有疑问？

关于kubernetes - kube-dns getsockopt 没有路由到主机，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50005064/

文章推荐： kubernetes - 如何在现有NFS共享上指定mountOptions

文章推荐： kubernetes - 卷安装的配置图，按标签选择器

文章推荐： kubernetes - 需要建议如何使Spinnaker与AWS ECR配合使用？

kubernetes - 如何将生成的 kube 配置保存到 .kube/config
我正在使用 rke在私有(private)云中生成 Kubernetes 集群。它产生 kube_config_cluster.yml文件。有没有办法将此配置添加到我的 $HOME/.kube/con
ubuntu - 由于缺少 ~/.kube/config，oc cluster up 无法启动 kube-apiserver
我尝试在我的桌面(Ubuntu 18)上运行 OKD。我按照指示:https://opensource.com/article/18/11/local-okd-cluster-linux (simil
kubernetes - kube-controller-manager & kube-scheduler in CrashLoopBackoff kubernetes 错误
我在我的 k8s 中使用 calico 作为 CNI，我试图在 3 个服务器中部署一个主集群。我用的是kubeadm，关注官方setup guide .但是发生了一些错误，kube-controlle
kubernetes - kube-dns 获取 kube-proxy 无法列出 *core.Endpoints
Fresh Kubernetes (1.10.0) 集群使用 kubeadm (1.10.0) 安装在 RHEL7 裸机虚拟机上 Linux 3.10.0-693.11.6.el7.x86_64 #1
kubernetes - kube-apiserver 编辑/etc/kubernetes/manifests/kube-apiserver.yaml 后如何重启
我使用 kubeadm 安装了 kubernetes .为了启用基本身份验证，我添加了 --basic-auth-file=/etc/kubernetes/user-password.txt在我的 /
kubernetes - 重新启动集群时出错 : restarting kube-proxy: waiting for kube-proxy to be up for configmap update: timed out waiting for the condition
我尝试使用 minikube start 启动本地 Kubernetes 集群并收到以下错误。 Starting local Kubernetes v1.10.0 cluster... Startin
linux - Kubernetes on Raspberry Pi kube flannel CrashLoopBackOff 和 kube dns rpc 错误代码 = 2
我用了this tutorial在我的 Raspberry 3 上设置一个 kubernetes 集群。我按照说明进行操作，直到设置 flannel 为止: curl -sSL https://ra
jenkins - 卷 "kube-api-access-fcz9j": object "default"/"kube-root-ca.crt" not registered 的 MountVolume.SetUp 失败
我有一个本地 kubernetes 集群 v1.22.1(1 个主节点和 2 个工作节点)，并且想使用 jenkins 上的 kubernetes 插件在这个 kubernetes 集群上运行 jen
kubernetes - 卷 "kube-api-access-cvwdt": object "default"/"kube-root-ca.crt" not registered 的 MountVolume.SetUp 失败
我只是尝试运行一个简单的批处理作业并收到此错误“卷“kube-api-access-cvwdt”的 MountVolume.SetUp 失败:对象“default”/“kube-root-ca.crt
kubernetes - 卷 "kube-api-access-cvwdt": object "default"/"kube-root-ca.crt" not registered 的 MountVolume.SetUp 失败
我只是尝试运行一个简单的批处理作业并收到此错误“卷“kube-api-access-cvwdt”的 MountVolume.SetUp 失败:对象“default”/“kube-root-ca.crt
Kubernetes kind : sudo kind delete cluster failed to lock config file: open /root/.kube/config.lock: read-only file system but no such file [closed](Kubernetes Kind：SUDO Kind删除集群无法锁定配置文件：打开/根/.kube/config.lock：只读文件系统，但没有此类文件[已关闭])
我正在用KIND测试K8。。我创建了集群：。现在我想用sudo Kind删除集群来删除这个集群，但得到的是：。但是当我转到路径时，我看不到文件：。配置文件：。另外，当调用命令sudo种类删除集群--名
Kubernetes kind : sudo kind delete cluster failed to lock config file: open /root/.kube/config.lock: read-only file system but no such file [closed](Kubernetes Kind：SUDO Kind删除集群无法锁定配置文件：打开/根/.kube/config.lock：只读文件系统，但没有此类文件[已关闭])
我在用kind测试k8。我创建了集群：。现在我想用sudo Kind删除集群来删除这个集群，但得到的是：。但当转到路径时，我没有看到文件：。配置文件：。另外，当调用命令sudo种类删除集群--名称节点
kube-proxy流量流转方式
简介 kube-proxy 是 Kubernetes 集群中负责服务发现和负载均衡的组件之一。它是一个网络代理，运行在每个节点上, 用于 service 资源的负载均衡。它有两种模式：iptable
kube-apiserver限流机制原理
本文分享自华为云社区《kube-apiserver限流机制原理》，作者：可以交个朋友。背景 apiserver是kubernetes中最重要的组件，一旦遇到恶意刷接口或请求量超过承载范围，api
kube-scheduler源码分析（1）-初始化与启动分析
kube-scheduler组件是kubernetes中的核心组件之一，主要负责pod资源对象的调度工作，具体来说，kube-scheduler组件负责根据调度算法（包括预选算法和优选算法）将未调度的
kube-scheduler源码分析（3）-抢占调度分析
kube-scheduler组件是kubernetes中的核心组件之一，主要负责pod资源对象的调度工作，具体来说，kube-scheduler组件负责根据调度算法（包括预选算法和优选算法）将未调度的
kube-scheduler源码分析（2）-核心处理逻辑分析
kube-scheduler组件是kubernetes中的核心组件之一，主要负责pod资源对象的调度工作，具体来说，kube-scheduler组件负责根据调度算法（包括预选算法和优选算法）将未调度的
docker - Kube-DNS不起作用
我通过docker-multinode设置了k8s $ https_proxy=http://10.25.30.127:7777 IP_ADDRESS=10.25.24.116 MASTER_IP=1
kubernetes - kube-proxy的代理模式中的userspace模式是什么意思？
kube-proxy 有一个名为 --proxy-mode 的选项，根据帮助信息，该选项可以是 userspace 或 iptables。(见下文) # kube-proxy -h Usage of
kubernetes - Kube-Router卡在CrashLoopBackoff中
在单节点Kubernetes集群上安装Kube-router时，遇到以下问题: kube-system kube-router-wnnq8 0/1

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

kubernetes - kube-dns getsockopt 没有路由到主机