kubernetes - 从某些Kubernetes容器到同一集群中其他容器的主机没有路由-6ren

kubernetes - 从某些Kubernetes容器到同一集群中其他容器的主机没有路由

转载作者：行者123 更新时间：2023-12-02 12:02:45

25

4

这是使用calico的Kubespray部署。除存在代理外，所有默认设置均保持原样。 Kubespray顺利运行到最后。

对Kubernetes服务的访问开始失败，经过调查，没有无法将托管到coredns服务。通过IP访问K8S服务已成功。其他所有事情似乎都是正确的，所以我剩下一个可以工作的群集，但是没有DNS。

以下是一些背景信息:
启动busybox容器:

# nslookup kubernetes.default
Server:     169.254.25.10
Address:    169.254.25.10:53

** server can't find kubernetes.default: NXDOMAIN

*** Can't find kubernetes.default: No answer

现在，在显式定义CoreDNS pod的IP时，输出:

# nslookup kubernetes.default 10.233.0.3
;; connection timed out; no servers could be reached

请注意，使用Kubernetes API的telnet可以工作:

# telnet 10.233.0.1 443
Connected to 10.233.0.1

kube-proxy日志:
10.233.0.3是coredns的服务IP。最后一行看起来很重要，即使它是INFO。

$ kubectl logs kube-proxy-45v8n -nkube-system
I1114 14:19:29.657685       1 node.go:135] Successfully retrieved node IP: X.59.172.20
I1114 14:19:29.657769       1 server_others.go:176] Using ipvs Proxier.
I1114 14:19:29.664959       1 server.go:529] Version: v1.16.0
I1114 14:19:29.665427       1 conntrack.go:52] Setting nf_conntrack_max to 262144
I1114 14:19:29.669508       1 config.go:313] Starting service config controller
I1114 14:19:29.669566       1 shared_informer.go:197] Waiting for caches to sync for service config
I1114 14:19:29.669602       1 config.go:131] Starting endpoints config controller
I1114 14:19:29.669612       1 shared_informer.go:197] Waiting for caches to sync for endpoints config
I1114 14:19:29.769705       1 shared_informer.go:204] Caches are synced for service config 
I1114 14:19:29.769756       1 shared_informer.go:204] Caches are synced for endpoints config 
I1114 14:21:29.666256       1 graceful_termination.go:93] lw: remote out of the list: 10.233.0.3:53/TCP/10.233.124.23:53
I1114 14:21:29.666380       1 graceful_termination.go:93] lw: remote out of the list: 10.233.0.3:53/TCP/10.233.122.11:53

所有Pod都在运行时没有崩溃/重新启动等，否则服务运行正常。

IPVS看起来正确。 CoreDNS服务在此处定义:

# ipvsadm -ln
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
  -> RemoteAddress:Port           Forward Weight ActiveConn InActConn
TCP  10.233.0.1:443 rr
  -> x.59.172.19:6443           Masq    1      0          0         
  -> x.59.172.20:6443           Masq    1      1          0         
TCP  10.233.0.3:53 rr
  -> 10.233.122.12:53             Masq    1      0          0         
  -> 10.233.124.24:53             Masq    1      0          0         
TCP  10.233.0.3:9153 rr
  -> 10.233.122.12:9153           Masq    1      0          0         
  -> 10.233.124.24:9153           Masq    1      0          0         
TCP  10.233.51.168:3306 rr
  -> x.59.172.23:6446           Masq    1      0          0         
TCP  10.233.53.155:44134 rr
  -> 10.233.89.20:44134           Masq    1      0          0         
UDP  10.233.0.3:53 rr
  -> 10.233.122.12:53             Masq    1      0          314       
  -> 10.233.124.24:53             Masq    1      0          312

主机路由也看起来正确。

# ip r
default via x.59.172.17 dev ens3 proto dhcp src x.59.172.22 metric 100 
10.233.87.0/24 via x.59.172.21 dev tunl0 proto bird onlink 
blackhole 10.233.89.0/24 proto bird 
10.233.89.20 dev calib88cf6925c2 scope link 
10.233.89.21 dev califdffa38ed52 scope link 
10.233.122.0/24 via x.59.172.19 dev tunl0 proto bird onlink 
10.233.124.0/24 via x.59.172.20 dev tunl0 proto bird onlink 
x.59.172.16/28 dev ens3 proto kernel scope link src x.59.172.22 
x.59.172.17 dev ens3 proto dhcp scope link src x.59.172.22 metric 100 
172.17.0.0/16 dev docker0 proto kernel scope link src 172.17.0.1 linkdown

我已经用法兰绒和印花棉布用iptables而不是ipvs在不同的环境中重新部署了同一群集。临时部署后，我还禁用了docker http代理。没有任何区别。

也:
kube_service_addresses:10.233.0.0/18
kube_pods_subnet:10.233.64.0/18
(它们不重叠)

调试此问题的下一步是什么？

最佳答案

我强烈建议您避免使用最新的busybox镜像对DNS进行故障排除。关于dnslookup的报道，在1.28以后的版本中，issues很少。

v 1.28.4

user@node1:~$ kubectl exec -ti busybox busybox | head -1
BusyBox v1.28.4 (2018-05-22 17:00:17 UTC) multi-call binary.

user@node1:~$ kubectl exec -ti busybox -- nslookup kubernetes.default 
Server:    169.254.25.10
Address 1: 169.254.25.10

Name:      kubernetes.default
Address 1: 10.233.0.1 kubernetes.default.svc.cluster.local

v 1.31.1

user@node1:~$ kubectl exec -ti busyboxlatest busybox | head -1
BusyBox v1.31.1 (2019-10-28 18:40:01 UTC) multi-call binary.

user@node1:~$ kubectl exec -ti busyboxlatest -- nslookup kubernetes.default 
Server:     169.254.25.10
Address:    169.254.25.10:53

** server can't find kubernetes.default: NXDOMAIN

*** Can't find kubernetes.default: No answer

command terminated with exit code 1

深入研究并探索更多可能性，我已在GCP上重现了您的问题，经过一番挖掘，我能够弄清楚是什么原因导致了此通信问题。

默认情况下，GCE(Google Compute Engine)会阻止主机之间的流量；我们必须允许Calico流量在不同主机上的容器之间流动。

根据calico documentation，您可以通过创建允许此通信规则的防火墙来做到这一点:

gcloud compute firewall-rules create calico-ipip --allow 4 --network "default" --source-ranges "10.128.0.0/9"

您可以使用以下命令验证规则:

gcloud compute firewall-rules list

在最新的calico文档中没有提供此功能，但这仍然是正确且必要的。

创建防火墙规则之前:

user@node1:~$ kubectl exec -ti busybox2 -- nslookup kubernetes.default 
Server:    10.233.0.3
Address 1: 10.233.0.3 coredns.kube-system.svc.cluster.local

nslookup: can't resolve 'kubernetes.default'
command terminated with exit code 1

创建防火墙规则后:

user@node1:~$ kubectl exec -ti busybox2 -- nslookup kubernetes.default 
Server:    10.233.0.3
Address 1: 10.233.0.3 coredns.kube-system.svc.cluster.local

Name:      kubernetes.default
Address 1: 10.233.0.1 kubernetes.default.svc.cluster.local

使用kubespray或kubeadm引导群集都没有关系，因为calico需要在节点之间进行通信并且GCE默认将其阻止，所以会发生此问题。

关于kubernetes - 从某些Kubernetes容器到同一集群中其他容器的主机没有路由，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58860745/

25

4

0

文章推荐： docker - 如何保护普罗米修斯数据？

ruby-on-rails - Rails 路由 + AngularJS 路由
我的 Angular 应用程序中有以下代码。 app.config(function($routeProvider, $locationProvider) { $locationProvider
ruby-on-rails - Backbonejs 路由 VS emberjs 路由
这就是我在 Backbone 中进行路由的方式，在决定调用哪个外部模板之前，首先获取路由及其参数。我觉得这很灵活。 var Router = Backbone.Router.extend({
angularjs - 如果您已经定义了 Express 路由，为什么还要创建 Angular 路由？
我是 MEAN 堆栈领域的新手，我对 Angular 路线有一些疑问。为什么我应该在客户端重新创建后端已经用express.js创建的路由，有什么好处？这是 Angular.js 工作的唯一方式吗？我
asp.net-mvc - ASP.NET MVC 路由 - "Blank"路由
我可以设置一条从根级 URL 进行映射的路由吗？ http://localhost:49658/ 我使用的是 VS2010 内置 Web 服务器。尝试使用空白或单斜杠 URL 字符串设置路由不起作用
angularjs - Activeadmin 采用 angular js 路由，而不是 rails 路由
我有一个现有的应用程序 Rails 3.2.17和 Angular js。我想在现有应用程序中包含 Activeadmin。我遵循了 active-admin post from ryan bate
Angular2 路由
我正在关注 this Angular 中的路由教程，它就是行不通。当我使用“comp”选择器放置它的 HTML 代码时，它可以工作，但是当我尝试使用路由器 socket 对其进行路由时，它只显示来自
万字血书Vue—路由
多个路由通过路由器进行管理。前端路由的概念和原理 (编程中的) 路由（router）就是一组 key-value 对应关系，分为：后端路由和前端路由后端路由
轻松创建nodejs服务器（4）：路由
服务器需要根据不同的URL或请求来执行不一样的操作，我们可以通过路由来实现这个步骤。第一步我们需要先解析出请求URL的路径，我们引入url模块。我们来给onRequest()函数加上一些逻辑
带段通配符的 Angular 路由
我正在为 Angular 6 应用程序设置路由，我想要一条可以匹配可变数量的段的路由。目前我有一个看起来像这样的路由配置: const routes: Routes = [ { path: '',
带有参数和获取参数的 Angular 路由
用户将点击电子邮件中的链接，如下所示: do-something/doSomething?thing=XXXXXXXXXXX 如何在路由器中定义路由并订阅获取参数？目前在我的路由器中: {
具有多个模块和动态路由的 Angular 路由
我有一个具有以下结构的 Angular (4) 应用程序: app.module bi.module auth.module 路由应该是: / -> redirect to /home /
WCF 路由——如何以编程方式正确添加过滤表
我正在使用 WCF 4 路由服务，并且需要以编程方式配置服务(而不是通过配置)。我见过的这样做的例子很少见，创建一个 MessageFilterTable 如下: var fi
WCF 路由 + SSL
我需要创建一个“路由”服务。我正在尝试使用 .Net 的 System.ServiceModel.Routing.IRequestReplyRouter我可以让它只在 HTTP 模式下工作，而不是在
symfony - 路由，参数数量不限
例如，链接: /shop/phones/brend/apple/display/retina/color/red 在哪里: phones - category alias brend -
Django 路由 - 空路径与这些都不匹配
非常基本的问题，我很惊讶我找不到答案。我刚刚开始研究 django 并进行了开箱即用的安装。创建了一个项目并创建了一个应用程序。 urls.py 的默认内容很简单: urlpatterns = [
带有内容转换的 WCF 路由
我已经实现了 WCF 路由服务；我还希望该服务(或类似的 WCF 服务)以规定的和统一的(与内容无关的)方式转换有效负载。例如，有效负载将始终采用 Foo 的形式。我想把它作为Bar在所有情况下。我很
AngularJs + Laravel 路由
我想使用 $locationProvider.html5Mode(true); 在 angularJs 中删除 # 哈希；但这导致所有 URL 都通过 angularJs 进行路由。我如何设置它以便只
没有组件的 Angular2 路由
我要听导航开始事件并判断其是否url属性是 /logout . 如果是这样，路由器应该停止触发连续事件，例如路线已识别 , GuardsCheckStart , ChildActivationSta
带参数的 AngularJs 路由
有人可以解释我如何使用参数路由到 URL 吗？例如id 喜欢点击产品并通过Id打开产品的更多信息。我的路由到目前为止... angular.module('shop', ["cus
带查询参数的 Angular 路由
我目前正在 Angular: 7.2.14 上构建，想看看是否有人可以解释如何使用路由保护、共享服务或其他方式等重定向查询参数。我试图解决的问题要求查询参数从根 Uri 路径传入，然后将路由重定向到

首页

博学

6Ren·AI

商城

kubernetes - 从某些Kubernetes容器到同一集群中其他容器的主机没有路由