kubernetes - K8s NodePort 服务为 “unreachable by IP” 仅在集群中的 2/4 从站上-6ren

kubernetes - K8s NodePort 服务为 “unreachable by IP” 仅在集群中的 2/4 从站上

转载作者：行者123 更新时间：2023-12-04 04:42:44

30

4

我使用 kubeadm 创建了一个包含 5 个虚拟机的 K8s 集群(运行 Ubuntu 16.04.3 LTS 的 1 个主机和 4 个从机) .我用过 flannel在集群中设置网络。我能够成功部署一个应用程序。然后，我通过 NodePort 服务公开了它。从这里开始，事情对我来说变得复杂了。

在开始之前，我禁用了默认 firewalld主节点和节点上的服务。

据我了解 K8s Services doc ，NodePort 类型在集群中的所有节点上公开服务。但是，当我创建它时，该服务仅在集群中的 4 个节点中的 2 个节点上公开。我猜这不是预期的行为(对吗？)

对于故障排除，以下是一些资源规范:

root@vm-vivekse-003:~# kubectl get nodes
NAME              STATUS    AGE       VERSION
vm-deepejai-00b   Ready     5m        v1.7.3
vm-plashkar-006   Ready     4d        v1.7.3
vm-rosnthom-00f   Ready     4d        v1.7.3
vm-vivekse-003    Ready     4d        v1.7.3   //the master
vm-vivekse-004    Ready     16h       v1.7.3

root@vm-vivekse-003:~# kubectl get pods -o wide -n playground
NAME                                     READY     STATUS    RESTARTS   AGE       IP           NODE
kubernetes-bootcamp-2457653786-9qk80     1/1       Running   0          2d        10.244.3.6   vm-rosnthom-00f
springboot-helloworld-2842952983-rw0gc   1/1       Running   0          1d        10.244.3.7   vm-rosnthom-00f

root@vm-vivekse-003:~# kubectl get svc -o wide -n playground
NAME        CLUSTER-IP      EXTERNAL-IP   PORT(S)          AGE       SELECTOR
sb-hw-svc   10.101.180.19   <nodes>       9000:30847/TCP   5h        run=springboot-helloworld

root@vm-vivekse-003:~# kubectl describe svc sb-hw-svc -n playground
Name:               sb-hw-svc
Namespace:          playground
Labels:             <none>
Annotations:        <none>
Selector:           run=springboot-helloworld
Type:               NodePort
IP:                 10.101.180.19
Port:               <unset>   9000/TCP
NodePort:           <unset>   30847/TCP
Endpoints:          10.244.3.7:9000
Session Affinity:   None
Events:             <none>

root@vm-vivekse-003:~# kubectl get endpoints sb-hw-svc -n playground -o yaml
apiVersion: v1
kind: Endpoints
metadata:
  creationTimestamp: 2017-08-09T06:28:06Z
  name: sb-hw-svc
  namespace: playground
  resourceVersion: "588958"
  selfLink: /api/v1/namespaces/playground/endpoints/sb-hw-svc
  uid: e76d9cc1-7ccb-11e7-bc6a-fa163efaba6b
subsets:
- addresses:
  - ip: 10.244.3.7
    nodeName: vm-rosnthom-00f
    targetRef:
      kind: Pod
      name: springboot-helloworld-2842952983-rw0gc
      namespace: playground
      resourceVersion: "473859"
      uid: 16d9db68-7c1a-11e7-bc6a-fa163efaba6b
  ports:
  - port: 9000
    protocol: TCP

经过一番修补后，我意识到在这 2 个“故障”节点上，这些服务在这些主机本身中不可用。

Node01(工作):

root@vm-vivekse-004:~# curl 127.0.0.1:30847      //<localhost>:<nodeport>
Hello Docker World!!
root@vm-vivekse-004:~# curl 10.101.180.19:9000   //<cluster-ip>:<port>
Hello Docker World!!
root@vm-vivekse-004:~# curl 10.244.3.7:9000      //<pod-ip>:<port>
Hello Docker World!!

Node02(工作):

root@vm-rosnthom-00f:~# curl 127.0.0.1:30847
Hello Docker World!!
root@vm-rosnthom-00f:~# curl 10.101.180.19:9000
Hello Docker World!!
root@vm-rosnthom-00f:~# curl 10.244.3.7:9000
Hello Docker World!!

Node03(不工作):

root@vm-plashkar-006:~# curl 127.0.0.1:30847
curl: (7) Failed to connect to 127.0.0.1 port 30847: Connection timed out
root@vm-plashkar-006:~# curl 10.101.180.19:9000
curl: (7) Failed to connect to 10.101.180.19 port 9000: Connection timed out
root@vm-plashkar-006:~# curl 10.244.3.7:9000
curl: (7) Failed to connect to 10.244.3.7 port 9000: Connection timed out

Node04(不工作):

root@vm-deepejai-00b:/# curl 127.0.0.1:30847
curl: (7) Failed to connect to 127.0.0.1 port 30847: Connection timed out
root@vm-deepejai-00b:/# curl 10.101.180.19:9000
curl: (7) Failed to connect to 10.101.180.19 port 9000: Connection timed out
root@vm-deepejai-00b:/# curl 10.244.3.7:9000
curl: (7) Failed to connect to 10.244.3.7 port 9000: Connection timed out

试过 netstat和 telnet在所有 4 个奴隶上。这是输出:

Node01(工作主机):

root@vm-vivekse-004:~# netstat -tulpn | grep 30847
tcp6       0      0 :::30847                :::*                    LISTEN      27808/kube-proxy
root@vm-vivekse-004:~# telnet 127.0.0.1 30847
Trying 127.0.0.1...
Connected to 127.0.0.1.
Escape character is '^]'.

Node02(工作主机):

root@vm-rosnthom-00f:~# netstat -tulpn | grep 30847
tcp6       0      0 :::30847                :::*                    LISTEN      11842/kube-proxy
root@vm-rosnthom-00f:~# telnet 127.0.0.1 30847
Trying 127.0.0.1...
Connected to 127.0.0.1.
Escape character is '^]'.

Node03(不工作的主机):

root@vm-plashkar-006:~# netstat -tulpn | grep 30847
tcp6       0      0 :::30847                :::*                    LISTEN      7791/kube-proxy
root@vm-plashkar-006:~# telnet 127.0.0.1 30847
Trying 127.0.0.1...
telnet: Unable to connect to remote host: Connection timed out

Node04(不工作的主机):

root@vm-deepejai-00b:/# netstat -tulpn | grep 30847
tcp6       0      0 :::30847                :::*                    LISTEN      689/kube-proxy
root@vm-deepejai-00b:/# telnet 127.0.0.1 30847
Trying 127.0.0.1...
telnet: Unable to connect to remote host: Connection timed out

补充资料:

来自 kubectl get pods输出，可以看到pod实际上部署在slave上 vm-rosnthom-00f .我可以 ping该主机来自所有 5 个虚拟机和 curl vm-rosnthom-00f:30847也适用于所有 VM。

我可以清楚地看到内部集群网络困惑，但我不知道如何解决! iptables -L因为所有从站都是相同的，甚至所有从站的本地环回( ifconfig lo )都已启动并运行。我完全不知道如何修复它!

最佳答案

如果你想从集群中的任何节点访问服务，你需要精细的服务类型为 ClusterIP .由于您将服务类型定义为 NodePort ，您可以从运行服务的节点进行连接。

我上面的答案不正确，根据文档，我们应该能够从任何 NodeIP:Nodeport 连接.但它也不适用于我的集群。

https://kubernetes.io/docs/concepts/services-networking/service/#publishing-services---service-types

NodePort: Exposes the service on each Node’s IP at a static port (the NodePort). A ClusterIP service, to which the NodePort service will route, is automatically created. You’ll be able to contact the NodePort service, from outside the cluster, by requesting :.

我的节点 ip forward 之一未设置。我能够使用 NodeIP:nodePort 连接我的服务

sysctl -w net.ipv4.ip_forward=1

关于kubernetes - K8s NodePort 服务为 “unreachable by IP” 仅在集群中的 2/4 从站上，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45595662/

30

4

0

文章推荐： ruby-on-rails - Assets 过滤器错误: ckeditor in rails 4. 1.0

文章推荐： ironpython - Spotfire IronPython 设置文档属性

文章推荐： apache-flex - Flex/Flash/AS3中的Vsync？

文章推荐： concurrency - 幕后的 Erlang 进程是什么？

postgresql - 集群 PostgreSQL 集群
由于 PostgreSQL 人员选择的术语不当，这会让一些人感到困惑，但请耐心等待... 我们需要能够支持多个 PostgreSQL (PG) 集群，并将它们集群在多个服务器上，例如使用repmgr.
hadoop - 1 个大 Hadoop 和 Hbase 集群 vs 1 个 Hadoop 集群 + 1 个 Hbase 集群
Hadoop会跑很多jobs，从Hbase读取数据，写数据到数据库。假设我有 100 个节点，那么有两种方法可以构建我的 Hadoop/Hbase集群: 100节点hadoop&hbase集群(1个b
kafka 集群
在kafka中，我们能创建多种类型的集群，一般如下：单节点——单个broker集群单节点——多broker集群多结点——多broker集群 kafka集群中主要有五个组件： Topic：主题主要
不同操作系统的 MPI 集群
我想在两台机器上运行我的 MPI 程序，一台是 ubuntu 18.04，另一台是 Windows 10。是否可以使用不同的操作系统组成一个集群？ (我正在使用 MPICH) 如果可能，怎么做？我在网
RabbitMQ 集群 - 更新负载平衡集群中节点的最佳实践？
简介: 更新负载平衡集群中的节点的最佳实践是什么？我们在 ha 代理负载均衡器后面使用 RabbitMQ 集群来支持我们的客户端轻松集群，as suggested in the RabbitMQ d
与其他节点具有相同等级的 graphviz 集群
我正在尝试创建一个图表，我明确指定了许多节点的等级并指定了集群。以下代码生成我想要的图形类型: digraph { rankdir=LR subgraph cluster0 {
具有三个节点的 Rabbitmq 集群
我正在尝试在 RABBITMQ 上进行集群。我添加了 2 个节点，但无法添加第 3 个节点。我已经聚集了 rabbit@node1 和 rabbit@node2。现在我正在尝试将 rabbit@nod
每个应用程序的 Kubernetes 集群？
我在 MS Azure 的生产环境中启用了一个双集群多区域 HA。我被要求重用同一个集群来使用微服务管理几个新项目。这里的最佳做法是什么？我应该为每个应用程序创建一个集群吗？将不同集群中的每个项目
elasticsearch - Elasticsearch 集群
我正在尝试 flex 搜索，并且很难在具有3个 flex 搜索实例的单台计算机上创建集群。我对实例进行了以下更改: 在所有实例上更改了群集名称{cluster.name:es-stack} 在所有实例
具有自定义集群配置的 Redis 集群
我想创建一个redis集群，仅将特定的redis主机作为主服务器和从服务器。另外，我想自己指定哪个主机应该是哪个主机的副本。目前，cluster-create command当在任何一个 Redis
Magento 集群/负载平衡设置
我计划在具有负载平衡的集群中设置 Magento，那么是否可以让两个 Magento 安装指向同一个数据库？如果可能的话 - 我应该如何配置这些服务器的基本 URL？服务器应该具有相同的名称吗？最
PHP/MySql 集群
我目前正在计划一个 Web 应用程序，我想计划它最终在集群上运行。集群将由一个 php web 集群和一个 mysql 集群以及一个独立的存储单元组成(也许是一个集群，我真的不知道它是如何工作的:s
Elasticsearch 集群 'master_not_discovered_exception'
我已经安装了 elasticsearch 2.2.3 并在 2 个节点的集群中配置节点 1 (elasticsearch.yml) cluster.name: my-cluster node.nam
java - 集群/分布式服务有哪些好的中间件解决方案
我正在寻找现有的中间件解决方案，以解决服务集群/分布方面的问题，以实现负载平衡和可用性。我正在考虑基于消息传递系统(更具体地说，JMS)为此构建自己的基础设施。但是，如果可能的话，我宁愿使用已经存在的
Hadoop 集群。数据在集群数据节点之间自动复制
在 Hadoop 集群中，数据是自动跨数据节点复制还是必须编程？如果必须编程，那我该怎么做呢？最佳答案 dfs.replication 的默认值为 3。这存在于您的 hdfs.site.xml 中
负载均衡器上的 Redis 集群
我已经设置了一个具有 1 个主节点和 2 个从节点的 redis 集群，哨兵在所有 3 个节点上运行。在此设置之前，我的应用程序指向运行 Redis 实例的单个节点。集群搭建完成后，我的应用应该指
redis 集群 - 与集群交互是否需要代理或集群支持库？
所以，我正在设计一个具有多个 redis 实例的分布式系统来分解大量的流式写入，但发现很难清楚地了解事情是如何工作的。从我读到的内容来看，正确配置的集群似乎会自动对“错误实例”上的请求进行分片和重定
负载均衡器后面的 Redis 集群？
我有一个关于redis集群架构的问题。我正在设置一个 Redis 集群，并遵循基本建议:3 硕士3个奴隶有什么方法可以在 Amazon LB、HAProxy、Nginx 等负载均衡器后面配置此集群
傻瓜式 Mysql 集群
那么集群背后的想法是什么？您有多台机器具有相同的数据库副本，您在其中传播读/写？这是正确的吗？这个想法如何运作？当我进行选择查询时，集群会分析哪个服务器的读/写较少并将我的查询指向该服务器？当您
Ubuntu安装部署Kubernetes(k8s)集群
目录一.系统环境二.前言三.Kubernetes 3.1 概述 3.2 Kube

首页

博学

6Ren·AI

商城

kubernetes - K8s NodePort 服务为 “unreachable by IP” 仅在集群中的 2/4 从站上