单Master节点的k8s集群部署-完整版

转载作者：撒哈拉更新时间：2024-10-05 12:20:49

K8S 安装步骤

1、准备工作

1.准备三台主机（一台Master节点，两台Node节点）如下：

角色	IP	内存	核心	磁盘
Master	192.168.116.131	4G	4个	55G
Node01	192.168.116.132	4G	4个	55G
Node02	192.168.116.133	4G	4个	55G

2.关闭SElinux，因为SElinux会影响K8S部分组件无法正常工作：

sed -i '1,$s/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config
# reboot

3.三台主机分别配置主机名，如下：

控制节点Master:

hostnamectl set-hostname master && bash

工作节点Node01:

hostnamectl set-hostname node01 && bash

工作节点Node02:

hostnamectl set-hostname node02 && bash

4.三台主机分别配置host文件：

进入hosts文件:
```
cd /etc/hosts
```

修改文件内容，添加三台主机以及IP:

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.116.131 master
192.168.116.132 node01
192.168.116.133 node02

修改完可以三台主机用ping命令检查是否连通:

ping -c1 -W1 master
ping -c1 -W1 node01
ping -c1 -W1 node02

5.三台主机分别下载所需意外组件包和相关依赖包：

yum install -y yum-utils device-mapper-persistent-data lvm2 wget net-tools nfs-utils lrzsz gcc gcc-c++ make cmake libxml2-devel openssl-devel curl curl-devel unzip autoconf automake zlib-devel epel-release openssh-server libaio-devel vim ncurses-devel socat conntrack telnet ipvsadm

所需相关意外组件包解释如下:

yum-utils：提供了一些辅助工具用于 yum 包管理器，比如 yum-config-manager，repoquery 等.

device-mapper-persistent-data：与 Linux 的设备映射功能相关，通常与 LVM（逻辑卷管理）和容器存储（如 Docker）有关.

lvm2：逻辑卷管理器，用于管理磁盘上的逻辑卷，允许灵活的磁盘分区管理.

wget：一个非交互式网络下载工具，支持 HTTP、HTTPS 和 FTP 协议，常用于下载文件.

net-tools：提供一些经典的网络工具，如 ifconfig，netstat 等，用于查看和管理网络配置.

nfs-utils：支持 NFS（网络文件系统）的工具包，允许客户端挂载远程文件系统.

lrzsz：lrz 和 lsz 是 Linux 系统下用于 X/ZMODEM 文件传输协议的命令行工具，常用于串口传输数据.

gcc：GNU C 编译器，用于编译 C 语言程序.

gcc-c++：GNU C++ 编译器，用于编译 C++ 语言程序.

make：用于构建和编译程序，通常与 Makefile 配合使用，控制程序的编译和打包过程.

cmake：跨平台的构建系统生成工具，用于管理项目的编译过程，特别适用于大型复杂项目.

libxml2-devel：开发用的 libxml2 库头文件，libxml2 是一个用于解析 XML 文件的 C 库.

openssl-devel：用于 OpenSSL 库开发的头文件和开发库，OpenSSL 是用于 SSL/TLS 加密的库.

curl：一个用于传输数据的命令行工具，支持多种协议（HTTP、FTP 等）.

curl-devel：开发用的 curl 库和头文件，支持在代码中使用 curl 相关功能.

unzip：用于解压缩 .zip 文件.

autoconf：自动生成配置脚本的工具，常用于生成软件包的 configure 文件.

automake：自动生成 Makefile.in 文件，结合 autoconf 使用，用于构建系统.

zlib-devel：zlib 库的开发头文件，zlib 是一个用于数据压缩的库.

epel-release：用于启用 EPEL（Extra Packages for Enterprise Linux）存储库，提供大量额外的软件包.

openssh-server：OpenSSH 服务器，用于通过 SSH 远程登录和管理系统.

libaio-devel：异步 I/O 库的开发头文件，提供异步文件 I/O 支持，常用于数据库和高性能应用.

vim：一个强大的文本编辑器，支持多种语言和扩展功能.

ncurses-devel：开发用的 ncurses 库，提供终端控制和用户界面的构建工具.

socat：一个多功能的网络工具，用于双向数据传输，支持多种协议和地址类型.

conntrack：连接跟踪工具，显示和操作内核中的连接跟踪表，常用于网络防火墙和 NAT 配置.

telnet：用于远程登录的一种简单网络协议，允许通过命令行与远程主机进行通信.

ipvsadm：用于管理 IPVS（IP 虚拟服务器），这是一个 Linux 内核中的负载均衡模块，常用于高可用性负载均衡集群.

6.配置主机之间免密登录

Master节点：

1）配置Master主机到另外两台Node主机免密登录。

ssh-keygen # 遇到问题不输入任何内容，直按回车

2）把刚刚生成的公钥文件传递到两台Node节点，输入yes后，在输入主机对应的密码。

ssh-copy-id master
ssh-copy-id node01
ssh-copy-id node02

Node01节点：

1）配置Node01主机到另外两台主机免密登录。

ssh-keygen # 遇到问题不输入任何内容，直按回车

2）把刚刚生成的公钥文件传递到两台Node节点，输入yes后，在输入主机对应的密码。

ssh-copy-id master
ssh-copy-id node01
ssh-copy-id node02

Node02节点：

1）配置Node01主机到另外两台主机免密登录。

ssh-keygen # 遇到问题不输入任何内容，直按回车

2）把刚刚生成的公钥文件传递到两台Node节点，输入yes后，在输入主机对应的密码。

ssh-copy-id master
ssh-copy-id node01
ssh-copy-id node02

7.关闭所有主机的firewall防火墙

如果不想关闭防火墙可以添加firewall-cmd规则进行过滤筛选，相关内容查询资料，不做演示.

关闭防火墙:

systemctl stop firewalld && systemctl disable firewalld
systemctl status firewalld # 查询防火墙状态，关闭后应为	Active: inactive (dead)

添加防火墙规则:

6443：Kubernetes Api Server 2379、2380：Etcd数据库。

10250、10255：kubelet服务 10257：kube-controller-manager 服务。

10259：kube-scheduler 服务 30000-32767：在物理机映射的 NodePort端口。

179、473、4789、9099：Calico 服务 9090、3000：Prometheus监控+Grafana面板。

8443：Kubernetes Dashboard控制面板。

# Kubernetes API Server
firewall-cmd --zone=public --add-port=6443/tcp --permanent

# Etcd 数据库
firewall-cmd --zone=public --add-port=2379-2380/tcp --permanent

# Kubelet 服务
firewall-cmd --zone=public --add-port=10250/tcp --permanent
firewall-cmd --zone=public --add-port=10255/tcp --permanent

# Kube-Controller-Manager 服务
firewall-cmd --zone=public --add-port=10257/tcp --permanent

# Kube-Scheduler 服务
firewall-cmd --zone=public --add-port=10259/tcp --permanent

# NodePort 映射端口
firewall-cmd --zone=public --add-port=30000-32767/tcp --permanent

# Calico 服务
firewall-cmd --zone=public --add-port=179/tcp --permanent  # BGP
firewall-cmd --zone=public --add-port=473/tcp --permanent  # IP-in-IP
firewall-cmd --zone=public --add-port=4789/udp --permanent  # VXLAN
firewall-cmd --zone=public --add-port=9099/tcp --permanent  # Calico 服务

#Prometheus监控+Grafana面板
firewall-cmd --zone=public --add-port=9090/tcp --permanent
firewall-cmd --zone=public --add-port=3000/tcp --permanent

# Kubernetes Dashboard控制面板	
firewall-cmd --zone=public --add-port=8443/tcp --permanent

# 重新加载防火墙配置以应用更改
firewall-cmd --reload

8.三台主机关闭swap交换分区

swap 分区的读写速度远低于物理内存。如果 Kubernetes 工作负载依赖于 swap 来补偿内存不足，会导致性能显著下降，尤其是在资源密集型的容器应用中。Kubernetes 更倾向于让节点直接面临内存不足的情况，而不是依赖 swap，从而促使调度器重新分配资源.

Kubernetes 默认会在 kubelet 启动时检查 swap 的状态，并要求其关闭。如果 swap 未关闭，Kubernetes 可能无法正常启动并报出错误。例如:

[!WARNING] 。

kubelet: Swap is enabled; production deployments should disable swap. 。

为了让 Kubernetes 正常工作，建议在所有节点上永久关闭 swap，同时调整系统的内存管理:

swapoff -a 	# 关闭当前swap

sed -i '/swap/s/^/#/' /etc/fstab 	# swap前添加注释

grep swap /etc/fstab # 成功关闭会这样：#/dev/mapper/rl-swap     none              swap    defaults        0 0

9.修改内核参数

三台主机分别执行

modprobe br_netfilter	# 加载 Linux 内核模块

modprobe：用于加载或卸载内核模块的命令.
br_netfilter：该模块允许桥接的网络流量被 iptables 规则过滤，通常在启用网络桥接的情况下使用.
该模块主要在 Kubernetes 容器网络环境中使用，确保 Linux 内核能够正确处理网络流量的过滤和转发，特别是在容器间的通信中.

三台主机分别执行

cat > /etc/sysctl.d/k8s.conf <<EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
net.ipv4.ip_forward = 1
EOF

sysctl -p /etc/sysctl.d/k8s.conf # 使配置生效

net.bridge.bridge-nf-call-ip6tables = 1：允许 IPv6 网络流量通过 Linux 网络桥接时使用 ip6tables 进行过滤。
net.bridge.bridge-nf-call-iptables = 1：允许 IPv4 网络流量通过 Linux 网络桥接时使用 iptables 进行过滤。
net.ipv4.ip_forward = 1：允许 Linux 内核进行 IPv4 数据包的转发（路由）。

这些设置确保在 Kubernetes 中，网络桥接流量可通过 iptables 和 ip6tables 过滤，并启用 IPv4 数据包转发，提升网络安全性和通信能力.

10.配置安装Docker和Containerd的yum源

三台主机分别安装docker-ce源(任选其一，只安装一个)，后续操作只演示阿里源的.

# 阿里源
yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
# 清华大学开源软件镜像站
yum-config-manager --add-repo https://mirrors.tuna.tsinghua.edu.cn/docker-ce/linux/centos/docker-ce.repo
# 中国科技大学开源镜像站
yum-config-manager --add-repo https://mirrors.ustc.edu.cn/docker-ce/linux/centos/docker-ce.repo
# 中科大镜像源
yum-config-manager --add-repo https://mirrors.ustc.edu.cn/docker-ce/linux/centos/docker-ce.repo
# 华为云源
yum-config-manager --add-repo https://repo.huaweicloud.com/docker-ce/linux/centos/docker-ce.repo

11.配置K8S命令行工具所需要的yum源

cat > /etc/yum.repos.d/kubernetes.repo <<EOF
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg
       https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF

yum makecache

12.三台主机进行时间同步

Chrony 和 NTPD都是用于时间同步的工具，但 Chrony 在许多方面有其独特的优点。以下是 Chrony 相较于 NTPD 的一些主要优点，并基于此，进行chrony时间同步的部署:

优点	Chrony	NTPD
快速同步	在网络延迟较大或连接不稳定时，Chrony 可以更快地同步时间。	通常需要更长的时间来达到时间同步。
适应性强	在移动设备或虚拟环境中表现良好，能够快速适应网络变化。	在这些环境中的性能较差。
时钟漂移修正	能够更好地处理系统时钟漂移，通过频率调整来实现。	对系统时钟漂移的处理能力较弱。
配置简单	配置相对简单直观，易于理解和使用。	配置选项较多，可能需要更多时间来熟悉。

1) 三台主机安装Chrony 。

yum -y install chrony

2）三台主机修改配置文件，添加国内 NTP 服务器。

echo "server ntp1.aliyun.com iburst" >> /etc/chrony.conf
echo "server ntp2.aliyun.com iburst" >> /etc/chrony.conf
echo "server ntp3.aliyun.com iburst" >> /etc/chrony.conf
echo "server ntp.tuna.tsinghua.edu.cn iburst" >> /etc/chrony.conf

tail -n 4 /etc/chrony.conf
systemctl restart chronyd

3) 可以设置定时任务，每分钟重启chrony服务，进行时间校准（非必须）。

echo "* * * * * /usr/bin/systemctl restart chronyd" | tee -a /var/spool/cron/root

建议手动进行添加，首先执行crontab -e命令，在将如下内容添加至定时任务中。

* * * * * /usr/bin/systemctl restart chronyd

这五个星号表示时间调度，每个星号代表一个时间字段，从左到右分别是：
- 第一个星号：分钟（0-59）
- 第二个星号：小时（0-23）
- 第三个星号：日期（1-31）
- 第四个星号：月份（1-12）
- 第五个星号：星期几（0-7，0 和 7 都代表星期天）
在这里，每个字段都用 * 表示“每一个”，因此 * * * * * 的意思是“每分钟的每一秒”。
/usr/bin/systemctl 是 systemctl 命令的完整路径，用于管理系统服务。

13.安装Containerd

Containerd 是一个高性能的容器运行时，在 Kubernetes 中它负责容器的生命周期管理，包括创建、运行、停止和删除容器，同时支持从镜像仓库拉取和管理镜像。Containerd 提供容器运行时接口 (CRI)，与 Kubernetes 无缝集成，确保高效的资源利用和快速的容器启动时间。除此之外，它还支持事件监控和日志记录，方便运维和调试，是实现容器编排和管理的关键组件.

三台主机安装containerd1.6.22版本。

yum -y install containerd.io-1.6.22
yum -y install containerd.io-1.6.22 --allowerasing # 如果安装有问题选择这个，默认用第一个

创建containerd的配置文件目录并修改自带的config.toml.

mkdir -pv /etc/containerd
vim /etc/containerd/config.toml

修改内容如下:

disabled_plugins = []
imports = []
oom_score = 0
plugin_dir = ""
required_plugins = []
root = "/var/lib/containerd"
state = "/run/containerd"
temp = ""
version = 2

[cgroup]
  path = ""

[debug]
  address = ""
  format = ""
  gid = 0
  level = ""
  uid = 0

[grpc]
  address = "/run/containerd/containerd.sock"
  gid = 0
  max_recv_message_size = 16777216
  max_send_message_size = 16777216
  tcp_address = ""
  tcp_tls_ca = ""
  tcp_tls_cert = ""
  tcp_tls_key = ""
  uid = 0

[metrics]
  address = ""
  grpc_histogram = false

[plugins]

  [plugins."io.containerd.gc.v1.scheduler"]
    deletion_threshold = 0
    mutation_threshold = 100
    pause_threshold = 0.02
    schedule_delay = "0s"
    startup_delay = "100ms"

  [plugins."io.containerd.grpc.v1.cri"]
    device_ownership_from_security_context = false
    disable_apparmor = false
    disable_cgroup = false
    disable_hugetlb_controller = true
    disable_proc_mount = false
    disable_tcp_service = true
    enable_selinux = false
    enable_tls_streaming = false
    enable_unprivileged_icmp = false
    enable_unprivileged_ports = false
    ignore_image_defined_volumes = false
    max_concurrent_downloads = 3
    max_container_log_line_size = 16384
    netns_mounts_under_state_dir = false
    restrict_oom_score_adj = false
    sandbox_image = "registry.aliyuncs.com/google_containers/pause:3.9"
    selinux_category_range = 1024
    stats_collect_period = 10
    stream_idle_timeout = "4h0m0s"
    stream_server_address = "127.0.0.1"
    stream_server_port = "0"
    systemd_cgroup = false
    tolerate_missing_hugetlb_controller = true
    unset_seccomp_profile = ""

    [plugins."io.containerd.grpc.v1.cri".cni]
      bin_dir = "/opt/cni/bin"
      conf_dir = "/etc/cni/net.d"
      conf_template = ""
      ip_pref = ""
      max_conf_num = 1

    [plugins."io.containerd.grpc.v1.cri".containerd]
      default_runtime_name = "runc"
      disable_snapshot_annotations = true
      discard_unpacked_layers = false
      ignore_rdt_not_enabled_errors = false
      no_pivot = false
      snapshotter = "overlayfs"

      [plugins."io.containerd.grpc.v1.cri".containerd.default_runtime]
        base_runtime_spec = ""
        cni_conf_dir = ""
        cni_max_conf_num = 0
        container_annotations = []
        pod_annotations = []
        privileged_without_host_devices = false
        runtime_engine = ""
        runtime_path = ""
        runtime_root = ""
        runtime_type = ""

        [plugins."io.containerd.grpc.v1.cri".containerd.default_runtime.options]

      [plugins."io.containerd.grpc.v1.cri".containerd.runtimes]

        [plugins."io.containerd.grpc.v1.cri".containerd.runtimes.runc]
          base_runtime_spec = ""
          cni_conf_dir = ""
          cni_max_conf_num = 0
          container_annotations = []
          pod_annotations = []
          privileged_without_host_devices = false
          runtime_engine = ""
          runtime_path = ""
          runtime_root = ""
          runtime_type = "io.containerd.runc.v2"

          [plugins."io.containerd.grpc.v1.cri".containerd.runtimes.runc.options]
            BinaryName = ""
            CriuImagePath = ""
            CriuPath = ""
            CriuWorkPath = ""
            IoGid = 0
            IoUid = 0
            NoNewKeyring = false
            NoPivotRoot = false
            Root = ""
            ShimCgroup = ""
            SystemdCgroup = true

      [plugins."io.containerd.grpc.v1.cri".containerd.untrusted_workload_runtime]
        base_runtime_spec = ""
        cni_conf_dir = ""
        cni_max_conf_num = 0
        container_annotations = []
        pod_annotations = []
        privileged_without_host_devices = false
        runtime_engine = ""
        runtime_path = ""
        runtime_root = ""
        runtime_type = ""

        [plugins."io.containerd.grpc.v1.cri".containerd.untrusted_workload_runtime.options]

    [plugins."io.containerd.grpc.v1.cri".image_decryption]
      key_model = "node"

    [plugins."io.containerd.grpc.v1.cri".registry]
      config_path = ""

      [plugins."io.containerd.grpc.v1.cri".registry.auths]

      [plugins."io.containerd.grpc.v1.cri".registry.configs]

      [plugins."io.containerd.grpc.v1.cri".registry.headers]

      [plugins."io.containerd.grpc.v1.cri".registry.mirrors]

    [plugins."io.containerd.grpc.v1.cri".x509_key_pair_streaming]
      tls_cert_file = ""
      tls_key_file = ""

  [plugins."io.containerd.internal.v1.opt"]
    path = "/opt/containerd"

  [plugins."io.containerd.internal.v1.restart"]
    interval = "10s"

  [plugins."io.containerd.internal.v1.tracing"]
    sampling_ratio = 1.0
    service_name = "containerd"

  [plugins."io.containerd.metadata.v1.bolt"]
    content_sharing_policy = "shared"

  [plugins."io.containerd.monitor.v1.cgroups"]
    no_prometheus = false

  [plugins."io.containerd.runtime.v1.linux"]
    no_shim = false
    runtime = "runc"
    runtime_root = ""
    shim = "containerd-shim"
    shim_debug = false

  [plugins."io.containerd.runtime.v2.task"]
    platforms = ["linux/amd64"]
    sched_core = false

  [plugins."io.containerd.service.v1.diff-service"]
    default = ["walking"]

  [plugins."io.containerd.service.v1.tasks-service"]
    rdt_config_file = ""

  [plugins."io.containerd.snapshotter.v1.aufs"]
    root_path = ""

  [plugins."io.containerd.snapshotter.v1.btrfs"]
    root_path = ""

  [plugins."io.containerd.snapshotter.v1.devmapper"]
    async_remove = false
    base_image_size = ""
    discard_blocks = false
    fs_options = ""
    fs_type = ""
    pool_name = ""
    root_path = ""

  [plugins."io.containerd.snapshotter.v1.native"]
    root_path = ""

  [plugins."io.containerd.snapshotter.v1.overlayfs"]
    root_path = ""
    upperdir_label = false

  [plugins."io.containerd.snapshotter.v1.zfs"]
    root_path = ""

  [plugins."io.containerd.tracing.processor.v1.otlp"]
    endpoint = ""
    insecure = false
    protocol = ""

[proxy_plugins]

[stream_processors]

  [stream_processors."io.containerd.ocicrypt.decoder.v1.tar"]
    accepts = ["application/vnd.oci.image.layer.v1.tar+encrypted"]
    args = ["--decryption-keys-path", "/etc/containerd/ocicrypt/keys"]
    env = ["OCICRYPT_KEYPROVIDER_CONFIG=/etc/containerd/ocicrypt/ocicrypt_keyprovider.conf"]
    path = "ctd-decoder"
    returns = "application/vnd.oci.image.layer.v1.tar"

  [stream_processors."io.containerd.ocicrypt.decoder.v1.tar.gzip"]
    accepts = ["application/vnd.oci.image.layer.v1.tar+gzip+encrypted"]
    args = ["--decryption-keys-path", "/etc/containerd/ocicrypt/keys"]
    env = ["OCICRYPT_KEYPROVIDER_CONFIG=/etc/containerd/ocicrypt/ocicrypt_keyprovider.conf"]
    path = "ctd-decoder"
    returns = "application/vnd.oci.image.layer.v1.tar+gzip"

[timeouts]
  "io.containerd.timeout.bolt.open" = "0s"
  "io.containerd.timeout.shim.cleanup" = "5s"
  "io.containerd.timeout.shim.load" = "5s"
  "io.containerd.timeout.shim.shutdown" = "3s"
  "io.containerd.timeout.task.state" = "2s"

[ttrpc]
  address = ""
  gid = 0
  uid = 0

sandbox 镜像源：设置 Kubernetes 使用的沙箱容器镜像，支持高效管理容器.

sandbox_image = "registry.aliyuncs.com/google_containers/pause:3.9"

hugeTLB 控制器：禁用 hugeTLB 控制器，减少内存管理复杂性，适合不需要的环境.

disable_hugetlb_controller = true

网络插件路径：指定 CNI 网络插件的二进制和配置路径，确保网络功能正常.

bin_dir = "/opt/cni/bin"
conf_dir = "/etc/cni/net.d"

垃圾回收调度器：调整垃圾回收阈值和启动延迟，优化容器资源管理和性能.

pause_threshold = 0.02
startup_delay = "100ms"

流媒体服务器：配置流媒体服务的地址和端口，实现与客户端的有效数据传输.

stream_server_address = "127.0.0.1"
stream_server_port = "0"

启动并设置containerd开机自启。

systemctl enable containerd  --now
systemctl status containerd

14.安装Docker-ce(使用docker的拉镜像功能)

1）安装docker-ce最新版:

yum -y install docker-ce

2）启动并设置docker开机自启:

systemctl start docker && systemctl enable docker.service

3）配置docker的镜像加速器地址:

注：阿里加速地址登录阿里云加速器官网查看，每个人的加速地址不同。

tee /etc/docker/daemon.json <<-'EOF'
{
    "registry-mirrors": [
        "https://fb3aq27p.mirror.aliyuncs.com",
        "https://registry.docker-cn.com",
        "https://docker.mirrors.ustc.edu.cn",
        "https://dockerhub.azk8s.cn",
        "http://hub-mirror.c.163.com"
    ]
}
EOF
systemctl daemon-reload
systemctl restart docker
systemctl status docker

2、K8S安装部署

1.安装K8S相关核心组件

三台主机分别安装K8S相关核心组件:

yum -y install  kubelet-1.28.2 kubeadm-1.28.2 kubectl-1.28.2
systemctl enable kubelet

kubelet 是 Kubernetes 集群中每个节点上的核心代理，它负责根据控制平面的指示管理和维护节点上的 Pod 及容器的生命周期，确保容器按规范运行并定期与控制平面通信。kubelet 会将节点和 Pod 的状态上报给控制节点的 apiServer，apiServer再将这些信息存储到 etcd 数据库中。
kubeadm 是一个用于简化 Kubernetes 集群安装和管理的工具，快速初始化控制平面节点和将工作节点加入集群，减少手动配置的复杂性。
kubectl 是 Kubernetes 的命令行工具，用于管理员与集群进行交互，执行各种任务，如部署应用、查看资源、排查问题、管理集群状态等，通过命令行与 Kubernetes API 直接通信。

2.初始化集群

1）Master节点使用kubeadm初始化K8S集群:

注：kubeadm安装K8S，控制节点和工作节点的组件都是基于Pod运行的.

kubeadm config print init-defaults > kubeadm.yaml

生成默认的配置文件重定向输出到 kubeadm.yaml 中

2）修改刚刚用kubeadm生成的kubeadm.yaml文件:

sed -i '1,$s/advertiseAddress: 1.2.3.4/advertiseAddress: 192.168.116.131/g' kubeadm.yaml
sed -i "s|criSocket:.*|criSocket: unix://$(find / -name containerd.sock | head -n 1)|" kubeadm.yaml
sed -i '1,$s/name: node/name: master/g' kubeadm.yaml
sed -i 's|imageRepository: registry.k8s.io|imageRepository: registry.aliyuncs.com/google_containers|' kubeadm.yaml	# 原配置为国外的k8s源，为了加速镜像的下载，需改成国内源
sed -i '/serviceSubnet/a\  podSubnet: 10.244.0.0/12' kubeadm.yaml  # /a\ 表示在serviceSubnet行下方一行内容
cat <<EOF >> kubeadm.yaml
---
apiVersion: kubeproxy.config.k8s.io/v1alpha1
kind: KubeProxyConfiguration
mode: ipvs
---
apiVersion: kubelet.config.k8s.io/v1beta1
kind: KubeletConfiguration
cgroupDriver: systemd
EOF

more kubeadm.yaml  # 手动检查一下

advertiseAddress 是 Kubernetes 控制节点的广告地址，其他节点通过这个地址与控制平面节点通信。它通常是控制节点所在服务器的 IP 地址，为了确保控制平面节点能在网络中通过正确的控制节点 IP 地址（我的MasterIP为：192.168.116.131）进行通信.
criSocket 指定的是 Kubernetes 使用的容器运行时（CRI）套接字地址，K8S 使用这个套接字与容器运行时（如 containerd）进行通信，来管理和启动容器。为了确保 K8S使用正确的容器运行时套接字。通过 find 命令查找 containerd.sock 文件路径并替换进配置文件，可以保证路径的准确性，避免手动查找和配置错误.
IPVS 模式支持更多的负载均衡算法，性能更好，尤其在集群节点和服务较多的情况下，可以显著提升网络转发效率和稳定性（如果没有指定mode为ipvs，则默认选定iptables，iptables性能相对较差）.
统一使用 systemd 作为容器和系统服务的 cgroup 驱动，避免使用 cgroupfs 时可能产生的资源管理不一致问题，提升 Kubernetes 和宿主机系统的兼容性和稳定性.

注：主机 IP、Pod IP 和 Service IP 不能在同一网段，因会导致 IP 冲突、路由混乱及网络隔离失败，影响 Kubernetes 的正常通信和网络安全.

3）基于kubeadm.yaml 文件初始化K8S，三台主机分别拉取 Kubernetes 1.28.0 所需的镜像（两个方法可以二选一）:

（1）使用使用 kubeadm 命令，快速拉取 Kubernetes 所有核心组件的镜像，并确保版本一致.

kubeadm config images pull --image-repository="registry.aliyuncs.com/google_containers" --kubernetes-version=v1.28.0

（2）使用 ctr 命令，需要更细粒度的控制，或在 kubeadm 拉取镜像过程中出现问题时，可以使用 ctr 命令手动拉取镜像.

ctr -n=k8s.io images pull registry.aliyuncs.com/google_containers/kube-apiserver:v1.28.0
ctr -n=k8s.io images pull registry.aliyuncs.com/google_containers/kube-controller-manager:v1.28.0
ctr -n=k8s.io images pull registry.aliyuncs.com/google_containers/kube-scheduler:v1.28.0
ctr -n=k8s.io images pull registry.aliyuncs.com/google_containers/kube-proxy:v1.28.0
ctr -n=k8s.io images pull registry.aliyuncs.com/google_containers/pause:3.9
ctr -n=k8s.io images pull registry.aliyuncs.com/google_containers/etcd:3.5.9-0
ctr -n=k8s.io images pull registry.aliyuncs.com/google_containers/coredns:v1.10.1

4）在Master控制节点，初始化 Kubernetes 主节点。

kubeadm init --config=kubeadm.yaml --ignore-preflight-errors=SystemVerification

个别操作系统可能会出现kubelet启动失败的情况，如下提示，如果提示successfully则忽略以下步骤:

[!WARNING] 。

dial tcp [::1]:10248: connect: connection refused 。

执行systemctl status kubelet发现出现以下错误提示:

[!WARNING] 。

Process: 2226953 ExecStart=/usr/bin/kubelet $KUBELET_KUBECONFIG_ARGS $KUBELET_CONFIG_ARGS $KUBELET_KUBEADM_ARGS $KUBELET_EXTRA_ARGS (code=exited, status=1/FAILURE) Main PID: 2226953 (code=exited, status=1/FAILURE) 。

解决方法如下，控制节点执行:

sed -i 's|ExecStart=/usr/bin/kubelet|ExecStart=/usr/bin/kubelet --container-runtime-endpoint=unix://$(find / -name containerd.sock | head -n 1) --kubeconfig=/etc/kubernetes/kubelet.conf --config=/var/lib/kubelet/config.yaml|' /usr/lib/systemd/system/kubelet.service

systemctl daemon-reload
systemctl restart kubelet

kubeadm reset # 删除安装出错的K8S
kubeadm init --config=kubeadm.yaml --ignore-preflight-errors=SystemVerification # 重新安装

3.设置 Kubernetes 的配置文件，以便让当前用户能够使用 `kubectl` 命令与 Kubernetes 集群进行交互

控制节点执行:

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

4.工作节点加到K8S集群

1）添加工作节点之前，控制节点执行如下命令:

kubeadm token create --print-join-command

执行成功会出现如下提示（token）:

[!IMPORTANT] 。

kubeadm join 192.168.116.131:6443 --token xxiuik.9axtcp5xk3n2yo7b --discovery-token-ca-cert-hash sha256:ed678b5331259917248c966bf387e6aaf9f588798fb3977090fd6203780ceca9 。

2）接下来就是复制生成这个这条token，分别在工作节点Node01和Node02进行执行，成功添加集群的提示为:

[!IMPORTANT] 。

This node has joined the cluster

Certificate signing request was sent to apiserver and a response was received.

The Kubelet was informed of the new secure connection details.

注：如果在工作节点加入集群出现报错可以添加 --ignore-preflight-errors=SystemVerification 忽略遇见错误，如下所示:

kubeadm join 192.168.116.131:6443 --token xxiuik.9axtcp5xk3n2yo7b --discovery-token-ca-cert-hash sha256:ed678b5331259917248c966bf387e6aaf9f588798fb3977090fd6203780ceca9 --ignore-preflight-errors=SystemVerification

2）设置一个用户的 kubectl 环境，使其能够与 Kubernetes 集群进行交互:

mkdir ~/.kube
cp /etc/kubernetes/kubelet.conf  ~/.kube/config

kubectl 默认会在用户主目录下的 .kube/config 文件中查找 Kubernetes 集群的连接信息。如果这个文件不存在，kubectl 将无法找到任何指向 API 服务器的配置信息。
如果你没有执行上述两条命令，kubectl 就没有配置文件可用，导致其尝试连接到默认的 API 服务器地址 http://localhost:8080。

若不配置用户的kubectl环境，查看节点状态时会出现如下错误:

[!WARNING] 。

E1004 22:30:56.770509 34971 memcache.go:265] couldn't get current server API group list: Get "http://localhost:8080/api?timeout=32s": dial tcp [::1]:8080: connect: connection refused E1004 22:30:56.777399 34971 memcache.go:265] couldn't get current server API group list: Get "http://localhost:8080/api?timeout=32s": dial tcp [::1]:8080: connect: connection refused E1004 22:30:56.780040 34971 memcache.go:265] couldn't get current server API group list: Get "http://localhost:8080/api?timeout=32s": dial tcp [::1]:8080: connect: connection refused E1004 22:30:56.781809 34971 memcache.go:265] couldn't get current server API group list: Get "http://localhost:8080/api?timeout=32s": dial tcp [::1]:8080: connect: connection refused E1004 22:30:56.783489 34971 memcache.go:265] couldn't get current server API group list: Get "http://localhost:8080/api?timeout=32s": dial tcp [::1]:8080: connect: connection refused The connection to the server localhost:8080 was refused - did you specify the right host or port？

最后查看所有节点的状态（在控制节点或者工作节点都可以检查）:

kubectl get nodes

[!IMPORTANT] 。

NAME STATUS ROLES AGE VERSION master NotReady control-plane 68m v1.28.2 node01 NotReady 11m v1.28.2 node02 NotReady 21m v1.28.2 。

5.安装k8s网络组件Calico

Calico 是一个流行的开源网络解决方案，专为 Kubernetes 提供高效、可扩展和安全的网络连接。它采用了基于 IP 的网络模型，使每个 Pod 都能获得一个唯一的 IP 地址，从而简化了网络管理。Calico 支持多种网络策略，可以实现细粒度的流量控制和安全策略，例如基于标签的访问控制，允许用户定义哪些 Pod 可以相互通信。（简单来说就是给Pod和Service分IP的,还能通过网络策略做网络隔离）。

1）三台主机分别安装calico:

ctr image pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/calico/cni:v3.25.0
ctr image pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/calico/pod2daemon-flexvol:v3.25.0
ctr image pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/calico/node:v3.25.0
ctr image pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/calico/kube-controllers:v3.25.0
ctr image pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/calico/typha:v3.25.0

2) 控制节点下载calico3.25.0的yaml配置文件(下载失败把URL复制到浏览器，手动复制粘贴到Master节点效果相同) 。

curl -O -L https://raw.githubusercontent.com/projectcalico/calico/v3.25.0/manifests/calico.yaml

3）编辑calico.yaml，找到CLUSTER_TYPE行，在下面添加一对键值对，确保使用网卡接口（注意缩进）:

原配置:

- name: CLUSTER_TYPE
  value: "k8s,bgp"

新配置:

 - name: CLUSTER_TYPE
  value: "k8s,bgp" 
 - name: IP_AUTODELECTION_METHOD
  value: "interface=ens160"

注：不同操作系统的网卡名称有差异，例：centos7.9的网卡名称为ens33，就要填写value: "interface=ens33"，需灵活变通.

注：如果出现calico拉取镜像错误问题，可能是没有修改imagePullPresent规则，可以修改官方源下载为华为源下载，如下:

sed -i '1,$s|docker.io/calico/cni:v3.25.0|swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/calico/cni:v3.25.0|g' calico.yaml
sed -i '1,$s|docker.io/calico/node:v3.25.0|swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/calico/node:v3.25.0|g' calico.yaml
sed -i '1,$s|docker.io/calico/kube-controllers:v3.25.0|swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/calico/kube-controllers:v3.25.0|g' calico.yaml

4）部署calico网络服务。

kubectl apply -f calico.yaml

查看在 Kubernetes 集群中查看属于 kube-system 命名空间的所有 Pod 的详细信息（控制节点和工作节点都查的到）:

kubectl get pod --namespace kube-system -o wide

calico安装成功的信息大概如下:

[!IMPORTANT] 。

NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES calico-kube-controllers-665548954f-99gbl 1/1 Running 0 69s 10.251.205.131 master calico-node-57bg8 1/1 Running 0 69s 192.168.116.132 node01 calico-node-lfqtb 1/1 Running 0 69s 192.168.116.133 node02 calico-node-vqg9b 1/1 Running 0 69s 192.168.116.131 master coredns-66f779496c-44t4m 1/1 Running 0 13h 10.251.205.130 master coredns-66f779496c-vmwdj 1/1 Running 0 13h 10.251.205.129 master etcd-master 1/1 Running 0 13h 192.168.116.131 master kube-apiserver-master 1/1 Running 0 13h 192.168.116.131 master kube-controller-manager-master 1/1 Running 0 13h 192.168.116.131 master kube-proxy-6v262 1/1 Running 1 12h 192.168.116.133 node02 kube-proxy-s84wz 1/1 Running 0 13h 192.168.116.131 master kube-proxy-z8k5d 1/1 Running 0 12h 192.168.116.132 node01 kube-scheduler-master 1/1 Running 0 13h 192.168.116.131 master 。

3、总结

部署成功和不成功麻烦反馈一下，我会做出优化调整。

　　▃▆█▇▄▖ 。

　　　 ▟◤▖　　　◥█▎ 　 ◢◤　 ▐　　　　▐▉ 　 ▗◤　　　▂　▗▖　　▕█▎ 　◤　▗▅▖◥▄　▀◣　　█▊ ▐　▕▎◥▖◣◤　　　　◢██ █◣　◥▅█▀　　　　▐██◤ ▐█▙▂　　　◢██◤ ◥██◣　　　　◢▄◤ 　　▀██▅▇▀ 。

最后此篇关于单Master节点的k8s集群部署-完整版的文章就讲到这里了,如果你想了解更多关于单Master节点的k8s集群部署-完整版的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐：使用ValueConverters扩展实现枚举控制页面的显示

文章推荐： Nuxt.js应用中的app：mounted钩子详解

MySQL MASTER MASTER 复制，添加一个新的 Master 而不会停机
我在 2 个不同的节点中设置了 master-master mysql 复制。假设如果我要再添加一个节点，即 3rd master ，我是否需要在新服务器中拥有与节点 1 和节点 2 中完全相同的数据
Git 分支 : master vs. origin/master 与 remotes/origin/master
我认为我在理解 git 的基本概念方面是正确的。我已经设置并克隆了一个远程存储库。我还创建了一个服务器端空存储库，并将我的本地存储库链接到它。我的问题是我不明白: origin/master 与
replication - Master-Master 复制如何工作？
从概念上讲，Master-Master 复制是如何工作的？我认为碰撞将是一种需要以某种方式解决的常见事件。最佳答案主-主复制(更一般地——多主复制)在概念上的工作原理是假设冲突并不常见，并且只保
mysql master-master 数据复制一致性
众所周知，mysql 是异步复制的。我听说我需要一些额外的插件来做同步复制。那么让我们考虑一下异步复制的情况:master 将事件写入其二进制日志，但不知道 master2 是否或何时检索并处理了
MySql Master-Master 复制导致缺少自增值
我正在寻求有关 MySql Master-Master 配置问题的帮助。我正在处理由另一名员工设置的服务器配置，该员工现在无法就此事提供任何帮助。这是我第一次体验这样的设置，在做了相当多的研究之后，
java - ERROR [main] master.HMasterCommandLine : Master exiting java. lang.RuntimeException: Master 构建失败
尝试使用 HADOOP 运行 HBASE 时出现以下错误HBASE 0.98.xHADOOP 2.4.0 ERROR [main] master.HMasterCommandLine: Mas
apache-spark - 为什么停止独立 Spark master 会失败并显示 "no org.apache.spark.deploy.master.Master to stop"？
停止独立 Spark Master 失败并显示以下消息: $ ./sbin/stop-master.sh no org.apache.spark.deploy.master.Master to sto
git - 在 git 中，在将新代码添加到 master 后，是否可以从 master merge 到最初从 master 创建的分支？
我不确定这是否是一个正常的分支场景，但是...... 假设我从 master 创建一个分支，比如分支 C，然后 merge 回其他先前存在的分支，比如分支 A 和 B，回到 master，然后我需要分
git ! [远程拒绝] master -> master(锁定失败)
我无法推送到我的 git 存储库。 git clone和 git pull工作正常，但 git push不起作用。我检查了其他答案，如 here尝试了几种方法，例如 git push origin
git - 是否可以将更改从 master 创建的分支作为本地更改返回到 master？
所以如果我在 master 中做: git checkout -b my-branch 并在那里做几次提交+推送。然后我做: git checkout master git pull 我现在能以某种方
mysql - Master-Master 复制 auto_increment_offset
我设置了 2 个 MYSQL 服务器: my.cnf server1: auto_increment_increment = 2 auto_increment_offset = 1 my.cnf se
MySQL Master <=(Slave,Master)=> Slave
我想知道一个服务器是否可以同时是slave和master。我们的问题是我们有很多移动单元需要同步到主服务器，但它们只需要主服务器上 100 个表中的 6 个。除了延迟同步和增加数据成本之外，所有额外的
mysql - Master-Master Mysql复制中log-bin文件大小不同
我有主-主 Mysql 复制。每个主控复制其他主控。谁能解释一下为什么该主机上的 log-bin 文件不同？ (尺寸差异很小)。谢谢! 最佳答案嗯。我们决定使用 mysql 5.6 及其功能 - G
iOS Swift Master > Master > Detail？
我正在努力理解这里的逻辑，如果术语不正确，我深表歉意。我正在尝试构建一个功能类似于邮件的应用程序，IE: 所有邮箱 > 特定邮箱 > 消息其中“所有邮箱”和“特定邮箱”占据 Controller
git - 将 master 分支移动到另一个分支并启动新的 master
我一直在使用 master 分支进行开发，并希望将其清除为只有发布提交，以及它的用途。如何将所有内容从 master 复制到开发分支，然后重新启动 master？最佳答案 Create develo
Git rebase/master 从分支更改为 master
两周前，我创建了一个新分支，我们称它为exp。在此期间，exp 和 master 中都有几次提交。在此期间，exp 尚未更新 master 的更改现在我想把所有从 exp 到 master 的更改都
git - ! [远程拒绝] master -> master(权限被拒绝)
我克隆:https://github.com/vy2014/git_lesson.git 然后我做了一些改动，尝试通过命令git push推送到远程服务器，但是错误: Counting objects
git - ! [rejected] master -> master(先获取)
有没有好的方法来解释如何在 Git 中解决“![rejected] master -> master (fetch first)'”？当我使用此命令时 $ git push origin maste
git backout master，推送到分支，稍后进入 master
我该怎么办: 1)恢复推送到主(远程)的更改 2)将这些更改移动到单独的分支 3) 稍后将这些更改移回 master 最佳答案首先做 2)，但前提是你真的需要分支。 git branch chang
git - 分支显示显示 (master-> origin) 而不仅仅是 (master)
符号上有什么区别？在我的一个工作站上，我克隆的 git 存储库显示(master)，而另一个工作站则显示(master -> origin) 我还创建了一个新的本地存储库，提交了一个文本文件，提示仍

撒哈拉

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

单Master节点的k8s集群部署-完整版

K8S 安装步骤

1、准备工作

1.准备三台主机（一台Master节点，两台Node节点）如下：

2.关闭SElinux，因为SElinux会影响K8S部分组件无法正常工作：

3.三台主机分别配置主机名，如下：

4.三台主机分别配置host文件：

5.三台主机分别下载所需意外组件包和相关依赖包：

6.配置主机之间免密登录

Master节点：

Node01节点：

Node02节点：

7.关闭所有主机的firewall防火墙

8.三台主机关闭swap交换分区

9.修改内核参数

10.配置安装Docker和Containerd的yum源

11.配置K8S命令行工具所需要的yum源

12.三台主机进行时间同步

13.安装Containerd

14.安装Docker-ce(使用docker的拉镜像功能)

2、K8S安装部署

1.安装K8S相关核心组件

2.初始化集群

3.设置 Kubernetes 的配置文件，以便让当前用户能够使用 `kubectl` 命令与 Kubernetes 集群进行交互

4.工作节点加到K8S集群

5.安装k8s网络组件Calico

3、总结

部署成功和不成功麻烦反馈一下，我会做出优化调整。

首页

博学

6Ren·AI

商城

单Master节点的k8s集群部署-完整版

K8S 安装步骤

﻿1、准备工作

1.准备三台主机（一台Master节点，两台Node节点）如下：

2.关闭SElinux，因为SElinux会影响K8S部分组件无法正常工作：

3.三台主机分别配置主机名，如下：

4.三台主机分别配置host文件：

5.三台主机分别下载所需意外组件包和相关依赖包：

6.配置主机之间免密登录

Master节点：

Node01节点：

Node02节点：

7.关闭所有主机的firewall防火墙

8.三台主机关闭swap交换分区

9.修改内核参数

10.配置安装Docker和Containerd的yum源

11.配置K8S命令行工具所需要的yum源

12.三台主机进行时间同步

13.安装Containerd

14.安装Docker-ce(使用docker的拉镜像功能)

2、K8S安装部署

1.安装K8S相关核心组件

2.初始化集群

3.设置 Kubernetes 的配置文件，以便让当前用户能够使用 kubectl 命令与 Kubernetes 集群进行交互

4.工作节点加到K8S集群

5.安装k8s网络组件Calico

3、总结

部署成功和不成功麻烦反馈一下，我会做出优化调整。

1、准备工作

3.设置 Kubernetes 的配置文件，以便让当前用户能够使用 `kubectl` 命令与 Kubernetes 集群进行交互