Bootstrap

二进制部署k8s集群之master节点和etcd数据库集群(上)

二进制搭建 Kubernetes v1.20

k8s集群master01:20.0.0.20	kube-apiserver kube-controller-manager kube-scheduler etcd
k8s集群master02:20.0.0.30
 
k8s集群node01:20.0.0.40	kubelet kube-proxy docker 
k8s集群node02:20.0.0.50
 
etcd集群节点1:20.0.0.20	etcd
etcd集群节点2:20.0.0.40
etcd集群节点3:20.0.0.50
 
负载均衡nginx+keepalive01(master):20.0.0.10
负载均衡nginx+keepalive02(backup):20.0.0.60

1、操作系统初始化配置

所有服务器操作
20.0.0.20 master01
20.0.0.30 master02
20.0.0.40 node01
20.0.0.50 node02
 
 
#关闭防火墙、关闭selinux
systemctl disable --now firewalld
iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X
setenforce 0
vim /etc/selinux/config
SELINUX=disabled
 
 
#关闭swap
swapoff -a
sed -ri 's/.*swap.*/#&/' /etc/fstab 
 
#根据规划设置主机名
hostnamectl set-hostname master01
hostnamectl set-hostname master02
hostnamectl set-hostname node01
hostnamectl set-hostname node02
 
在master两个节点添加hosts
vim /etc/hosts
20.0.0.20 master01
20.0.0.30 master02
20.0.0.40 node01
20.0.0.50 node02
#调整内核参数   所有服务器操作
cat > /etc/sysctl.d/k8s.conf << EOF
#开启网桥模式,可将网桥的流量传递给iptables链
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
#关闭ipv6协议
net.ipv6.conf.all.disable_ipv6=1
net.ipv4.ip_forward=1
EOF
 
sysctl --system   #加载
#时间同步   所有服务器操作
vim /etc/chrony.conf
#server 0.centos.pool.ntp.org iburst
#server 1.centos.pool.ntp.org iburst
#server 2.centos.pool.ntp.org iburst
#server 3.centos.pool.ntp.org iburst
server ntp1.aliyun.com iburst

systemctl restart chronyd.service
chronyc -a makestep
date

2、升级Linux内核 

vim /etc/yum.repos.d/elrepo.repo   所有服务器操作
[elrepo]
name=elrepo
baseurl=https://mirrors.aliyun.com/elrepo/archive/kernel/el7/x86_64
gpgcheck=0
enabled=1
 
 
cd /etc/yum.repos.d/
mv local.repo repo.bak/
导入阿里云在线源
yum clean all  所有服务器操作
yum install -y kernel-lt kernel-lt-devel  集群升级内核
#查看内核序号
awk -F\' '$1=="menuentry " {print i++ " : " $2}' /etc/grub2.cfg
#设置默认启动内核
grub2-set-default 0
#重启操作系统
reboot
#查看生效版本
hostnamectl

3、部署docker引擎

所有 node 节点部署docker引擎
yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo 
yum install -y docker-ce docker-ce-cli containerd.io

所有node节点服务器操作
cat > /etc/docker/daemon.json <<EOF
{
  "registry-mirrors": ["自己的阿里云镜像加速器地址"],
  "exec-opts": ["native.cgroupdriver=systemd"],
  "log-driver": "json-file",
  "log-opts": {
    "max-size": "500m", "max-file": "3"
  }
}
EOF
 
systemctl enable --now docker
docker info

4、部署etcd集群

etcd是一个分布式键值存储系统,用于在分布式系统中保存配置信息、元数据以及关键的共享状态。它是一个开源项目,最初由CoreOS开发并维护,现在由CNCF托管。etcd的设计目标是提供可靠的分布式存储,以支持分布式系统的一致性和高可用性。

关键特性:
●分布式存储:etcd的数据存储是分布式的,可以跨多个节点进行分布,确保高可用性和可扩展性。
●强致性:etcd提供强一致性的保证,确保在集群中的所有节点都能看到相同的数据视图。
●轻量级:etcd采用轻量级的Raft一致性算法,以确保集群中的节点之间达成一致,同时保持相对较低的性能开销。
●API支持:etcd提供简单而强大的HTTP+JSON API,使得开发人员可以轻松地与其进行交互,并集成到各种应用和工具中。
●Watch机制:etcd支持Watch机制,允许客户端监视特定键的变化,并在数据发生变更时得到通知。
●安全性:etcd支持SSL/TLS加密,以保障数据在传输过程中的安全性,并提供基于角色的访问控制。

应用场景:
●配置管理: etcd常用于存储应用程序和系统的配置信息,允许动态地更新配置而无需重启应用。
●服务发现: etcd可以用作服务发现的后端存储,帮助服务在动态环境中找到彼此。
●分布式锁: 通过etcd的分布式锁机制,可以实现分布式系统中的协同工作和资源同步。
●集群协调: etcd在构建分布式系统中,作为集群协调的关键组件,确保系统的一致性和稳定性。

总体而言,etcd在云原生应用和分布式系统中发挥着重要作用,提供了可靠的分布式存储和协调服务,为应用程序提供一致性、可靠性和高可用性的基础设施支持。

etcd 目前默认使用2379端口提供HTTP API服务, 2380端口和peer通信(这两个端口已经被IANA(互联网数字分配机构)官方预留给etcd)。 即etcd默认使用2379端口对外为客户端提供通讯,使用端口2380来进行服务器间内部通讯。
etcd 在生产环境中一般推荐集群方式部署。由于etcd 的leader选举机制,要求至少为3台或以上的奇数台。

准备签发证书环境 
CFSSL 是 CloudFlare 公司开源的一款 PKI/TLS 工具。 CFSSL 包含一个命令行工具和一个用于签名、验证和捆绑 TLS 证书的 HTTP API 服务。使用Go语言编写。
CFSSL 使用配置文件生成证书,因此自签之前,需要生成它识别的 json 格式的配置文件,CFSSL 提供了方便的命令行生成配置文件。
CFSSL 用来为 etcd 提供 TLS 证书,它支持签三种类型的证书:
1、client 证书,服务端连接客户端时携带的证书,用于客户端验证服务端身份,如 kube-apiserver 访问 etcd;
2、server 证书,客户端连接服务端时携带的证书,用于服务端验证客户端身份,如 etcd 对外提供服务;
3、peer 证书,相互之间连接时使用的证书,如 etcd 节点之间进行验证和通信。
这里全部都使用同一套证书认证。

在 master01 节点上操作 (20.0.0.20)

cd /usr/local/bin
上传所需软件包
chmod +x *

生成etcd证书

mkdir /opt/k8s
cd /opt/k8s/
 
#上传 etcd-cert.sh 和 etcd.sh 到 /opt/k8s/ 目录中
#上传 etcd-v3.4.26-linux-amd64.tar.gz 到 /opt/k8s 目录中,
chmod +x etcd-cert.sh etcd.sh
 
 
#创建用于生成CA证书、etcd 服务器证书以及私钥的目录
mkdir /opt/k8s/etcd-cert
mv etcd-cert.sh etcd-cert/
cd /opt/k8s/etcd-cert/
vim etcd-cert.sh  #修改其中通信地址为本地
./etcd-cert.sh			#生成CA证书、etcd 服务器证书以及私钥

cd /opt/k8s/
tar xf etcd-v3.4.26-linux-amd64.tar.gz
 
cd /opt
mkdir etcd
cd etcd
mkdir cfg bin ssl
cd /opt/k8s/etcd-v3.4.26-linux-amd64/
mv etcd etcdctl /opt/etcd/bin/
cd ..
cd etcd-cert/
cp *.pem /opt/etcd/ssl/

cd /opt/k8s
./etcd.sh etcd01 20.0.0.20 etcd02=https://20.0.0.40:2380,etcd03=https://20.0.0.50:2380
#进入卡住状态等待其他节点加入,这里需要三台etcd服务同时启动,如果只启动其中一台后,服务会卡在那里,直到集群中所有etcd节点都已启动,可忽略这个情况
 
#可另外打开一个窗口查看etcd进程是否正常
ps -ef | grep etcd
 

打开一个新的窗口查看

#把etcd相关证书文件、命令文件和服务管理文件全部拷贝到另外两个etcd集群节点
scp -r /opt/etcd/ [email protected]:/opt/
scp -r /opt/etcd/ [email protected]:/opt/
cd /usr/lib/systemd/system
scp etcd.service [email protected]:`pwd`
scp etcd.service [email protected]:`pwd`

在 etcd02 节点上操作(20.0.0.40)

vim /opt/etcd/cfg/etcd
#[Member]
ETCD_NAME="etcd02"
ETCD_DATA_DIR="/var/lib/etcd/default.etcd"
ETCD_LISTEN_PEER_URLS="https://20.0.0.40:2380"
ETCD_LISTEN_CLIENT_URLS="https://20.0.0.40:2379"
 
#[Clustering]
ETCD_INITIAL_ADVERTISE_PEER_URLS="https://20.0.0.40:2380"
ETCD_ADVERTISE_CLIENT_URLS="https://20.0.0.40:2379"
ETCD_INITIAL_CLUSTER="etcd01=https://20.0.0.20:2380,etcd02=https://20.0.0.40:2380,etcd03=https://20.0.0.50:2380"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"
ETCD_INITIAL_CLUSTER_STATE="new"

在etcd03 节点上操作(20.0.0.50)

vim /opt/etcd/cfg/etcd
#[Member]
ETCD_NAME="etcd03"
ETCD_DATA_DIR="/var/lib/etcd/default.etcd"
ETCD_LISTEN_PEER_URLS="https://20.0.0.50:2380"
ETCD_LISTEN_CLIENT_URLS="https://20.0.0.50:2379"
 
#[Clustering]
ETCD_INITIAL_ADVERTISE_PEER_URLS="https://20.0.0.50:2380"
ETCD_ADVERTISE_CLIENT_URLS="https://20.0.0.50:2379"
ETCD_INITIAL_CLUSTER="etcd01=https://20.0.0.20:2380,etcd02=https://20.0.0.40:2380,etcd03=https://20.0.0.50:2380"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"
ETCD_INITIAL_CLUSTER_STATE="new"

systemctl enable --now etcd.service    #分别启动etcd02、etcd03两个节点
三个node节点查看etcd状态
systemctl status etcd.service

01节点

02节点

03节点

(1)了解etcdctl工具对etcd做增删改查

1)添加、查看

#检查etcd群集健康状态
cd /opt/etcd/ssl
ETCDCTL_API=3 /opt/etcd/bin/etcdctl --endpoints="https://20.0.0.20:2379,https://20.0.0.40:2379,https://20.0.0.50:2379" --cacert=ca.pem --cert=server.pem --key=server-key.pem -wtable endpoint health   
#注: --cacert=ca.pem --cert=server.pem --key=server-key.pem 需要提前进去文件所在目录,或指定绝对路径,才可执行命令

#检查etcd群集状态信息
ETCDCTL_API=3 /opt/etcd/bin/etcdctl --endpoints="https://20.0.0.20:2379,https://20.0.0.40:2379,https://20.0.0.50:2379" --cacert=ca.pem --cert=server.pem --key=server-key.pem -wtable endpoint status

#检查etcd群集成员列表
ETCDCTL_API=3 /opt/etcd/bin/etcdctl --endpoints="https://20.0.0.20:2379,https://20.0.0.40:2379,https://20.0.0.50:2379" --cacert=ca.pem --cert=server.pem --key=server-key.pem -wtable member list
插入、查询键值
 ETCDCTL_API=3 /opt/etcd/bin/etcdctl --endpoints="https://20.0.0.20:2379,https://20.0.0.40:2379,https://20.0.0.50:2379" --cacert=ca.pem --cert=server.pem --key=server-key.pem put myname 'zx'


 ETCDCTL_API=3 /opt/etcd/bin/etcdctl --endpoints="https://20.0.0.20:2379,https://20.0.0.40:2379,https://20.0.0.50:2379" --cacert=ca.pem --cert=server.pem --key=server-key.pem get myname

2)删除

 ETCDCTL_API=3 /opt/etcd/bin/etcdctl --endpoints="https://20.0.0.20:2379,https://20.0.0.40:2379,https://20.0.0.50:2379" --cacert=ca.pem --cert=server.pem --key=server-key.pem del myname

(2)通过etcdctl工具实现数据库的备份和恢复

1)备份数据库

 ETCDCTL_API=3 /opt/etcd/bin/etcdctl --endpoints="https://20.0.0.20:2379" --cacert=ca.pem --cert=server.pem --key=server-key.pem snapshot save /root/etcd_backup-20240730

ETCDCTL_API=3 /opt/etcd/bin/etcdctl --endpoints="https://20.0.0.20:2379" --cacert=ca.pem --cert=server.pem --key=server-key.pem snapshot status /root/etcd_backup-20240730 -wtable ##查看备份文件信息

2)恢复数据库

 ETCDCTL_API=3 /opt/etcd/bin/etcdctl --endpoints="https://20.0.0.20:2379" --cacert=ca.pem --cert=server.pem --key=server-key.pem snapshot restore /root/etcd_backup-20240730 -wtable

5、部署Master组件

在 master01 节点上操作(20.0.0.20)

#上传 master.zip 和 k8s-cert.sh 到 /opt/k8s 目录中,解压 master.zip 压缩包
cd /opt/k8s/
上传 master.zip 和 k8s-cert.sh 
mkdir k8s-cert
mv k8s-cert.sh k8s-cert
cd k8s-cert/
chmod +x k8s-cert.sh
vim k8s-cert.sh
修改其中ip信息
cat > apiserver-csr.json <<EOF
{
    "CN": "kubernetes",
    "hosts": [
      "10.0.0.1",
      "127.0.0.1",
      "20.0.0.20",   master01
      "20.0.0.30",    master02
      "20.0.0.100",    vip
      "20.0.0.10",    负载均衡nginx+keepalive01(master)
      "20.0.0.60",    负载均衡nginx+keepalive02(backup)
      "kubernetes",
      "kubernetes.default",
      "kubernetes.default.svc",
      "kubernetes.default.svc.cluster",
      "kubernetes.default.svc.cluster.local"
    ],
 
 
./k8s-cert.sh				#生成CA证书、相关组件的证书和私钥
ls *pem
 

#上传 kubernetes-server-linux-amd64.tar.gz 到 /opt/k8s/ 目录中,解压 kubernetes 压缩包
#下载地址:https://github.com/kubernetes/kubernetes/blob/release-1.20/CHANGELOG/CHANGELOG-1.20.md
#注:打开链接你会发现里面有很多包,下载一个server包就够了,包含了Master和Worker Node二进制文件。
 
cd /opt/k8s/
tar xf kubernetes-server-linux-amd64.tar.gz
 
cd /opt
mkdir kubernetes/
cd kubernetes/
mkdir bin cfg ssl logs

cd /opt/k8s/kubernetes/server/bin/
cp kube-apiserver kube-controller-manager kube-scheduler /opt/kubernetes/bin/
cd /opt/k8s/k8s-cert/
cp apiserver-key.pem apiserver.pem ca-key.pem ca.pem /opt/kubernetes/ssl/

#创建 bootstrap token 认证文件,apiserver 启动时会调用,然后就相当于在集群内创建了一个这个用户,接下来就可以用 RBAC 给他授权
 
head -c 16 /dev/urandom | od -An -t x | tr -d ' '   创建一个16位随机数
cd /opt/kubernetes/cfg
vim token.csv
4b368f9f9bd9286f1400232985ef9013,kubelet-bootstrap,10001,"system:kubelet-bootstrap"

cd /opt/k8s/
unzip master.zip
chmod +x *.sh

开启 apiserver 服务
./apiserver.sh 20.0.0.20 https://20.0.0.20:2379,https://20.0.0.40:2379,https://20.0.0.50:2379
systemctl status kube-apiserver.service

#启动 controller-manager 服务
 
cd /opt/k8s/kubernetes/server/bin
cp kubectl /usr/local/bin/
cd /opt/k8s/
vim controller-manager.sh 
#修改60行,设置为本机IP
KUBE_APISERVER="https://20.0.0.20:6443"
 
./controller-manager.sh

#启动 scheduler 服务
 
vim scheduler.sh
#48行修改为本机ip 
KUBE_APISERVER="https://20.0.0.20:6443"
 
./scheduler.sh
systemctl status kube-scheduler.service

#生成kubectl连接集群的kubeconfig文件
vim admin.sh
#4行修改ip为本机 
KUBE_APISERVER="https://20.0.0.20:6443"
 
./admin.sh
ls /root/.kube/
 
#通过kubectl工具查看当前集群组件状态
kubectl get cs 
#查看版本信息
kubectl version
 
#查看当前的 leader
kubectl -n kube-system get leases kube-scheduler
kubectl -n kube-system get leases kube-controller-manager

6、部署 Worker Node 组件

//node01 节点上操作
#创建kubernetes工作目录
mkdir -p /opt/kubernetes/{bin,cfg,ssl,logs}
cd /opt
mkdir k8s
cd k8s/
#上传 node.zip 到 /opt 目录中,解压 node.zip 压缩包,获得kubelet.sh、proxy.sh
chmod +x *.sh

//在 master01 节点上操作
#把 kubelet、kube-proxy 拷贝到 node01 节点
cd /opt/k8s/kubernetes/server/bin
scp kubelet kube-proxy [email protected]:/opt/kubernetes/bin/
 
cd /opt/k8s/
#上传kubeconfig.sh文件,生成kubelet初次加入集群引导kubeconfig文件和kube-proxy.kubeconfig文件
mkdir kubeconfig
mv kubeconfig.sh kubeconfig/
cd kubeconfig/
chmod +x kubeconfig.sh
./kubeconfig.sh 20.0.0.20 /opt/k8s/k8s-cert/
scp bootstrap.kubeconfig kube-proxy.kubeconfig [email protected]:/opt/kubernetes/cfg/
 
 
#RBAC授权,使用户 kubelet-bootstrap 能够有权限发起 CSR 请求证书
kubectl create clusterrolebinding kubelet-bootstrap --clusterrole=system:node-bootstrapper --user=kubelet-bootstrap
 

node01节点
cd /opt/k8s
vim kubelet.sh 
#11行修改
--hostname-override=node01 \\
 
./kubelet.sh 20.0.0.40
systemctl status kubelet.service 

//在 master01 节点上操作,通过 CSR 请求
#检查到 node01 节点的 kubelet 发起的 CSR 请求,Pending 表示等待集群给该节点签发证书
kubectl get csr
kubectl certificate approve node-csr-vqlP48wJL0yHN3P-h_itPg6CPKFZw8nPKf790UxGeY0
kubectl get csr
#查看节点,由于网络插件还没有部署,节点会没有准备就绪 NotReady
kubectl get node
 
#自动批准 CSR 请求
kubectl create clusterrolebinding node-autoapprove-bootstrap --clusterrole=system:certificates.k8s.io:certificatesigningrequests:nodeclient --user=kubelet-bootstrap 
 
kubectl create clusterrolebinding node-autoapprove-certificate-rotation --clusterrole=system:certificates.k8s.io:certificatesigningrequests:selfnodeclient --user=kubelet-bootstrap

部署node02节点
node01节点操作
cd /opt/
scp -r k8s/ kubernetes/ [email protected]:/opt
 
node02节点操作
cd /opt/
cd kubernetes/
rm -rf ssl/*
rm -rf logs/*
 
cd /opt/k8s/
vim kubelet.sh 
#11行修改
--hostname-override=node02 \\
 
./kubelet.sh 20.0.0.50
ls /opt/kubernetes/ssl/

master01节点查看

kubectl get csr
kubectl get nodes

启动kube-proxy
#node01、node02两个节点加载内核模块
cd /usr/lib/modules/5.4.278-1.el7.elrepo.x86_64/kernel/net/netfilter/ipvs
for i in $(ls | awk -F. '{print $1}'); do echo $i; modprobe $i; done
 
lsmod | grep ip_vs  #查看

node01节点
cd /opt/k8s/
vim proxy.sh
#10行 修改
--hostname-override=node01 \\
 
./proxy.sh 20.0.0.40
systemctl status kube-proxy.service
 
node02节点
cd /opt/k8s/
vim proxy.sh
#10行 修改
--hostname-override=node02 \\
 
./proxy.sh 20.0.0.50
systemctl status kube-proxy.service

master01节点查看验证

kubectl get cs
kubectl get nodes

;