--- vssueId: 16 description: Kubernete安装文档_使用kubeadm安装高可用的Kubernetes_v1.16.2集群_可用于生产环境 meta: - name: keywords content: Kubernetes集群,Kubernetes高可用,Kubernetes生产环境 # storyBook: # title: '使用 kubeadm 安装 kubernetes v1.16.2(高可用)' # initial: FullPage # pages: # - name: overview # title: 配置要求 # - name: step1 # title: 检查环境 # - name: step2 # title: 安装 docker/kubelet # - name: step3 # title: 初始化 apiserver 集群 # - name: step4 # title: 初始化 worker 节点 # - name: step5 # title: 安装 Ingress Controller # - name: step6 # title: 总结 --- # 安装Kubernetes高可用 ::: tip 推荐初学者按照 [安装Kubernetes 单Master节点](install-k8s.html) 文档进行 Kubernetes 集群搭建 ::: ## 介绍 kubernetes 安装有多种选择,本文档描述的集群安装具备如下特点: * Kubernetes 1.16.2 * calico 3.9 * nginx-ingress 1.5.3 * Docker 18.09.7 * 三个 master 组成主节点集群,通过内网 loader balancer 实现负载均衡;至少需要三个 master 节点才可组成高可用集群,否则会出现 ***脑裂*** 现象 * 多个 worker 组成工作节点集群,通过外网 loader balancer 实现负载均衡 [腾讯云11.11爆款1核2G云服务器首购88元,免费领9888元代金券,百款云产品一折起](https://cloud.tencent.com/act/cps/redirect?redirect=1050&cps_key=2ee6baa049659f4713ddc55a51314372&from=console) [阿里云双十一,All in Cloud,低至一折](https://www.aliyun.com/1111/2019/home?userCode=obezo3pg) 安装后的拓扑图如下: 下载拓扑图源文件 使用Axure RP 9.0可打开该文件 ![Kubernetes安装:拓扑结构](/images/topology/kubernetes.png) * **在线答疑** 也可以扫描二维码加群

Kubernetes教程:QQ群在线答疑

## 检查 centos / hostname ``` sh # 在 master 节点和 worker 节点都要执行 cat /etc/redhat-release # 此处 hostname 的输出将会是该机器在 Kubernetes 集群中的节点名字 hostname ``` **操作系统兼容性** | CentOS 版本 | 本文档是否兼容 | 备注 | | ----------- | --------------------------------------- | ----------------------------------- | | 7.7 | 😄 | 已验证 | | 7.6 | 😄 | 已验证 | | 7.5 | 😞 | 已证实会出现 kubelet 无法启动的问题 | | 7.4 | 😞 | 同上 | | 7.3 | 😞 | 同上 | | 7.2 | 😞 | 同上 | ::: tip 修改 hostname 如果您需要修改 hostname,可执行如下指令: ``` sh # 修改 hostname hostnamectl set-hostname your-new-host-name # 查看修改结果 hostnamectl status # 设置 hostname 解析 echo "127.0.0.1 $(hostname)" >> /etc/hosts ``` ::: ## 检查网络 在所有节点执行命令 ``` {2,11,13} [root@demo-master-a-1 ~]$ ip route show default via 172.21.0.1 dev eth0 169.254.0.0/16 dev eth0 scope link metric 1002 172.21.0.0/20 dev eth0 proto kernel scope link src 172.21.0.12 [root@demo-master-a-1 ~]$ ip address 1: lo: mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000 link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 inet 127.0.0.1/8 scope host lo valid_lft forever preferred_lft forever 2: eth0: mtu 1500 qdisc pfifo_fast state UP group default qlen 1000 link/ether 00:16:3e:12:a4:1b brd ff:ff:ff:ff:ff:ff inet 172.17.216.80/20 brd 172.17.223.255 scope global dynamic eth0 valid_lft 305741654sec preferred_lft 305741654sec ``` ::: tip kubelet使用的IP地址 * `ip route show` 命令中,可以知道机器的默认网卡,通常是 `eth0`,如 ***default via 172.21.0.23 dev eth0*** * `ip address` 命令中,可显示默认网卡的 IP 地址,Kubernetes 将使用此 IP 地址与集群内的其他节点通信,如 `172.17.216.80` * 所有节点上 Kubernetes 所使用的 IP 地址必须可以互通(无需 NAT 映射、无安全组或防火墙隔离) ::: ## 安装 docker / kubelet 使用 root 身份在所有节点执行如下代码,以安装软件: - docker - nfs-utils - kubectl / kubeadm / kubelet ``` sh # 在 master 节点和 worker 节点都要执行 curl -sSL https://kuboard.cn/install-script/v1.16.2/install_kubelet.sh | sh ``` 手动执行以下代码,效果与快速安装完全相同。 <<< @/.vuepress/public/install-script/v1.16.2/install_kubelet.sh ::: warning 如果此时执行 `service status kubelet` 命令,将得到 kubelet 启动失败的错误提示,请忽略此错误,因为必须完成后续步骤中 kubeadm init 的操作,kubelet 才能正常启动 ::: ## 初始化API Server ### 创建 ApiServer 的 Load Balancer(私网) 监听端口:6443 / TCP 后端资源组:包含 demo-master-a-1, demo-master-a-2, demo-master-a-3 后端端口:6443 开启 按源地址保持会话 假设完成创建以后,Load Balancer的 ip 地址为 x.x.x.x > 根据每个人实际的情况不同,实现 LoadBalancer 的方式不一样,本文不详细阐述如何搭建 LoadBalancer,请读者自行解决,可以考虑的选择有: > * nginx > * haproxy > * keepalived > * 云供应商提供的负载均衡产品 ### 初始化第一个master节点 ::: tip * 以 root 身份在 demo-master-a-1 机器上执行 * 初始化 master 节点时,如果因为中间某些步骤的配置出错,想要重新初始化 master 节点,请先执行 `kubeadm reset` 操作 ::: ::: danger 关于初始化时用到的环境变量 * **APISERVER_NAME** 不能是 master 的 hostname * **APISERVER_NAME** 必须全为小写字母、数字、小数点,不能包含减号 * **POD_SUBNET** 所使用的网段不能与 ***master节点/worker节点*** 所在的网段重叠。该字段的取值为一个 CIDR 值,如果您对 CIDR 这个概念还不熟悉,请不要修改这个字段的取值 10.100.0.1/16 ::: 在第一个 master 节点 demo-master-a-1 上执行 ``` sh # 只在第一个 master 节点执行 # 替换 apiserver.demo 为 您想要的 dnsName export APISERVER_NAME=apiserver.demo # Kubernetes 容器组所在的网段,该网段安装完成后,由 kubernetes 创建,事先并不存在于您的物理网络中 export POD_SUBNET=10.100.0.1/16 echo "127.0.0.1 ${APISERVER_NAME}" >> /etc/hosts curl -sSL https://kuboard.cn/install-script/v1.16.2/init_master.sh | sh ``` ``` sh # 只在第一个 master 节点执行 # 替换 apiserver.demo 为 您想要的 dnsName export APISERVER_NAME=apiserver.demo # Kubernetes 容器组所在的网段,该网段安装完成后,由 kubernetes 创建,事先并不存在于您的物理网络中 export POD_SUBNET=10.100.0.1/16 echo "127.0.0.1 ${APISERVER_NAME}" >> /etc/hosts ``` <<< @/.vuepress/public/install-script/v1.16.2/init_master.sh ***执行结果*** 执行结果中: * 第15、16、17行,用于初始化第二、三个 master 节点 * 第25、26行,用于初始化 worker 节点 ``` sh {15,16,17,25,26} Your Kubernetes control-plane has initialized successfully! To start using your cluster, you need to run the following as a regular user: mkdir -p $HOME/.kube sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config sudo chown $(id -u):$(id -g) $HOME/.kube/config You should now deploy a pod network to the cluster. Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at: https://kubernetes.io/docs/concepts/cluster-administration/addons/ You can now join any number of the control-plane node running the following command on each as root: kubeadm join apiserver.k8s:6443 --token 4z3r2v.2p43g28ons3b475v \ --discovery-token-ca-cert-hash sha256:959569cbaaf0cf3fad744f8bd8b798ea9e11eb1e568c15825355879cf4cdc5d6 \ --control-plane --certificate-key 41a741533a038a936759aff43b5680f0e8c41375614a873ea49fde8944614dd6 Please note that the certificate-key gives access to cluster sensitive data, keep it secret! As a safeguard, uploaded-certs will be deleted in two hours; If necessary, you can use "kubeadm init phase upload-certs --upload-certs" to reload certs afterward. Then you can join any number of worker nodes by running the following on each as root: kubeadm join apiserver.k8s:6443 --token 4z3r2v.2p43g28ons3b475v \ --discovery-token-ca-cert-hash sha256:959569cbaaf0cf3fad744f8bd8b798ea9e11eb1e568c15825355879cf4cdc5d6 ``` **检查 master 初始化结果** ``` sh # 只在第一个 master 节点执行 # 执行如下命令,等待 3-10 分钟,直到所有的容器组处于 Running 状态 watch kubectl get pod -n kube-system -o wide # 查看 master 节点初始化结果 kubectl get nodes ``` ::: danger 请等到所有容器组(大约9个)全部处于 Running 状态,才进行下一步 ::: ### 初始化第二、三个master节点 **获得 master 节点的 join 命令** > 可以和第一个Master节点一起初始化第二、三个Master节点,也可以从单Master节点调整过来,只需要 > * 增加Master的 LoadBalancer > * 将所有节点的 /etc/hosts 文件中 apiserver.demo 解析为 LoadBalancer 的地址 > * 添加第二、三个Master节点 > * 初始化 master 节点的 token 有效时间为 2 小时 初始化第一个 master 节点时的输出内容中,第15、16、17行就是用来初始化第二、三个 master 节点的命令,如下所示:此时请不要执行该命令 ``` sh kubeadm join apiserver.k8s:6443 --token 4z3r2v.2p43g28ons3b475v \ --discovery-token-ca-cert-hash sha256:959569cbaaf0cf3fad744f8bd8b798ea9e11eb1e568c15825355879cf4cdc5d6 \ --control-plane --certificate-key 41a741533a038a936759aff43b5680f0e8c41375614a873ea49fde8944614dd6 ``` **获得 certificate key** 在 demo-master-a-1 上执行 ```sh # 只在 第一个 master 节点 demo-master-a-1 上执行 kubeadm init phase upload-certs --upload-certs ``` 输出结果如下: ``` sh {6} [root@demo-master-a-1 ~]# kubeadm init phase upload-certs --upload-certs W0902 09:05:28.355623 1046 version.go:98] could not fetch a Kubernetes version from the internet: unable to get URL "https://dl.k8s.io/release/stable-1.txt": Get https://dl.k8s.io/release/stable-1.txt: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers) W0902 09:05:28.355718 1046 version.go:99] falling back to the local client version: v1.16.2 [upload-certs] Storing the certificates in Secret "kubeadm-certs" in the "kube-system" Namespace [upload-certs] Using certificate key: 70eb87e62f052d2d5de759969d5b42f372d0ad798f98df38f7fe73efdf63a13c ``` **获得 join 命令** 在 demo-master-a-1 上执行 ``` sh # 只在 第一个 master 节点 demo-master-a-1 上执行 kubeadm token create --print-join-command ``` 输出结果如下: ``` sh {2} [root@demo-master-a-1 ~]# kubeadm token create --print-join-command kubeadm join apiserver.demo:6443 --token bl80xo.hfewon9l5jlpmjft --discovery-token-ca-cert-hash sha256:b4d2bed371fe4603b83e7504051dcfcdebcbdcacd8be27884223c4ccc13059a4 ``` 则,第二、三个 master 节点的 join 命令如下: * 命令行中,蓝色部分来自于前面获得的 join 命令,红色部分来自于前面获得的 certificate key
kubeadm join apiserver.demo:6443 --token ejwx62.vqwog6il5p83uk7y \
--discovery-token-ca-cert-hash sha256:6f7a8e40a810323672de5eee6f4d19aa2dbdb38411845a1bf5dd63485c43d303
\
--control-plane --certificate-key 70eb87e62f052d2d5de759969d5b42f372d0ad798f98df38f7fe73efdf63a13c
**初始化第二、三个 master 节点** 在 demo-master-b-1 和 demo-master-b-2 机器上执行 ``` sh # 只在第二、三个 master 节点 demo-master-b-1 和 demo-master-b-2 执行 # 替换 x.x.x.x 为 ApiServer LoadBalancer 的 IP 地址 export APISERVER_IP=x.x.x.x # 替换 apiserver.demo 为 前面已经使用的 dnsName export APISERVER_NAME=apiserver.demo echo "${APISERVER_IP} ${APISERVER_NAME}" >> /etc/hosts # 使用前面步骤中获得的第二、三个 master 节点的 join 命令 kubeadm join apiserver.demo:6443 --token ejwx62.vqwog6il5p83uk7y \ --discovery-token-ca-cert-hash sha256:6f7a8e40a810323672de5eee6f4d19aa2dbdb38411845a1bf5dd63485c43d303 \ --control-plane --certificate-key 70eb87e62f052d2d5de759969d5b42f372d0ad798f98df38f7fe73efdf63a13c ``` ::: tip 常见问题 如果一直停留在 pre-flight 状态,请在第二、三个节点上执行命令检查: ``` sh curl -ik https://apiserver.demo:6443/version ``` 输出结果应该如下所示 ``` HTTP/1.1 200 OK Cache-Control: no-cache, private Content-Type: application/json Date: Wed, 30 Oct 2019 08:13:39 GMT Content-Length: 263 { "major": "1", "minor": "16", "gitVersion": "v1.16.2", "gitCommit": "2bd9643cee5b3b3a5ecbd3af49d09018f0773c77", "gitTreeState": "clean", "buildDate": "2019-09-18T14:27:17Z", "goVersion": "go1.12.9", "compiler": "gc", "platform": "linux/amd64" } ``` 否则,请您检查一下您的 Loadbalancer 是否设置正确 ::: **检查 master 初始化结果** ``` sh # 只在第一个 master 节点 demo-master-a-1 执行 # 查看 master 节点初始化结果 kubectl get nodes ``` ## 初始化 worker节点 ### 获得 join命令参数 初始化第一个 master 节点时的输出内容中,第25、26行就是用来初始化 worker 节点的命令,如下所示:此时请不要执行该命令 ``` sh kubeadm join apiserver.k8s:6443 --token 4z3r2v.2p43g28ons3b475v \ --discovery-token-ca-cert-hash sha256:959569cbaaf0cf3fad744f8bd8b798ea9e11eb1e568c15825355879cf4cdc5d6 ``` **在第一个 master 节点 demo-master-a-1 节点执行** ```bash # 只在第一个 master 节点 demo-master-a-1 上执行 kubeadm token create --print-join-command ``` 可获取kubeadm join 命令及参数,如下所示 ```bash kubeadm join apiserver.demo:6443 --token mpfjma.4vjjg8flqihor4vt --discovery-token-ca-cert-hash sha256:6f7a8e40a810323672de5eee6f4d19aa2dbdb38411845a1bf5dd63485c43d303 ``` ::: tip 有效时间 该 token 的有效时间为 2 个小时,2小时内,您可以使用此 token 初始化任意数量的 worker 节点。 ::: ### 初始化worker **针对所有的 worker 节点执行** ```sh # 只在 worker 节点执行 # 替换 x.x.x.x 为 ApiServer LoadBalancer 的 IP 地址 export MASTER_IP=x.x.x.x # 替换 apiserver.demo 为初始化 master 节点时所使用的 APISERVER_NAME export APISERVER_NAME=apiserver.demo echo "${MASTER_IP} ${APISERVER_NAME}" >> /etc/hosts # 替换为前面 kubeadm token create --print-join-command 的输出结果 kubeadm join apiserver.demo:6443 --token mpfjma.4vjjg8flqihor4vt --discovery-token-ca-cert-hash sha256:6f7a8e40a810323672de5eee6f4d19aa2dbdb38411845a1bf5dd63485c43d303 ``` ### 检查 worker 初始化结果 在第一个master节点 demo-master-a-1 上执行 ```sh # 只在第一个 master 节点 demo-master-a-1 上执行 kubectl get nodes ``` ## 移除 worker 节点 ::: warning 正常情况下,您无需移除 worker 节点 ::: 在准备移除的 worker 节点上执行 ```sh kubeadm reset ``` 在第一个 master 节点 demo-master-a-1 上执行 ```sh kubectl delete node demo-worker-x-x ``` > * 将 demo-worker-x-x 替换为要移除的 worker 节点的名字 > * worker 节点的名字可以通过在第一个 master 节点 demo-master-a-1 上执行 kubectl get nodes 命令获得 ## 安装 Ingress Controller kubernetes支持多种Ingress Controllers (traefic / Kong / Istio / Nginx 等),本文推荐使用 https://github.com/nginxinc/kubernetes-ingress **在 master 节点上执行** ``` sh # 只在第一个 master 节点 demo-master-a-1 上执行 kubectl apply -f https://kuboard.cn/install-script/v1.16.2/nginx-ingress.yaml ``` <<< @/.vuepress/public/install-script/v1.16.2/nginx-ingress.yaml ::: warning 如果您打算将 Kubernetes 用于生产环境,请参考此文档 [Installing Ingress Controller](https://github.com/nginxinc/kubernetes-ingress/blob/v1.5.3/docs/installation.md),完善 Ingress 的配置 ::: ### 在 IaaS 层完成如下配置(**公网Load Balancer**) 创建负载均衡 Load Balancer: * 监听器 1:80 / TCP, SOURCE_ADDRESS 会话保持 * 服务器资源池 1: demo-worker-x-x 的所有节点的 80端口 * 监听器 2:443 / TCP, SOURCE_ADDRESS 会话保持 * 服务器资源池 2: demo-worker-x-x 的所有节点的443端口 假设刚创建的负载均衡 Load Balancer 的 IP 地址为: z.z.z.z ### 配置域名解析 将域名 *.demo.yourdomain.com 解析到地址负载均衡服务器 的 IP 地址 z.z.z.z ### 验证配置 在浏览器访问 a.demo.yourdomain.com,将得到 404 NotFound 错误页面 ## 下一步 :tada: :tada: :tada: 您已经完成了 Kubernetes 集群的安装,下一步请: [点击此处,给个 GitHub Star](https://github.com/eip-work/kuboard-press) 点击此处,给个GitHub Star 支持一下吧,这么多人都 star 了呢,怎么能少得了您呢? [安装 Kuboard - 微服务管理界面](/install/v3/install.html) [获取 Kubernetes 免费教程](/learning/)