--- vssueId: 37 layout: LearningLayout description: 本文描述了如何在 Kubernetes 中水平伸缩 Deployment (scaling up / scaling down) meta: - name: keywords content: Kubernetes教程,K8S负载,Deployment,Kubernetes部署,伸缩 --- # 伸缩 Deployment [返回 Deployment](./#deployment-概述) 伸缩(Scaling) Deployment,是指改变 Deployment 中 Pod 的副本数量,以应对实际业务流量的变化。 > 本文提供了两种途径对 Deployment 执行伸缩操作: > * 使用 kubectl 伸缩 Deployment > * 使用 Kuboard 伸缩 Deployment

执行伸缩

* 执行命令 `kubectl scale deployment.v1.apps/nginx-deployment --replicas=10`,可以伸缩 Deployment,输出结果如下所示: ``` deployment.apps/nginx-deployment scaled ``` 如果您的集群启用了自动伸缩([horizontal Pod autoscaling](https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale-walkthrough/)),执行以下命令,您就可以基于 CPU 的利用率在一个最大和最小的区间自动伸缩您的 Deployment: ``` sh kubectl autoscale deployment.v1.apps/nginx-deployment --min=10 --max=15 --cpu-percent=80 ``` 输出结果如下所示: ``` deployment.apps/nginx-deployment scaled ```

按比例伸缩

滚动更新(RollingUpdate) Deployment 过程中同一时间点运行应用程序的多个版本。如果一个 Deployment 正在执行滚动更新(RollingUpdate)的过程中(也可能暂停了滚动更新),您或者自动伸缩器(autoscaler)对该 Deployment 执行伸缩操作,此时,Deployment Controller 会按比例将新建的 Pod 分配到当前活动的 ReplicaSet(有 Pod 的 ReplicaSet) 中,以避免可能的风险。这种情况叫做按比例伸缩(Proportional Scaling) 例如,假设您已经运行了一个 10 副本数的 Deployment,其 maxSurge=3, maxUnavailable=2。 * 执行命令 `kubectl get deployment`,确认 Deployment 中的 10 个副本都在运行。输出结果如下所示: ``` NAME DESIRED CURRENT UP-TO-DATE AVAILABLE AGE nginx-deployment 10 10 10 10 50s ``` * 执行命令 `kubectl set image deployment.v1.apps/nginx-deployment nginx=nginx:sometag`,将容器镜像更新到一个不存在的版本,输出结果如下所示: ``` deployment.apps/nginx-deployment image updated ``` * 执行命令 `kubectl get rs`,检查滚动更新的状态,输出结果如下: ``` NAME DESIRED CURRENT READY AGE nginx-deployment-1989198191 5 5 0 9s nginx-deployment-618515232 8 8 8 1m ``` 更新容器镜像之后,Deployment Controller 将开始进行滚动更新(RollingUpdate),并创建一个新的 ReplicaSet `nginx-deployment-1989198191`,但是由于 maxUnavailable 的限定,该滚动更新将被阻止。 * 执行命令 `kubectl scale deployment.v1.apps/nginx-deployment --replicas=15`,将 Deployment 的 replicas 调整到 15。此时,Deployment Controller 需要决定如何分配新增的 5 个 Pod 副本。根据“按比例伸缩”的原则: * 更大比例的新 Pod 数被分配到副本数最多的 ReplicaSet * 更小比例的新 Pod 数被分配到副本数最少的 ReplicaSet * 如果还有剩余的新 Pod 数未分配,则将被增加到副本数最多的 ReplicaSet * 副本数为 0 的 ReplicaSet,scale up 之后,副本数仍然为 0 * 在本例中,3 个新副本被添加到旧的 ReplicaSet,2个新副本被添加到新的 ReplicaSet。如果新的副本都达到就绪状态,滚动更新过程最终会将所有的副本数添加放到新 ReplicaSet。执行命令 `kubectl get deployment` 查看 Deployment 的情况,输出结果如下所示: ``` NAME DESIRED CURRENT UP-TO-DATE AVAILABLE AGE nginx-deployment 15 18 7 8 7m ``` 执行命令 `kubectl get rs` 查看 ReplicaSet 的情况,输出结果如下所示: ``` NAME DESIRED CURRENT READY AGE nginx-deployment-1989198191 7 7 0 7m nginx-deployment-618515232 11 11 11 7m ```
## 执行伸缩 * 在 Deployment 详情页面,点击下图中 `向左箭头` 或 `向右箭头` 即可完成对 Deployment 的伸缩操作; ![Kubernetes-教程-伸缩](./scale.assets/image-20210404184116094.png) * `kubectl autoscale` 指令可以执行对 Deployment 的自动伸缩,目前 Kuboard 界面还不支持此操作。 请参考 [horizontal Pod autoscaling](https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale-walkthrough/) ## 按比例伸缩 滚动更新(RollingUpdate) Deployment 过程中同一时间点运行应用程序的多个版本。如果一个 Deployment 正在执行滚动更新(RollingUpdate)的过程中(也可能暂停了滚动更新),您或者自动伸缩器(autoscaler)对该 Deployment 执行伸缩操作,此时,Deployment Controller 会按比例将新建的 Pod 分配到当前活动的 ReplicaSet(有 Pod 的 ReplicaSet) 中,以避免可能的风险。这种情况叫做按比例伸缩(Proportional Scaling) 例如,假设您已经运行了一个 10 副本数的 Deployment,其 maxSurge=3, maxUnavailable=2。 * 点击 Deployment 详情页面中的 ***部署策略*** 下的 ***编辑部署策略*** 按钮,如下图所示: 将 *最大超出副本数* 修改为 `3`; 将 *最大不可用副本数* 修改为 `2`; 修改后保存。 ![Kubernetes-教程](./scale.assets/image-20210404184525753.png) * 确认当前 10 个副本正在运行,如下图所示: ![Kubernetes-教程-按比例伸缩](./scale.assets/image-20210404184759213.png) * 点击 ***调整镜像标签*** 按钮,将容器镜像更新到一个不存在的标签,例如 `sometag`,如下图所示: ![Kubernetes-教程-按比例伸缩](./scale.assets/image-20210404184712639.png) * 此时,Deployment 将新建一个副本集,并且其期望的副本数为 `5`,原来的副本集的期望副本数被调整为 `8`,如下图所示: 由于新副本集中的 Pod 不能获取到镜像,因此滚动更新将卡在这个位置。 ![Kubernetes-教程-按比例伸缩](./scale.assets/image-20210404184920104.png) * 点击 ***伸缩*** 按钮,将期望副本数调整为 `15`,如下图所示: ![Kubernetes-教程-按比例伸缩](./scale.assets/image-20210404185426429.png) * 此时,由于比原来期望的副本数增加了 5,新增副本数将增加到旧副本集,最终结果如下图所示:(不同 Kubernetes 版本中,行为并不完全一致,比如,某些版本中,会将新增副本数按比例增加到新、旧副本集中,而截图中使用 Kubernetes v1.18,将所有新增副本数都增加到了旧副本集) ![Kubernetes-教程-按比例伸缩](./scale.assets/image-20210404185157096.png)
[返回 Deployment](./#deployment-概述)