hpa
This commit is contained in:
36
.vuepress/public/statics/learning/hpa/php-apache.yaml
Normal file
36
.vuepress/public/statics/learning/hpa/php-apache.yaml
Normal file
@ -0,0 +1,36 @@
|
||||
apiVersion: apps/v1
|
||||
kind: Deployment
|
||||
metadata:
|
||||
name: php-apache
|
||||
spec:
|
||||
selector:
|
||||
matchLabels:
|
||||
run: php-apache
|
||||
replicas: 1
|
||||
template:
|
||||
metadata:
|
||||
labels:
|
||||
run: php-apache
|
||||
spec:
|
||||
containers:
|
||||
- name: php-apache
|
||||
image: eipsample/hpa-example
|
||||
ports:
|
||||
- containerPort: 80
|
||||
resources:
|
||||
limits:
|
||||
cpu: 500m
|
||||
requests:
|
||||
cpu: 200m
|
||||
---
|
||||
apiVersion: v1
|
||||
kind: Service
|
||||
metadata:
|
||||
name: php-apache
|
||||
labels:
|
||||
run: php-apache
|
||||
spec:
|
||||
ports:
|
||||
- port: 80
|
||||
selector:
|
||||
run: php-apache
|
||||
@ -4,7 +4,7 @@ layout: LearningLayout
|
||||
description: Kubernetes_自动水平伸缩_Horizontal_Pod_Autoscaler
|
||||
meta:
|
||||
- name: keywords
|
||||
content: Kubernetes 教程,Kubernetes 授权,Kubernetes RBAC,Kubernetes权限
|
||||
content: Kubernetes 教程,Kubernetes 授权,Kubernetes Horizontal Pod Autoscaler,水平自动伸缩
|
||||
---
|
||||
|
||||
# 自动伸缩
|
||||
@ -40,7 +40,7 @@ HorizontalPodAutoscaler 通常从一系列 [聚合 API](/learning/k8s-advanced/e
|
||||
自 Kubernetes 1.11 开始,已经不推荐从 Heapster 中获取度量信息。
|
||||
:::
|
||||
|
||||
## 算法
|
||||
### 算法
|
||||
|
||||
简单地说,Horizontal Pod Autoscaler 控制器基于期望的度量值和当前度量值之间的比例运作:
|
||||
```
|
||||
@ -177,4 +177,86 @@ scaleDown:
|
||||
stabilizationWindowSeconds: 300
|
||||
```
|
||||
|
||||
当度量值表明目标控制器(Deployment、StatefulSet 等)应该被向下伸缩时,自动伸缩算法将会查找 `stabilizationWindowSeconds` 指定的时间窗口内已计算出来的目标伸缩副本数,并使用这些数值里最大的一个作为伸缩的目标副本数。
|
||||
当度量值表明目标控制器(Deployment、StatefulSet 等)应该被向下伸缩时,自动伸缩算法将会查找 `stabilizationWindowSeconds` 指定的时间窗口内已计算出来的目标伸缩副本数,并使用这些数值里最大的一个作为伸缩的目标副本数。在上面的例子中,`stabilizationWindowSeconds=300`,因此,过去 5 分钟内所有的已计算出来的目标伸缩副本数都会被纳入考量。
|
||||
|
||||
### 默认行为
|
||||
|
||||
如果要使用自定义伸缩,并不一定要指定所有的字段,只需要指定那些需要自定义的字段就可以了。您在 HorizontalPodAutoscaler 的 `.spec.behavior` 中自定义的字段将会和默认值合并后再使用。默认值如下所示:
|
||||
|
||||
``` yaml
|
||||
behavior:
|
||||
scaleDown:
|
||||
stabilizationWindowSeconds: 300
|
||||
policies:
|
||||
- type: Percent
|
||||
value: 100
|
||||
periodSeconds: 15
|
||||
scaleUp:
|
||||
stabilizationWindowSeconds: 0
|
||||
policies:
|
||||
- type: Percent
|
||||
value: 100
|
||||
periodSeconds: 15
|
||||
- type: Pods
|
||||
value: 4
|
||||
periodSeconds: 15
|
||||
selectPolicy: Max
|
||||
```
|
||||
|
||||
对于向下伸缩来说,默认的稳定窗口(Stabilization Window)是 300 秒(或者 `--horizontal-pod-autoscaler-downscale-stabilization` 参数指定的值)。当前,默认值中只包含一个向下伸缩的伸缩策略,即允许移除当前所有正在运行的副本,这意味着,HorizontalPodAutoscaler 可以直接将副本数缩减到期望的目标值。
|
||||
|
||||
对于向上伸缩来说,默认值中指定了稳定窗口(Stabilization Window)为 0,当观测到的度量值表明需要执行向上伸缩,则 HorizontalPodAutoscaler 将立刻执行伸缩动作。默认值中还包括两个向上伸缩的策略,一个允许每 15 秒中添加和当前副本数同等数量的副本数,另一个允许每 15 秒中添加 4 个副本数。
|
||||
|
||||
### 例子:调整向下伸缩的稳定窗口
|
||||
|
||||
下面的例子指定了 HPA 使用 1 分钟作为向下伸缩的稳定窗口:
|
||||
|
||||
``` yaml
|
||||
behavior:
|
||||
scaleDown:
|
||||
stabilizationWindowSeconds: 60
|
||||
```
|
||||
|
||||
### 例子:限制向下伸缩的速度
|
||||
|
||||
下面的例子限定了 HPA 每分钟只能移除当前副本数的 10% 的副本:
|
||||
|
||||
``` yaml
|
||||
behavior:
|
||||
scaleDown:
|
||||
policies:
|
||||
- type: Percent
|
||||
value: 10
|
||||
periodSeconds: 60
|
||||
```
|
||||
|
||||
下面的例子中,增加了另外一个 Policy,以使得 HorizontalPodAutoscaler 可以一次性移除最后 5 个 Pod (策略选择方式为 Maximum):
|
||||
|
||||
``` yaml
|
||||
behavior:
|
||||
scaleDown:
|
||||
policies:
|
||||
- type: Percent
|
||||
value: 10
|
||||
periodSeconds: 60
|
||||
- type: Pods
|
||||
value: 5
|
||||
periodSeconds: 60
|
||||
selectPolicy: Max
|
||||
```
|
||||
|
||||
### 例子:禁用向下伸缩
|
||||
|
||||
将 `selectPolicy` 字段设置为 `Disabled` 可以关闭该伸缩方向的自动伸缩。因此,如果要禁止向下伸缩,配置文件如下所示:
|
||||
|
||||
``` yaml
|
||||
behavior:
|
||||
scaleDown:
|
||||
selectPolicy: Disabled
|
||||
```
|
||||
|
||||
## 下一步
|
||||
|
||||
* 设计文档: [Horizontal Pod Autoscaling](https://git.k8s.io/community/contributors/design-proposals/autoscaling/horizontal-pod-autoscaler.md)
|
||||
* kubectl autoscale command : [kubectl autoscale](https://kubernetes.io/docs/reference/generated/kubectl/kubectl-commands/#autoscale)
|
||||
* 使用 [Horizontal Pod Autoscaler](./walkthrough.html) 的例子
|
||||
|
||||
261
learning/k8s-advanced/hpa/walkthrough.md
Normal file
261
learning/k8s-advanced/hpa/walkthrough.md
Normal file
@ -0,0 +1,261 @@
|
||||
---
|
||||
# vssueId: 66
|
||||
layout: LearningLayout
|
||||
description: Kubernetes_自动水平伸缩_Horizontal_Pod_Autoscaler_例子
|
||||
meta:
|
||||
- name: keywords
|
||||
content: Kubernetes 教程,Kubernetes 授权,Kubernetes Horizontal Pod Autoscaler,水平自动伸缩
|
||||
---
|
||||
|
||||
# 自动伸缩-例子
|
||||
|
||||
<AdSenseTitle/>
|
||||
|
||||
本文翻译自 Kubernetes 官网文档 [Horizontal Pod Autoscaler Walkthrough](https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale-walkthrough/)
|
||||
|
||||
HorizontalPodAutoscaler 可以根据观察到的 CPU 利用率(或者 beta 阶段的其他应用程序提供的度量值)对 ReplicationController、Deployment、ReplicaSet、StatefulSet 中的 Pod 副本数执指定自动伸缩操作。
|
||||
|
||||
本文阐述了一个使用 HorizontalPodAutoscaler 对 php-apache 服务进行自动伸缩的例子。更多与 HorizontalPodAutoscaler 相关的内容,请参考 [自动伸缩](./hpa.html)。
|
||||
|
||||
## 前提条件
|
||||
|
||||
如运行本文中的例子,必须满足以下条件:
|
||||
* Kubernetes 集群,版本不低于 v1.6;可以参考 [安装 Kubernetes 单节点](/install/install-k8s.html) 完成集群的安装;
|
||||
* Kubernetes 集群中已安装 [metrics-server](https://github.com/kubernetes-incubator/metrics-server/),用于提供资源度量的 API 接口,可以使用 `kubectl apply -f https://addons.kuboard.cn/metrics-server/0.3.7/metrics-server.yaml` 指令完成 metrics-server 的安装;
|
||||
* 如果想要使用自定义度量值,您的集群必须能够和这些度量值接口的服务进行通信;
|
||||
* 如果想要使用与 Kubernetes Object 无关的度量值(External metrics API),Kubernetes 集群版本必须不低于 v1.10,并且集群必须能够与提供外部度量值的 API 服务进行通信。
|
||||
|
||||
## 运行并发布 php-apache server
|
||||
|
||||
本文将要使用一个基于 php-apache 镜像自定义的 docker 镜像来演示 HorizontalPodAutoscaler。Dockerfile 如下所示:
|
||||
|
||||
``` yaml
|
||||
FROM php:5-apache
|
||||
COPY index.php /var/www/html/index.php
|
||||
RUN chmod a+rx index.php
|
||||
```
|
||||
|
||||
其中 `index.php` 文件的内容如下所示,该 php 页面执行了一些大量消耗 CPU 的计算:
|
||||
|
||||
``` php
|
||||
<?php
|
||||
$x = 0.0001;
|
||||
for ($i = 0; $i <= 1000000; $i++) {
|
||||
$x += sqrt($x);
|
||||
}
|
||||
echo "OK!";
|
||||
?>
|
||||
```
|
||||
|
||||
首先,我们使用下面的 YAML 文件运行该镜像,并且将其暴露为一个 Kubernetes Service:
|
||||
|
||||
<<< @/.vuepress/public/statics/learning/hpa/php-apache.yaml
|
||||
|
||||
执行指令下面的指令,可以直接在您的集群中应用该文件:
|
||||
|
||||
``` sh
|
||||
kubectl apply -f https://kuboard.cn/statics/learning/hpa/php-apache.yaml
|
||||
```
|
||||
|
||||
正常情况下,该指令的输出信息为:
|
||||
```
|
||||
deployment.apps/php-apache created
|
||||
service/php-apache created
|
||||
```
|
||||
|
||||
## 创建 Horizontal Pod Autoscaler
|
||||
|
||||
php-apache 服务启动以后,现在可以使用 [kubectl autoscale](https://kubernetes.io/docs/reference/generated/kubectl/kubectl-commands#autoscale) 指令来创建 Autoscaler。下面的指令创建了一个 HorizontalPodAutoscaler,该 Autoscaler 使得我们在前一个步骤中创建的 php-apache Deployment 在 1 到 10 个副本之间伸缩。大致上,HPA 在通过增加或减少 Deployment 的副本数,以使得所有 Pod 的平均 CPU 利用率维持在 50% 左右(每个 Pod 的 CPU Request 是 200 milli-cores,即平均 CPU 利用率应该是 100 milli-cores)。[点击此处](./hpa.html#算法) 了解更多自动伸缩的算法。
|
||||
|
||||
``` sh
|
||||
kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10
|
||||
```
|
||||
输出信息如下所示:
|
||||
```
|
||||
horizontalpodautoscaler.autoscaling/php-apache autoscaled
|
||||
```
|
||||
执行下面的指令,可以查看当前 HPA 的状态
|
||||
```sh
|
||||
kubectl get hpa
|
||||
```
|
||||
输出结果如下所示:
|
||||
```
|
||||
NAME REFERENCE TARGET MINPODS MAXPODS REPLICAS AGE
|
||||
php-apache Deployment/php-apache/scale 0% / 50% 1 10 1 18s
|
||||
```
|
||||
> * 请注意,当前 CPU 的消耗是 0%,因为我们尚未向 php-apache 服务发送任何请求;
|
||||
> * `TARGET` 这一列展示了 Deployment 中所有 Pod 的平均 CPU 利用率。
|
||||
|
||||
## 增加负荷
|
||||
|
||||
接下来,我们为 php-apache 服务增加一些负荷,并观察 HPA 如何应对增加的负荷。
|
||||
|
||||
* 请打开一个新的命令行终端,并执行以下命令,该命令启动了一个容器,并进入该容器的命令行终端:
|
||||
``` sh
|
||||
kubectl run -it --rm load-generator --image=busybox /bin/sh
|
||||
```
|
||||
在容器命令行中输入如下脚本,并回车:
|
||||
> 该脚本向 php-apache 服务无限循环地发送查询请求:
|
||||
``` sh
|
||||
while true; do wget -q -O- http://php-apache; done
|
||||
```
|
||||
* 大约 1 分钟左右,我们可以通过指令观察到较高的 CPU 利用率;
|
||||
``` sh
|
||||
kubectl get hpa
|
||||
```
|
||||
输出如下:
|
||||
```
|
||||
NAME REFERENCE TARGET MINPODS MAXPODS REPLICAS AGE
|
||||
php-apache Deployment/php-apache/scale 305% / 50% 1 10 1 3m
|
||||
```
|
||||
* 此时,CPU 利用率增加到了 CPU 请求的 305%。对应的,HPA 将 Deployment 的副本数调整到 7:
|
||||
``` sh
|
||||
kubectl get deployment php-apache
|
||||
```
|
||||
输出如下:
|
||||
```
|
||||
NAME READY UP-TO-DATE AVAILABLE AGE
|
||||
php-apache 7/7 7 7 19m
|
||||
```
|
||||
::: tip 备注
|
||||
* 大约需要好几分钟的时间,Deployment 的副本数才会稳定下来;
|
||||
* 由于我们并没有对施加在 php-apache 服务上的负荷做任何形式的控制,您在执行此实验时最终得到的副本数很可能与文档中的描述不一样。
|
||||
:::
|
||||
|
||||
## 撤销负荷
|
||||
|
||||
在 [增加负荷](#增加负荷) 章节中创建的 load-generator 终端界面中输入组合键 `<ctrl> + c` 可以终止模拟的用户请求。此后,php-apache 服务的 CPU 利用率将持续下降到 0。
|
||||
|
||||
执行以下指令可以观察到这个变化的过程:
|
||||
```sh
|
||||
watch "kubectl get hpa && echo && kubectl get deployment php-apache"
|
||||
```
|
||||
|
||||
一分钟左右,最终的输出结果如下:
|
||||
```
|
||||
NAME REFERENCE TARGET MINPODS MAXPODS REPLICAS AGE
|
||||
php-apache Deployment/php-apache/scale 0% / 50% 1 10 1 11m
|
||||
|
||||
NAME READY UP-TO-DATE AVAILABLE AGE
|
||||
php-apache 1/1 1 1 27m
|
||||
```
|
||||
|
||||
此时,CPU 利用率降低到 0,因此 HPA 将副本数自动地将副本数向下伸缩到 1。
|
||||
|
||||
::: tip 注意
|
||||
自动伸缩的过程可能需要持续几分钟才能完成。
|
||||
:::
|
||||
|
||||
## 基于多个度量值以及自定义度量值进行自动伸缩
|
||||
|
||||
使用 `autoscaling/v2beta2` 版本的 API,您可以引入额外的度量值用来对 Deployment `php-apache` 进行自动伸缩。
|
||||
|
||||
* 执行如下指令,获得前面创建的 HPA 的 `autoscaling/v1` 版本的 YAML:
|
||||
``` sh
|
||||
kubectl get hpa php-apache -o yaml
|
||||
```
|
||||
内容如下所示:
|
||||
``` yaml
|
||||
apiVersion: autoscaling/v1
|
||||
kind: HorizontalPodAutoscaler
|
||||
metadata:
|
||||
name: php-apache
|
||||
namespace: default
|
||||
resourceVersion: "406527"
|
||||
selfLink: /apis/autoscaling/v1/namespaces/default/horizontalpodautoscalers/php-apache
|
||||
uid: 522839bb-1ff2-4364-b5cf-41e58837647e
|
||||
spec:
|
||||
maxReplicas: 10
|
||||
minReplicas: 1
|
||||
scaleTargetRef:
|
||||
apiVersion: apps/v1
|
||||
kind: Deployment
|
||||
name: php-apache
|
||||
targetCPUUtilizationPercentage: 50
|
||||
status:
|
||||
currentCPUUtilizationPercentage: 0
|
||||
currentReplicas: 7
|
||||
desiredReplicas: 7
|
||||
lastScaleTime: "2020-07-29T08:39:34Z"
|
||||
```
|
||||
|
||||
* 执行如下指令获得同一个 HPA 的 `autoscaling/v2beta2` 版本的 YAML:
|
||||
|
||||
``` sh
|
||||
kubectl get hpa.v2beta2.autoscaling php-apache -o yaml
|
||||
```
|
||||
内容如下所示:
|
||||
``` yaml
|
||||
apiVersion: autoscaling/v2beta2
|
||||
kind: HorizontalPodAutoscaler
|
||||
metadata:
|
||||
name: php-apache
|
||||
namespace: default
|
||||
resourceVersion: "407497"
|
||||
selfLink: /apis/autoscaling/v2beta2/namespaces/default/horizontalpodautoscalers/php-apache
|
||||
uid: 522839bb-1ff2-4364-b5cf-41e58837647e
|
||||
spec:
|
||||
maxReplicas: 10
|
||||
metrics:
|
||||
- resource:
|
||||
name: cpu
|
||||
target:
|
||||
averageUtilization: 50
|
||||
type: Utilization
|
||||
type: Resource
|
||||
minReplicas: 1
|
||||
scaleTargetRef:
|
||||
apiVersion: apps/v1
|
||||
kind: Deployment
|
||||
name: php-apache
|
||||
status:
|
||||
conditions:
|
||||
- lastTransitionTime: "2020-07-29T08:36:00Z"
|
||||
message: recommended size matches current size
|
||||
reason: ReadyForNewScale
|
||||
status: "True"
|
||||
type: AbleToScale
|
||||
- lastTransitionTime: "2020-07-29T08:36:31Z"
|
||||
message: the HPA was able to successfully calculate a replica count from cpu resource
|
||||
utilization (percentage of request)
|
||||
reason: ValidMetricFound
|
||||
status: "True"
|
||||
type: ScalingActive
|
||||
- lastTransitionTime: "2020-07-29T08:48:26Z"
|
||||
message: the desired replica count is less than the minimum replica count
|
||||
reason: TooFewReplicas
|
||||
status: "True"
|
||||
type: ScalingLimited
|
||||
currentMetrics:
|
||||
- resource:
|
||||
current:
|
||||
averageUtilization: 0
|
||||
averageValue: 1m
|
||||
name: cpu
|
||||
type: Resource
|
||||
currentReplicas: 1
|
||||
desiredReplicas: 1
|
||||
lastScaleTime: "2020-07-29T08:48:26Z"
|
||||
```
|
||||
|
||||
比对两个版本的差异,您可以注意到 `targetCPUUtilizationPercentage` 字段被替换为一个叫做 `metrics` 的数组。CPU 利用率是一个 ***resource metric***,代表了容器组的某个资源使用情况。此时,您还可以指定 CPU 之外的其他资源度量,默认情况下,除了 CPU 意外,还有另外一个可用的资源度量就是内存了。只要您的集群上安装了 `metrics.k8s.io` 接口(通常由 `metrics-server` 提供),`cpu` 和 `memory` 这两个类型的资源度量就可以使用。
|
||||
|
||||
您还可以用具体数值的方式指定资源度量,而不是资源的利用率。此时,您需要:
|
||||
* 将 `.spec.metrics[*].resource.target.type` 的值从 `Utilization` 改为 `AverageValue`;
|
||||
* 删除 `.spec.metrics[*].resource.target.averageUtilization` 字段;
|
||||
* 增加 `.spec.metrics[*].resource.target.averageValue` 并指定对应的度量值。
|
||||
|
||||
除了 ***resource metrics*** 资源度量以外,还存在两种类型的度量(pod metrics / object metrics),这两种类型的度量都被认为是 ***custom metrics*** 自定义度量。自定义度量需要对集群进行比较复杂的监控设置,并且,在不同的集群上,其名字可能不一样。
|
||||
|
||||
***Pod metrics*** 是用来描述 Pod 的度量值,HPA 控制器对所有 Pod metrics 求平均值后再与目标值进行对比,以此决定最终的伸缩目标副本数。***Pod metrics*** 的工作方式与资源度量非常相似,不同的是,***pod metrics*** 对应的 `.spec.metrics[*].pods.target` 字段只支持 `AverageValue` 这个取值。
|
||||
|
||||
例如:
|
||||
``` yaml
|
||||
type: Pods
|
||||
pods:
|
||||
metric:
|
||||
name: packets-per-second
|
||||
target:
|
||||
type: AverageValue
|
||||
averageValue: 1k
|
||||
```
|
||||
Reference in New Issue
Block a user