Files
kuboard-press/learning/k8s-intermediate/workload/pod-lifecycle.md
huanqing.shao 1b69a42777 vssue
2019-09-22 21:56:32 +08:00

8.7 KiB
Raw Blame History

vssueId, layout, description
vssueId layout description
30 LearningLayout Kubernetes教程_本文描述了Kubernetes中Pod容器组的生命周期

容器组_生命周期

参考文档: Kubernetes 官网文档 Pod Lifecycle

TOC

Pod phase

Pod phase 代表其所处生命周期的阶段。Pod phase 并不是用来代表其容器的状态,也不是一个严格的状态机。

phase 的可能取值有:

Phase 描述
Pending Kubernetes 已经创建并确认该 Pod。此时可能有两种情况
  • Pod 还未完成调度(例如没有合适的节点)
  • 正在从 docker registry 下载镜像
  • Running 该 Pod 已经被绑定到一个节点,并且该 Pod 所有的容器都已经成功创建。其中至少有一个容器正在运行,或者正在启动/重启
    Succeeded Pod 中的所有容器都已经成功终止,并且不会再被重启
    Failed Pod 中的所有容器都已经终止,至少一个容器终止于失败状态:容器的进程退出码不是 0或者被系统 kill
    Unknown 因为某些未知原因,不能确定 Pod 的状态,通常的原因是 master 与 Pod 所在节点之间的通信故障

    Pod conditions

    每一个 Pod 都有一个数组描述其是否达到某些指定的条件。Pod condition 数组在 Kuboard 中的显示如下图所示:

    Kubernetes教程:容器组的生命周期

    该数组的每一行可能有六个字段:

    字段名 描述
    type type 是最重要的字段,可能的取值有:
  • PodScheduled Pod 已被调度到一个节点
  • Ready Pod 已经可以接受服务请求,应该被添加到所匹配 Service 的负载均衡的资源池
  • InitializedPod 中所有初始化容器已成功执行
  • Unschedulable不能调度该 Pod缺少资源或者其他限制
  • ContainersReadyPod 中所有容器都已就绪
  • status 能的取值有:
  • True
  • False
  • Unknown
  • reason Condition 发生变化的原因,使用一个符合驼峰规则的英文单词描述
    message Condition 发生变化的原因的详细描述human-readable
    lastTransitionTime Condition 发生变化的时间戳
    lastProbeTime 上一次针对 Pod 做健康检查/就绪检查的时间戳

    容器的检查

    Probe 是指 kubelet 周期性地检查容器的状况。有三种类型的 Probe

    • ExecAction 在容器内执行一个指定的命令。如果该命令的退出状态码为 0则成功
    • TCPSocketAction 探测容器的指定 TCP 端口,如果该端口处于 open 状态,则成功
    • HTTPGetAction 探测容器指定端口/路径上的 HTTP Get 请求,如果 HTTP 响应状态码在 200 到 400不包含400之间则成功

    Probe 有三种可能的结果:

    • Success 容器通过检测
    • Failure 容器未通过检测
    • Unknown 检测执行失败,此时 kubelet 不做任何处理

    Kubelet 可以在两种情况下对运行中的容器执行 Probe

    • 就绪检查 readinessProbe 确定容器是否已经就绪并接收服务请求。如果就绪检查失败kubernetes 将该 Pod 的 IP 地址从所有匹配的 Service 的资源池中移除掉。
    • 健康检查 livenessProbe 确定容器是否正在运行。如果健康检查失败kubelete 将结束该容器,并根据 restart policy重启策略确定是否重启该容器。

    何时使用 健康检查/就绪检查?

    • 如果容器中的进程在碰到问题时可以自己 crash您并不需要执行健康检查kubelet 可以自动的根据 Pod 的 restart policy重启策略执行对应的动作

    • 如果您希望在容器的进程无响应后,将容器 kill 掉并重启,则指定一个健康检查 liveness probe并同时指定 restart policy重启策略为 Always 或者 OnFailure

    • 如果您想在探测 Pod 确实就绪之后才向其分发服务请求,请指定一个就绪检查 readiness probe。此时就绪检查的内容可能和健康检查相同。就绪检查适合如下几类容器

      • 初始化时需要加载大量的数据、配置文件
      • 启动时需要执行迁移任务
      • 其他

    ::: tip 如果您想在删除 Pod 前停止向其分发服务请求,您无需为此而指定就绪检查。在删除 Pod 时kubelete 自动将 Pod 置于 unready 状态,并等待其中的容器停止。 :::

    Kuboard 中配置健康检查/就绪检查

    Kuboard 可以在工作负载编辑器中配置健康检查/就绪检查,界面如下所示:

    Kubernetes教程:在Kuboard中配置容器的健康检查/就绪检查

    容器的状态

    一旦 Pod 被调度到节点上kubelet 便开始使用容器引擎(通常是 docker创建容器。容器有三种可能的状态Waiting / Running / Terminated

    • Waiting 容器的初始状态。处于 Waiting 状态的容器,仍然有对应的操作在执行,例如:拉取镜像、应用 Secrets等。
    • Running 容器处于正常运行的状态。容器进入 Running 状态之后,如果指定了 postStart hook该钩子将被执行。
    • Terminated 容器处于结束运行的状态。容器进入 Terminated 状态之前,如果指定了 preStop hook该钩子将被执行。

    在 Kuboard 的工作负载查看界面中可查看到容器的状态如下图所示:

    Kubernetes教程:在Kuboard中查看容器的状态

    重启策略

    定义 Pod 或工作负载时,可以指定 restartPolicy可选的值有

    • Always (默认值)
    • OnFailure
    • Never

    restartPolicy 将作用于 Pod 中的所有容器。kubelete 将在五分钟内按照递延的时间间隔10s, 20s, 40s ......)尝试重启已退出的容器,并在十分钟后再次启动这个循环,直到容器成功启动,或者 Pod 被删除。

    ::: tip 控制器 Deployment/StatefulSet/DaemonSet 中,只支持 Always 这一个选项,不支持 OnFailure 和 Never 选项。 :::

    容器组的存活期

    通常,如果没有人或者控制器删除 PodPod 不会自己消失。只有一种例外,那就是 Pod 处于 Scucceeded 或 Failed 的 phase并超过了垃圾回收的时长在 kubernetes master 中通过 terminated-pod-gc-threshold 参数指定kubelet 自动将其删除。