Files
kuboard-press/learning/k8s-advanced/observe/alert.md
Shao Huan Qing 6b42bc7353 tada
2021-11-30 20:45:11 +08:00

67 lines
2.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
# vssueId: 143
layout: LearningLayout
description: Kubernetes教程_本文介绍了 kube-prometheus 项目,用于监控 Kubernetes 集群。
meta:
- name: keywords
content: Kubernetes教程, Kubernetes监控
---
# 告警(邮件)
Kuboard 监控套件已经支持如下配置:
* 配置 Email、WeChat 作为消息发送渠道;
* 配置告警联系人;
* 配置告警路由;
* 配置告警抑制规则;
* 配置告警消息模板;
* 配置告警规则;
## 前提
使用 Kuboard 监控套件的告警功能前,假设您已经完成了 `Kuboard 资源层监控套件` 的安装,请参考 [监控](./monitor.html)
## 配置告警
本章节将简述如何配置 Kuboard 资源监控套件以发送告警消息。
* 导航到 `资源监控套件` 的安装页面
* 切换到 `告警发送配置` 标签页,并填写告警发送的接口参数,如下图所示:
![告警发送接口参数](./alert/20210831222509.png)
* 切换到 `联系人组` 标签页,并填写接收告警信息的联系人邮件地址,如下图所示:
> 默认有三个联系人组,建议每个联系人组至少配置一个联系人邮件地址。
![联系人组](./alert/20210831223255.png)
* 点击 `保存` 按钮,保存您做的配置修改。
* 切换到 `告警规则` --> `kubernetes-monitoring` --> `kubernetes-apps` 的标签页,在该标签页修改告警名称 `KubePodCrashLooping` 的持续时间为 `1m` (代表 1 分钟),如下图所示:
![告警规则-持续时间](./alert/20210831223656.png)
* 模拟错误
在任意名称空间创建一个 Deployment将其中的容器 image 设置为 `busybox`命令行参数为空。此时busybox 将在启动后就立刻退出,我们就可以模拟出应用程序不断崩溃重启的现象。
![模拟错误](./alert/20210831225513.png)
* 查看告警事件
切换到 `告警事件` 标签页,如下图所示:
> 大约 1 分钟后KubePodCrashLooping 的事件将从 `PENDING` 状态切换到 `FIRING` 状态,表明告警事件已发送到 AlertManager
![告警事件](./alert/20210831230118.png)
* 查看告警邮件
登录 Default 联系人组的联系人邮箱,可以查看该告警消息如下所示:
> AlertManager 在收到告警事件后,大约需要等 1 分钟左右(取决于告警路由中的配置)才发送邮件给告警联系人。
![告警邮件](./alert/20210831230600.png)
::tada:: ::tada:: 至此,我们已经完成了告警功能的最基本配置。