更新告警监控文档

This commit is contained in:
Shao Huan Qing
2021-08-31 23:41:23 +08:00
parent 6d55bd6d06
commit bad54129ef
18 changed files with 156 additions and 78 deletions

View File

@ -0,0 +1,65 @@
---
# vssueId: 143
layout: LearningLayout
description: Kubernetes教程_本文介绍了 kube-prometheus 项目,用于监控 Kubernetes 集群。
meta:
- name: keywords
content: Kubernetes教程, Kubernetes监控
---
# 告警
Kuboard 监控套件已经支持如下配置:
* 配置 Email、WeChat 作为消息发送渠道;
* 配置告警联系人;
* 配置告警路由;
* 配置告警抑制规则;
* 配置告警消息模板;
* 配置告警规则;
## 前提
使用 Kuboard 监控套件的告警功能前,假设您已经完成了 `Kuboard 资源层监控套件` 的安装,请参考 [监控](./monitor.html)
## 配置告警
本章节将简述如何配置 Kuboard 资源监控套件以发送告警消息。
* 导航到 `资源监控套件` 的安装页面
* 切换到 `告警发送配置` 标签页,并填写告警发送的接口参数,如下图所示:
![告警发送接口参数](./alert/20210831222509.png)
* 切换到 `联系人组` 标签页,并填写接收告警信息的联系人邮件地址,如下图所示:
> 默认有三个联系人组建议Wie每个联系人组至少配置一个联系人邮件地址。
![联系人组](./alert/20210831223255.png)
* 切换到 `告警规则` --> `kubernetes-monitoring` --> `kubernetes-apps` 的标签页,在该标签页修改告警名称 `KubePodCrashLooping` 的持续时间为 `1m` (代表 1 分钟),如下图所示:
![告警规则-持续时间](./alert/20210831223656.png)
* 模拟错误
在任意名称空间创建一个 Deployment将其中的容器 image 设置为 `busybox`命令行参数为空。此时busybox 将在启动后就立刻退出,我们就可以模拟出应用程序不断崩溃重启的现象。
![模拟错误](./alert/20210831225513.png)
* 查看告警事件
切换到 `告警事件` 标签页,如下图所示:
> 大约 1 分钟后KubePodCrashLooping 的事件将从 `PENDING` 状态切换到 `FIRING` 状态,表明告警事件已发送到 AlertManager
![告警事件](./alert/20210831230118.png)
* 查看告警邮件
登录 Default 联系人组的联系人邮箱,可以查看该告警消息如下所示:
> AlertManager 在收到告警事件后,大约需要等 1 分钟左右(取决于告警路由中的配置)才发送邮件给告警联系人。
![告警邮件](./alert/20210831230600.png)
至此,我们已经完成了告警功能的最基本配置。

Binary file not shown.

After

Width:  |  Height:  |  Size: 163 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 171 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 200 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 145 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 237 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 99 KiB

View File

@ -1,10 +0,0 @@
---
# vssueId: 143
layout: LearningLayout
description: Kubernetes教程_本文介绍了 Kubernetes 的监控选择
meta:
- name: keywords
content: Kubernetes教程, Kubernetes监控
---
# 监控

View File

@ -1,65 +0,0 @@
---
# vssueId: 143
layout: LearningLayout
description: Kubernetes教程_本文介绍了 kube-prometheus 项目,用于监控 Kubernetes 集群。
meta:
- name: keywords
content: Kubernetes教程, Kubernetes监控
---
# kube-prometheus
本文向大家推荐一个基于 prometheus 的监控项目 [kube-prometheus](https://github.com/chinaboy007/kube-prometheus)
## 概述
本项目基于最新https://github.com/coreos/kube-prometheus开发
支持prometheus 2.15.2版本
支持kubeadm方式安装的k8s,二进制方式安装的未测试
## 主要功能
1.支持数据持久化
2.支持kube-controller监控
3.支持kube-scheduse监控
4.支持kube-etcd监控
5.支持NodePort访问
6.支持ingress访问
7.支持离线安装
8.支持重复安装
9.支持一键卸载
## 开始安装
git clone https://github.com/chinaboy007/kube-prometheus.git
cd kube-prometheus/manifests
sh install.sh
## 默认启用nfs-client数据持久化
后续将支持更多存储类型
## 一键卸载
cd kube-prometheus/manifests
sh uninstall.sh

Binary file not shown.

After

Width:  |  Height:  |  Size: 176 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 139 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 133 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 206 KiB

View File

@ -0,0 +1,54 @@
---
# vssueId: 143
layout: LearningLayout
description: Kubernetes教程_本文介绍了如何使用 Kuboard 的监控套件对 Kubernetes 进行监控
meta:
- name: keywords
content: Kubernetes教程, Kubernetes监控
---
# 监控
本文描述了如何使用 Kuboard 监控套件对 Kubernetes 进行监控。Kuboard 监控套件基于 [https://github.com/prometheus-operator/kube-prometheus](https://github.com/prometheus-operator/kube-prometheus) 构建,主要的工作是对其做 Kuboard 套件进行适配修改的内容包括:
* 以 Kuboard 套件形式安装 kube-prometheus
* 提供监控告警的配置界面。
## 前提
完成本文描述的过程,需要满足如下条件:
* Kubernetes 版本不低于 `v1.15`
* Kuboard 版本不低于 `v3.1.6.0-beta.1`
## 安装监控套件
在 Kuboard 界面中导航到 `集群导入` --> `套件` --> `套件仓库` --> `资源层监控套件`,然后在界面的引导下完成 `资源层监控套件` 的安装。如下图所示:
![套件仓库](./monitor.assets/20210831205047.png)
## 查看系统监控
资源监控套件在集群、名称空间、工作负载Deployment、StatefulSet、DaemonSet、容器组等不同层面上对 Kubernetes 进行全面的监控,监控的指标包括 CPU、内存、磁盘、网络等。
### 查看集群级别监控
在 Kuboard 界面中导航到 `集群管理` --> `资源层监控套件` 页面,在此页面可以找到集群级别不同类型资源的监控界面入口,如下图所示:
![集群级别监控](./monitor.assets/20210831211006.png)
### 查看名称空间级别监控
在 Kuboard 界面中导航到 `名称空间` --> `default或其他名称空间` --> `资源层监控套件` 页面,在此页面可以找到名称空间级别不同类型资源的监控界面入口,如下图所示:
![名称空间级别监控](./monitor.assets/20210831211724.png)
### 查看工作负载级别监控
在 Kuboard 界面中导航到 `名称空间` --> `default或其他名称空间` --> `工作负载` --> `工作负载详情` 页面,在此页面可以看到工作负载级别的监控和容器组级别的监控,如下图所示:
![工作负载级别监控](./monitor.assets/20210831212219.png)
## 下一步
配置 [告警发送](./alert.html)