更新告警监控文档
65
learning/k8s-advanced/observe/alert.md
Normal file
@ -0,0 +1,65 @@
|
||||
---
|
||||
# vssueId: 143
|
||||
layout: LearningLayout
|
||||
description: Kubernetes教程_本文介绍了 kube-prometheus 项目,用于监控 Kubernetes 集群。
|
||||
meta:
|
||||
- name: keywords
|
||||
content: Kubernetes教程, Kubernetes监控
|
||||
---
|
||||
|
||||
# 告警
|
||||
|
||||
Kuboard 监控套件已经支持如下配置:
|
||||
* 配置 Email、WeChat 作为消息发送渠道;
|
||||
* 配置告警联系人;
|
||||
* 配置告警路由;
|
||||
* 配置告警抑制规则;
|
||||
* 配置告警消息模板;
|
||||
* 配置告警规则;
|
||||
|
||||
## 前提
|
||||
|
||||
使用 Kuboard 监控套件的告警功能前,假设您已经完成了 `Kuboard 资源层监控套件` 的安装,请参考 [监控](./monitor.html)
|
||||
|
||||
## 配置告警
|
||||
|
||||
本章节将简述如何配置 Kuboard 资源监控套件以发送告警消息。
|
||||
|
||||
* 导航到 `资源监控套件` 的安装页面
|
||||
* 切换到 `告警发送配置` 标签页,并填写告警发送的接口参数,如下图所示:
|
||||
|
||||

|
||||
|
||||
* 切换到 `联系人组` 标签页,并填写接收告警信息的联系人邮件地址,如下图所示:
|
||||
|
||||
> 默认有三个联系人组,建议Wie每个联系人组至少配置一个联系人邮件地址。
|
||||
|
||||

|
||||
|
||||
* 切换到 `告警规则` --> `kubernetes-monitoring` --> `kubernetes-apps` 的标签页,在该标签页修改告警名称 `KubePodCrashLooping` 的持续时间为 `1m` (代表 1 分钟),如下图所示:
|
||||
|
||||

|
||||
|
||||
* 模拟错误
|
||||
|
||||
在任意名称空间创建一个 Deployment,将其中的容器 image 设置为 `busybox`,命令行参数为空。此时,busybox 将在启动后就立刻退出,我们就可以模拟出应用程序不断崩溃重启的现象。
|
||||
|
||||

|
||||
|
||||
* 查看告警事件
|
||||
|
||||
切换到 `告警事件` 标签页,如下图所示:
|
||||
|
||||
> 大约 1 分钟后,KubePodCrashLooping 的事件将从 `PENDING` 状态切换到 `FIRING` 状态,表明告警事件已发送到 AlertManager
|
||||
|
||||

|
||||
|
||||
* 查看告警邮件
|
||||
|
||||
登录 Default 联系人组的联系人邮箱,可以查看该告警消息如下所示:
|
||||
|
||||
> AlertManager 在收到告警事件后,大约需要等 1 分钟左右(取决于告警路由中的配置)才发送邮件给告警联系人。
|
||||
|
||||

|
||||
|
||||
至此,我们已经完成了告警功能的最基本配置。
|
||||
BIN
learning/k8s-advanced/observe/alert/20210831222509.png
Normal file
|
After Width: | Height: | Size: 163 KiB |
BIN
learning/k8s-advanced/observe/alert/20210831223255.png
Normal file
|
After Width: | Height: | Size: 171 KiB |
BIN
learning/k8s-advanced/observe/alert/20210831223656.png
Normal file
|
After Width: | Height: | Size: 200 KiB |
BIN
learning/k8s-advanced/observe/alert/20210831225513.png
Normal file
|
After Width: | Height: | Size: 145 KiB |
BIN
learning/k8s-advanced/observe/alert/20210831230118.png
Normal file
|
After Width: | Height: | Size: 237 KiB |
BIN
learning/k8s-advanced/observe/alert/20210831230600.png
Normal file
|
After Width: | Height: | Size: 99 KiB |
@ -1,10 +0,0 @@
|
||||
---
|
||||
# vssueId: 143
|
||||
layout: LearningLayout
|
||||
description: Kubernetes教程_本文介绍了 Kubernetes 的监控选择
|
||||
meta:
|
||||
- name: keywords
|
||||
content: Kubernetes教程, Kubernetes监控
|
||||
---
|
||||
|
||||
# 监控
|
||||
@ -1,65 +0,0 @@
|
||||
---
|
||||
# vssueId: 143
|
||||
layout: LearningLayout
|
||||
description: Kubernetes教程_本文介绍了 kube-prometheus 项目,用于监控 Kubernetes 集群。
|
||||
meta:
|
||||
- name: keywords
|
||||
content: Kubernetes教程, Kubernetes监控
|
||||
---
|
||||
|
||||
# kube-prometheus
|
||||
|
||||
本文向大家推荐一个基于 prometheus 的监控项目 [kube-prometheus](https://github.com/chinaboy007/kube-prometheus)
|
||||
|
||||
## 概述
|
||||
|
||||
本项目基于最新https://github.com/coreos/kube-prometheus开发
|
||||
|
||||
支持prometheus 2.15.2版本
|
||||
|
||||
支持kubeadm方式安装的k8s,二进制方式安装的未测试
|
||||
|
||||
|
||||
## 主要功能
|
||||
|
||||
1.支持数据持久化
|
||||
|
||||
2.支持kube-controller监控
|
||||
|
||||
3.支持kube-scheduse监控
|
||||
|
||||
4.支持kube-etcd监控
|
||||
|
||||
5.支持NodePort访问
|
||||
|
||||
6.支持ingress访问
|
||||
|
||||
7.支持离线安装
|
||||
|
||||
8.支持重复安装
|
||||
|
||||
9.支持一键卸载
|
||||
|
||||
|
||||
|
||||
|
||||
## 开始安装
|
||||
|
||||
git clone https://github.com/chinaboy007/kube-prometheus.git
|
||||
|
||||
cd kube-prometheus/manifests
|
||||
|
||||
sh install.sh
|
||||
|
||||
|
||||
|
||||
## 默认启用nfs-client数据持久化
|
||||
|
||||
后续将支持更多存储类型
|
||||
|
||||
|
||||
## 一键卸载
|
||||
|
||||
cd kube-prometheus/manifests
|
||||
|
||||
sh uninstall.sh
|
||||
BIN
learning/k8s-advanced/observe/monitor.assets/20210831205047.png
Normal file
|
After Width: | Height: | Size: 176 KiB |
BIN
learning/k8s-advanced/observe/monitor.assets/20210831211006.png
Normal file
|
After Width: | Height: | Size: 139 KiB |
BIN
learning/k8s-advanced/observe/monitor.assets/20210831211724.png
Normal file
|
After Width: | Height: | Size: 133 KiB |
BIN
learning/k8s-advanced/observe/monitor.assets/20210831212219.png
Normal file
|
After Width: | Height: | Size: 206 KiB |
54
learning/k8s-advanced/observe/monitor.md
Normal file
@ -0,0 +1,54 @@
|
||||
---
|
||||
# vssueId: 143
|
||||
layout: LearningLayout
|
||||
description: Kubernetes教程_本文介绍了如何使用 Kuboard 的监控套件对 Kubernetes 进行监控
|
||||
meta:
|
||||
- name: keywords
|
||||
content: Kubernetes教程, Kubernetes监控
|
||||
---
|
||||
|
||||
# 监控
|
||||
|
||||
本文描述了如何使用 Kuboard 监控套件对 Kubernetes 进行监控。Kuboard 监控套件基于 [https://github.com/prometheus-operator/kube-prometheus](https://github.com/prometheus-operator/kube-prometheus) 构建,主要的工作是对其做 Kuboard 套件进行适配修改的内容包括:
|
||||
* 以 Kuboard 套件形式安装 kube-prometheus;
|
||||
* 提供监控告警的配置界面。
|
||||
|
||||
## 前提
|
||||
|
||||
完成本文描述的过程,需要满足如下条件:
|
||||
* Kubernetes 版本不低于 `v1.15`;
|
||||
* Kuboard 版本不低于 `v3.1.6.0-beta.1`。
|
||||
|
||||
## 安装监控套件
|
||||
|
||||
在 Kuboard 界面中导航到 `集群导入` --> `套件` --> `套件仓库` --> `资源层监控套件`,然后在界面的引导下完成 `资源层监控套件` 的安装。如下图所示:
|
||||
|
||||

|
||||
|
||||
|
||||
## 查看系统监控
|
||||
|
||||
资源监控套件在集群、名称空间、工作负载(Deployment、StatefulSet、DaemonSet)、容器组等不同层面上对 Kubernetes 进行全面的监控,监控的指标包括 CPU、内存、磁盘、网络等。
|
||||
|
||||
### 查看集群级别监控
|
||||
|
||||
在 Kuboard 界面中导航到 `集群管理` --> `资源层监控套件` 页面,在此页面可以找到集群级别不同类型资源的监控界面入口,如下图所示:
|
||||
|
||||

|
||||
|
||||
### 查看名称空间级别监控
|
||||
|
||||
在 Kuboard 界面中导航到 `名称空间` --> `default(或其他名称空间)` --> `资源层监控套件` 页面,在此页面可以找到名称空间级别不同类型资源的监控界面入口,如下图所示:
|
||||
|
||||

|
||||
|
||||
|
||||
### 查看工作负载级别监控
|
||||
|
||||
在 Kuboard 界面中导航到 `名称空间` --> `default(或其他名称空间)` --> `工作负载` --> `工作负载详情` 页面,在此页面可以看到工作负载级别的监控和容器组级别的监控,如下图所示:
|
||||
|
||||

|
||||
|
||||
## 下一步
|
||||
|
||||
配置 [告警发送](./alert.html)
|
||||