更新告警监控文档
@@ -478,17 +478,18 @@ let sidebar = {
|
|||||||
]
|
]
|
||||||
},
|
},
|
||||||
{
|
{
|
||||||
title: '监控',
|
title: '监控及告警',
|
||||||
collapsable: true,
|
collapsable: true,
|
||||||
children: [
|
children: [
|
||||||
'k8s-advanced/observe/kube-prometheus.html',
|
'k8s-advanced/observe/monitor.html',
|
||||||
|
'k8s-advanced/observe/alert.html',
|
||||||
]
|
]
|
||||||
},
|
},
|
||||||
{
|
{
|
||||||
title: '扩展Kubernetes',
|
title: '扩展Kubernetes',
|
||||||
collapsable: true,
|
collapsable: true,
|
||||||
children: [
|
children: [
|
||||||
'k8s-advanced/extend/aggregation',
|
'k8s-advanced/extend/aggregation.html',
|
||||||
]
|
]
|
||||||
},
|
},
|
||||||
]
|
]
|
||||||
|
|||||||
@@ -109,3 +109,7 @@ label {
|
|||||||
.side-nav-item a {
|
.side-nav-item a {
|
||||||
padding: 2px;
|
padding: 2px;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
p>code {
|
||||||
|
font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, Oxygen, Ubuntu, Cantarell, "Fira Sans", "Droid Sans", "Helvetica Neue", sans-serif;
|
||||||
|
}
|
||||||
@@ -158,6 +158,8 @@ docker push ${this.privateRegistry}/questdb:6.0.4
|
|||||||
|
|
||||||
执行指令 `watch kubectl get pods -n kuboard`,等待 kuboard 名称空间中所有的 Pod 就绪,如下所示,
|
执行指令 `watch kubectl get pods -n kuboard`,等待 kuboard 名称空间中所有的 Pod 就绪,如下所示,
|
||||||
|
|
||||||
|
> 如果结果中没有出现 `kuboard-etcd-xxxxx` 的容器,请查看本章节稍后面的内容中关于 `托管的 K8S` 的描述。
|
||||||
|
|
||||||
```sh
|
```sh
|
||||||
[root@node1 ~]# kubectl get pods -n kuboard
|
[root@node1 ~]# kubectl get pods -n kuboard
|
||||||
NAME READY STATUS RESTARTS AGE
|
NAME READY STATUS RESTARTS AGE
|
||||||
|
|||||||
65
learning/k8s-advanced/observe/alert.md
Normal file
@@ -0,0 +1,65 @@
|
|||||||
|
---
|
||||||
|
# vssueId: 143
|
||||||
|
layout: LearningLayout
|
||||||
|
description: Kubernetes教程_本文介绍了 kube-prometheus 项目,用于监控 Kubernetes 集群。
|
||||||
|
meta:
|
||||||
|
- name: keywords
|
||||||
|
content: Kubernetes教程, Kubernetes监控
|
||||||
|
---
|
||||||
|
|
||||||
|
# 告警
|
||||||
|
|
||||||
|
Kuboard 监控套件已经支持如下配置:
|
||||||
|
* 配置 Email、WeChat 作为消息发送渠道;
|
||||||
|
* 配置告警联系人;
|
||||||
|
* 配置告警路由;
|
||||||
|
* 配置告警抑制规则;
|
||||||
|
* 配置告警消息模板;
|
||||||
|
* 配置告警规则;
|
||||||
|
|
||||||
|
## 前提
|
||||||
|
|
||||||
|
使用 Kuboard 监控套件的告警功能前,假设您已经完成了 `Kuboard 资源层监控套件` 的安装,请参考 [监控](./monitor.html)
|
||||||
|
|
||||||
|
## 配置告警
|
||||||
|
|
||||||
|
本章节将简述如何配置 Kuboard 资源监控套件以发送告警消息。
|
||||||
|
|
||||||
|
* 导航到 `资源监控套件` 的安装页面
|
||||||
|
* 切换到 `告警发送配置` 标签页,并填写告警发送的接口参数,如下图所示:
|
||||||
|
|
||||||
|

|
||||||
|
|
||||||
|
* 切换到 `联系人组` 标签页,并填写接收告警信息的联系人邮件地址,如下图所示:
|
||||||
|
|
||||||
|
> 默认有三个联系人组,建议Wie每个联系人组至少配置一个联系人邮件地址。
|
||||||
|
|
||||||
|

|
||||||
|
|
||||||
|
* 切换到 `告警规则` --> `kubernetes-monitoring` --> `kubernetes-apps` 的标签页,在该标签页修改告警名称 `KubePodCrashLooping` 的持续时间为 `1m` (代表 1 分钟),如下图所示:
|
||||||
|
|
||||||
|

|
||||||
|
|
||||||
|
* 模拟错误
|
||||||
|
|
||||||
|
在任意名称空间创建一个 Deployment,将其中的容器 image 设置为 `busybox`,命令行参数为空。此时,busybox 将在启动后就立刻退出,我们就可以模拟出应用程序不断崩溃重启的现象。
|
||||||
|
|
||||||
|

|
||||||
|
|
||||||
|
* 查看告警事件
|
||||||
|
|
||||||
|
切换到 `告警事件` 标签页,如下图所示:
|
||||||
|
|
||||||
|
> 大约 1 分钟后,KubePodCrashLooping 的事件将从 `PENDING` 状态切换到 `FIRING` 状态,表明告警事件已发送到 AlertManager
|
||||||
|
|
||||||
|

|
||||||
|
|
||||||
|
* 查看告警邮件
|
||||||
|
|
||||||
|
登录 Default 联系人组的联系人邮箱,可以查看该告警消息如下所示:
|
||||||
|
|
||||||
|
> AlertManager 在收到告警事件后,大约需要等 1 分钟左右(取决于告警路由中的配置)才发送邮件给告警联系人。
|
||||||
|
|
||||||
|

|
||||||
|
|
||||||
|
至此,我们已经完成了告警功能的最基本配置。
|
||||||
BIN
learning/k8s-advanced/observe/alert/20210831222509.png
Normal file
|
After Width: | Height: | Size: 163 KiB |
BIN
learning/k8s-advanced/observe/alert/20210831223255.png
Normal file
|
After Width: | Height: | Size: 171 KiB |
BIN
learning/k8s-advanced/observe/alert/20210831223656.png
Normal file
|
After Width: | Height: | Size: 200 KiB |
BIN
learning/k8s-advanced/observe/alert/20210831225513.png
Normal file
|
After Width: | Height: | Size: 145 KiB |
BIN
learning/k8s-advanced/observe/alert/20210831230118.png
Normal file
|
After Width: | Height: | Size: 237 KiB |
BIN
learning/k8s-advanced/observe/alert/20210831230600.png
Normal file
|
After Width: | Height: | Size: 99 KiB |
@@ -1,10 +0,0 @@
|
|||||||
---
|
|
||||||
# vssueId: 143
|
|
||||||
layout: LearningLayout
|
|
||||||
description: Kubernetes教程_本文介绍了 Kubernetes 的监控选择
|
|
||||||
meta:
|
|
||||||
- name: keywords
|
|
||||||
content: Kubernetes教程, Kubernetes监控
|
|
||||||
---
|
|
||||||
|
|
||||||
# 监控
|
|
||||||
@@ -1,65 +0,0 @@
|
|||||||
---
|
|
||||||
# vssueId: 143
|
|
||||||
layout: LearningLayout
|
|
||||||
description: Kubernetes教程_本文介绍了 kube-prometheus 项目,用于监控 Kubernetes 集群。
|
|
||||||
meta:
|
|
||||||
- name: keywords
|
|
||||||
content: Kubernetes教程, Kubernetes监控
|
|
||||||
---
|
|
||||||
|
|
||||||
# kube-prometheus
|
|
||||||
|
|
||||||
本文向大家推荐一个基于 prometheus 的监控项目 [kube-prometheus](https://github.com/chinaboy007/kube-prometheus)
|
|
||||||
|
|
||||||
## 概述
|
|
||||||
|
|
||||||
本项目基于最新https://github.com/coreos/kube-prometheus开发
|
|
||||||
|
|
||||||
支持prometheus 2.15.2版本
|
|
||||||
|
|
||||||
支持kubeadm方式安装的k8s,二进制方式安装的未测试
|
|
||||||
|
|
||||||
|
|
||||||
## 主要功能
|
|
||||||
|
|
||||||
1.支持数据持久化
|
|
||||||
|
|
||||||
2.支持kube-controller监控
|
|
||||||
|
|
||||||
3.支持kube-scheduse监控
|
|
||||||
|
|
||||||
4.支持kube-etcd监控
|
|
||||||
|
|
||||||
5.支持NodePort访问
|
|
||||||
|
|
||||||
6.支持ingress访问
|
|
||||||
|
|
||||||
7.支持离线安装
|
|
||||||
|
|
||||||
8.支持重复安装
|
|
||||||
|
|
||||||
9.支持一键卸载
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
## 开始安装
|
|
||||||
|
|
||||||
git clone https://github.com/chinaboy007/kube-prometheus.git
|
|
||||||
|
|
||||||
cd kube-prometheus/manifests
|
|
||||||
|
|
||||||
sh install.sh
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
## 默认启用nfs-client数据持久化
|
|
||||||
|
|
||||||
后续将支持更多存储类型
|
|
||||||
|
|
||||||
|
|
||||||
## 一键卸载
|
|
||||||
|
|
||||||
cd kube-prometheus/manifests
|
|
||||||
|
|
||||||
sh uninstall.sh
|
|
||||||
BIN
learning/k8s-advanced/observe/monitor.assets/20210831205047.png
Normal file
|
After Width: | Height: | Size: 176 KiB |
BIN
learning/k8s-advanced/observe/monitor.assets/20210831211006.png
Normal file
|
After Width: | Height: | Size: 139 KiB |
BIN
learning/k8s-advanced/observe/monitor.assets/20210831211724.png
Normal file
|
After Width: | Height: | Size: 133 KiB |
BIN
learning/k8s-advanced/observe/monitor.assets/20210831212219.png
Normal file
|
After Width: | Height: | Size: 206 KiB |
54
learning/k8s-advanced/observe/monitor.md
Normal file
@@ -0,0 +1,54 @@
|
|||||||
|
---
|
||||||
|
# vssueId: 143
|
||||||
|
layout: LearningLayout
|
||||||
|
description: Kubernetes教程_本文介绍了如何使用 Kuboard 的监控套件对 Kubernetes 进行监控
|
||||||
|
meta:
|
||||||
|
- name: keywords
|
||||||
|
content: Kubernetes教程, Kubernetes监控
|
||||||
|
---
|
||||||
|
|
||||||
|
# 监控
|
||||||
|
|
||||||
|
本文描述了如何使用 Kuboard 监控套件对 Kubernetes 进行监控。Kuboard 监控套件基于 [https://github.com/prometheus-operator/kube-prometheus](https://github.com/prometheus-operator/kube-prometheus) 构建,主要的工作是对其做 Kuboard 套件进行适配修改的内容包括:
|
||||||
|
* 以 Kuboard 套件形式安装 kube-prometheus;
|
||||||
|
* 提供监控告警的配置界面。
|
||||||
|
|
||||||
|
## 前提
|
||||||
|
|
||||||
|
完成本文描述的过程,需要满足如下条件:
|
||||||
|
* Kubernetes 版本不低于 `v1.15`;
|
||||||
|
* Kuboard 版本不低于 `v3.1.6.0-beta.1`。
|
||||||
|
|
||||||
|
## 安装监控套件
|
||||||
|
|
||||||
|
在 Kuboard 界面中导航到 `集群导入` --> `套件` --> `套件仓库` --> `资源层监控套件`,然后在界面的引导下完成 `资源层监控套件` 的安装。如下图所示:
|
||||||
|
|
||||||
|

|
||||||
|
|
||||||
|
|
||||||
|
## 查看系统监控
|
||||||
|
|
||||||
|
资源监控套件在集群、名称空间、工作负载(Deployment、StatefulSet、DaemonSet)、容器组等不同层面上对 Kubernetes 进行全面的监控,监控的指标包括 CPU、内存、磁盘、网络等。
|
||||||
|
|
||||||
|
### 查看集群级别监控
|
||||||
|
|
||||||
|
在 Kuboard 界面中导航到 `集群管理` --> `资源层监控套件` 页面,在此页面可以找到集群级别不同类型资源的监控界面入口,如下图所示:
|
||||||
|
|
||||||
|

|
||||||
|
|
||||||
|
### 查看名称空间级别监控
|
||||||
|
|
||||||
|
在 Kuboard 界面中导航到 `名称空间` --> `default(或其他名称空间)` --> `资源层监控套件` 页面,在此页面可以找到名称空间级别不同类型资源的监控界面入口,如下图所示:
|
||||||
|
|
||||||
|

|
||||||
|
|
||||||
|
|
||||||
|
### 查看工作负载级别监控
|
||||||
|
|
||||||
|
在 Kuboard 界面中导航到 `名称空间` --> `default(或其他名称空间)` --> `工作负载` --> `工作负载详情` 页面,在此页面可以看到工作负载级别的监控和容器组级别的监控,如下图所示:
|
||||||
|
|
||||||
|

|
||||||
|
|
||||||
|
## 下一步
|
||||||
|
|
||||||
|
配置 [告警发送](./alert.html)
|
||||||
@@ -59,10 +59,37 @@ https://kubernetes.io/docs/tasks/inject-data-application/_print/#capabilities-of
|
|||||||
* 设置列表页表格最大高度【待处理】
|
* 设置列表页表格最大高度【待处理】
|
||||||
|
|
||||||
|
|
||||||
|
cortex 解决 promethues 的多租户问题
|
||||||
|
loki 默认支持多租户
|
||||||
|
|
||||||
|
* 激活 **隐藏帮助链接** 选项后 `帮助` 文字仍然显示的问题【待处理】
|
||||||
|
* 容器组列表页分页显示【待处理】
|
||||||
|
* 常见问题提示如何配置告警消息【待处理】
|
||||||
|
|
||||||
-->
|
-->
|
||||||
|
|
||||||
|
## v3.1.6.0-beta.1
|
||||||
|
|
||||||
|
**发布日期**
|
||||||
|
|
||||||
|
2021年8月31日
|
||||||
|
|
||||||
|
**新特性**
|
||||||
|
|
||||||
|
* 可以配置监控套件发送告警信息
|
||||||
|
|
||||||
|
**问题修订**
|
||||||
|
|
||||||
|
* 部分情况下 tooltip 不能正常显示内容的问题
|
||||||
|
* 缺少 cookie 时访问 kuboard-proxy,导致程序退出的问题
|
||||||
|
* 菜单向左收缩时,部分菜单项的文字未隐藏的问题
|
||||||
|
|
||||||
## v3.1.5.0
|
## v3.1.5.0
|
||||||
|
|
||||||
|
**发布日期**
|
||||||
|
|
||||||
|
2021年8月15日
|
||||||
|
|
||||||
**优化**
|
**优化**
|
||||||
|
|
||||||
* 适配 Kubernetes v1.21
|
* 适配 Kubernetes v1.21
|
||||||
|
|||||||