监控管理
功能概述
企业云平台对 QKE 集群进行实时监控,为用户提供了基于集群级别及节点级别的监控数据收集与展示。通过监控数据,用户可以快速查看集群及节点的资源使用情况。
注意事项
当 QKE 集群版本为 v1.1.0 及以上,集群状态为 活跃,且服务状态为 健康 时,监控数据方可信。
操作步骤
-
通过 Web 浏览器登录企业云平台的 Console。
-
在顶部菜单栏中选择产品与服务 > 容器服务 > 容器引擎 QKE,默认进入容器引擎 QKE 快速入门页面。
-
点击左侧导航栏的集群管理,进入集群列表页面。
-
点击目标集群名称,默认进入集群概览页面后,点击左侧导航栏的集群运维 > 监控管理,进入监控管理页面。
-
如上图所示,默认展示集群监控数据。物理资源监控默认展示
最近6小时内的监控数据,支持用户根据需求,调整目标时间段。各监控指标说明如下。-
集群资源使用情况
监控项 指标含义 CPU
统计 CPU 的使用率、已使用量及总量。
内存
统计内存的使用率、已使用量及总量。
容器组
统计容器组的使用率、已使用量及总量。
存储
统计存储的使用率、已使用量及总量。
-
物理资源监控
监控项 单位/值 指标含义 CPU 使用率
%,整数[0, 100]
集群 CPU 使用率。
CPU 负载
>=0,整数
集群 CPU 使用量。
系统盘使用率
%,整数[0, 100]
集群系统盘使用率。
数据盘使用率
%,整数[0, 100]
集群所挂载数据盘的使用率。
内存使用率
%,整数[0, 100]
集群内存使用率。
apiserver 的连通性
-
1:正常
-
0:异常
-
集群
apiserver是否能正常连通。 -
检查 Master 节点 6443 端口。如果持续 1 分钟为 0,表示 Master 节点有异常。
正在运行的 Pod 数量
>=0,整数
集群节点上运行的 Pod 数量。
-
-
-
在监控管理页面,点击节点标签,可查看节点监控数据。
-
如上图所示,监控扫描周期默认为 5 分钟,新增节点暂无法查看监控信息。各监控指标说明如下。
监控项 监控周期 单位 指标含义 CPU 用量
5分钟
%
统计 CPU 使用率。
内存用量
5分钟
%
统计内存使用率。
磁盘吞吐量
5分钟
KB/s
统计硬盘每秒读取及写入速率,可分别获取从硬盘读取或写入硬盘的速率。
磁盘 IOPS
5分钟
次
统计硬盘每秒读取或写入次数,可分别获取从硬盘读取或写入硬盘的次数。