功能概述

企业云平台对 QKE 集群进行实时监控,为用户提供了基于集群级别及节点级别的监控数据收集与展示。通过监控数据,用户可以快速查看集群及节点的资源使用情况。

注意事项

当 QKE 集群版本为 v1.1.0 及以上,集群状态为 活跃,且服务状态为 健康 时,监控数据方可信。

操作步骤

  1. 通过 Web 浏览器登录企业云平台的 Console。

  2. 在顶部菜单栏中选择产品与服务 > 容器服务 > 容器引擎 QKE,默认进入容器引擎 QKE 快速入门页面。

  3. 点击左侧导航栏的集群管理,进入集群列表页面。

  4. 点击目标集群名称,默认进入集群概览页面后,点击左侧导航栏的集群运维 > 监控管理,进入监控管理页面。

    cluster_moni_data
  5. 如上图所示,默认展示集群监控数据。物理资源监控默认展示 最近6小时 内的监控数据,支持用户根据需求,调整目标时间段。各监控指标说明如下。

    • 集群资源使用情况

      监控项 指标含义

      CPU

      统计 CPU 的使用率、已使用量及总量。

      内存

      统计内存的使用率、已使用量及总量。

      容器组

      统计容器组的使用率、已使用量及总量。

      存储

      统计存储的使用率、已使用量及总量。

    • 物理资源监控

      监控项 单位/值 指标含义

      CPU 使用率

      %,整数[0, 100]

      集群 CPU 使用率。

      CPU 负载

      >=0,整数

      集群 CPU 使用量。

      系统盘使用率

      %,整数[0, 100]

      集群系统盘使用率。

      数据盘使用率

      %,整数[0, 100]

      集群所挂载数据盘的使用率。

      内存使用率

      %,整数[0, 100]

      集群内存使用率。

      apiserver 的连通性

      • 1:正常

      • 0:异常

      • 集群 apiserver 是否能正常连通。

      • 检查 Master 节点 6443 端口。如果持续 1 分钟为 0,表示 Master 节点有异常。

      正在运行的 Pod 数量

      >=0,整数

      集群节点上运行的 Pod 数量。

  6. 监控管理页面,点击节点标签,可查看节点监控数据。

    node moni data
  7. 如上图所示,监控扫描周期默认为 5 分钟,新增节点暂无法查看监控信息。各监控指标说明如下。

    监控项 监控周期 单位 指标含义

    CPU 用量

    5分钟

    %

    统计 CPU 使用率。

    内存用量

    5分钟

    %

    统计内存使用率。

    磁盘吞吐量

    5分钟

    KB/s

    统计硬盘每秒读取及写入速率,可分别获取从硬盘读取或写入硬盘的速率。

    磁盘 IOPS

    5分钟

    统计硬盘每秒读取或写入次数,可分别获取从硬盘读取或写入硬盘的次数。