功能概述

MongoDB 监控告警是通过云监控 CloudSat 提供监控管理。当集群监控项超过阈值时触发告警,并通过短信、邮件等形式发送告警通知。云监控 CloudSat 详情可参考云监控 CloudSat 相关文档。

操作步骤

步骤一:配置通知策略

通过设置统一的通知策略,用户可将告警通知统一发送至一个通知列表。后续绑定告警策略时,所关联的通知列表将无效。

  1. 通过 Web 浏览器登录企业云平台的 Console。

  2. 在顶部菜单栏中选择产品与服务 > 数据库与缓存 > 文档数据库 MongoDB,进入 MongoDB 管理页面。

  3. 在 MongoDB 管理页面,点击目标集群 ID,进入集群详情页面。

    mongodb_cluster_info
  4. 在右侧告警标签页,点击通知策略面板中的设置

  5. 在弹出的对话框中,选择已有的通知列表或点击创建新的通知列表。

    说明

    配置通知策略后,集群内节点绑定告警策略时,所关联的通知列表将无法收到告警通知。

  6. 确认信息填写无误后,点击提交,完成通知策略的配置。

步骤二:创建指标告警策略

详情参考如何创建告警策略

页面参数填写说明如下。

参数 说明

对象范围

填写 平台监控

告警类型

填写 指标告警,即对集群指标进行监控告警。

资源类型

填写 集群节点

步骤三: 绑定指标告警策略

MongoDB 支持对每个缓存节点配置指标告警策略。当业务发生异常时,会触发用户设定的告警阈值,并发送短信或邮件通知用户。

说明

每个节点只能绑定一个指标告警和一个事件告警。

  1. 延续前文步骤,进入告警标签页。

  2. 勾选目标节点后,点击列表上方绑定指标告警策略,弹出告警策略选择对话框。

  3. 用户根据需求,勾选前文创建的告警策略后,点击提交

  4. 返回告警页签,选中已绑定指标告警策略节点,可查看配置的指标和告警历史。

    查看通知策略

附录

告警规则说明

告警项 推荐值 告警说明

CPU 利用率

90%

检测 CPU 使用率。若 CPU 过高会导致性能下降、崩溃等。

内存使用率

90%

检测内存使用率。若持续增高会导致数据库不可用。

磁盘使用量

85%

检测硬盘使用率。若磁盘满会导致数据无法落盘。

节点服务状态

异常

检测服务是否可用。

当前连接数

1~N

检测当前节点连接数。默认阈值 46080。

可用连接数

1~N

检测当节点可用的连接数量。默认阈值 5120。

cache 内存使用率

90%

检测当前节点 Cache 内存使用率。默认阈值 90%。