通过分组管理和告警功能构建大批量资源监控告警机制
更新时间:2025-08-15 03:41:38
背景描述
随着客户的业务发展,企业上云会面临大规模多类型的云产品资源监控运维问题,日常监控往往分布在多地,多业务,多资源无法统一高效监控。本篇实践旨在帮助您使用 CloudSat 提供分组管理和告警服务,可以帮助您的资源进行按业务有效分组,以及规模化的构建告警体系,迅速提升运维效率。
主要概念
操作步骤
假设我们有多种资源,一部分用于开发项目组(开发项目正式服务 01 和开发项目正式服务 02),一部分用于测试项目组,业务涉及资源分散于 北京 3 区 和 上海 1 区。以该场景为例,操作步骤详细说明如下。
-
新建分组并根据实际需求,添加资源,详情可参考创建实例分组。
-
完成后可明确了解当前各业务线资源整体概况,迅速定位分组内资源的关系,快速了解资源的监控告警状态,迅速察觉异常情况。
-
汇聚视图中发现正在告警的资源,并迅速定位具体异常对象。
-
通过告警状况进行针对性排障,如资源超载可以通过扩展资源的方式进行解决。
-
汇聚视图中发现未配置告警服务的资源,可在分组内进行快速绑定告警策略。
-
在告警服务中可查看当前分组内已绑定的告警策略状况。
-
在上图显示的当前组告警策略状况状况中,选择某一条告警策略,点击告警规则下的查看,即可查看分组内该告警策略的规则。