跳到主要内容

告警设置

本文介绍如何根据云托管监控指标设置告警策略,使您可以及时掌握服务运行情况,通知您采取措施。告警在一定周期内监控某些特定指标,并根据给定的阈值,每隔若干个时间段发送告警。

操作步骤

  1. 登录 云托管控制台,切换到对应的环境。
  2. 点击左侧主菜单,进入「监控告警」-「告警策略」。
  3. 点击「新建」,创建云托管相关告警策略。请参考配置说明。
  4. 策略创建好之后,等待触发告警。
  5. 点击左侧主菜单,进入「监控告警」-「告警历史」。
  6. 查看当前环境触发过所有告警策略的记录,包括发生时间、产品类型、告警对象、告警内容、告警渠道等信息。

配置说明

策略名称

环境下告警策略的唯一标识。

备注信息

展示在告警策略列表页面,仅您自己在控制台可见,不对服务产生任何影响。

产品类型

下拉选择“云托管”。

维度

云托管告警分为服务、版本两个维度,每个维度对应一系列可用指标,与云托管监控页面中的「服务监控」、「版本监控」相对照。必须先选择维度才可确定哪些告警对象、触发条件是可选的。

告警对象

服务维度:可以选择具体的一个或多个服务。如选择「全部服务」,则当前环境内已有的所有服务,以及后续新增的所有服务,都会自动生效。

版本维度:先选定一个具体的服务,然后选择该服务的一个或多个版本。如选择「单个服务的全部版本」,则该服务后续新增的所有版本,也会自动生效,无需再次配置相同的告警策略。如在选定服务时就选择「全部服务的全部版本」,则当前环境内已有的所有服务的所有版本,以及后续新增的所有服务的所有版本,都会自动生效。

触发条件

具体触发告警的规则,每个告警策略中可以创建多个触发条件。

指标含义:请参阅 监控字段说明

统计周期:间隔多久检查一次指标是否满足条件。目前仅支持 5 分钟。

比较条件:比较指标数值和阈值的关系,包括 >、>=、<、<=、= 以及 !=。

阈值:用于和指标比较的固定值。

持续周期:为避免偶发波动频发误报警,指标持续多个周期都满足条件才会触发告警。支持设置 1 ~ 5 个周期。配合统计周期为 5 分钟,则指标持续 5 ~ 25 分钟满足条件才会触发告警。

告警频率:同样的告警信息多次提醒的频率,控制信息打扰率。

告警渠道

接受对象:支持对一个或多个用户或用户组发送。

有效时段:仅在指定时间段内发送告警,减少打扰。

接收渠道:可多选(邮件、短信、微信、站内信)。