# 服务监控

本文介绍如何在云托管控制台查看服务监控数据。

# 操作步骤

  1. 登录 云托管控制台 (opens new window),再按需要切换到指定的环境。
  2. 单击「监控」切换到监控选项卡,即可查看当前环境下所有服务、服务下所有版本的监控数据。
  3. 选择您需要查看的服务,单击服务名称进入服务详情页面。
  4. 单击「监控」切换到监控选项卡,即可查看当前服务、服务下所有版本的监控数据。
  5. 选择您需要查看的版本,单击版本名称进入版本详情页面。
  6. 单击「监控」切换到监控选项卡,即可查看当前版本监控数据。

# 监控字段说明

  • 在环境/服务/版本维度监控选项卡中,顶部时间筛选器对页面内所有监控数据生效。例如:在顶部选择时间"7 天",则统计卡片、统计曲线,均展示过去 7 天的数据。
  • 监控曲线图中的“粒度”指每个监控数据对应的单位时间,会随着所选时间区间变化,时间跨度长则粒度粗。曲线图上所有数值需配合粒度解读

# 统计卡片

  • 调用次数:收到的请求次数(包括通过服务域名、HTTP 访问服务产生的请求),以及请求“异常”的次数。
  • 版本部署:总部署次数(包括新建版本部署,以及版本重新部署),以及“部署失败”的次数。
  • 实时副本数峰值:扩容曾达到过的最大值,以及最大值的出现时间。可作为设置版本的副本最大个数的参考值。

# 服务监控

  • 调用次数:单位时间内服务收到的请求次数总和(包括通过服务域名、HTTP 访问服务产生的请求)。
  • 平均响应时间 RT:单位时间内服务收到的所有请求的响应时间取平均值。
  • QPS:单位时间内服务平均每秒处理的请求数。
  • HTTP 错误:单位时间内请求服务失败返回 HTTP 错误的次数。
  • CPU 用量:单位时间内服务所有版本 CPU 资源消耗之和,单位为(核 x 小时)。
  • 内存用量:单位时间内服务所有版本内存资源消耗之和,单位为(GiB x 小时)。
  • 实例个数:服务所有版本的实时实例个数之和,在单位时间内取平均值。
  • 实例状态不正常个数:服务所有版本的实时实例状态不正常个数之和,在单位时间内取平均值。

# 版本监控

  • 调用次数:单位时间内版本收到的请求次数总和(包括通过服务域名、HTTP 访问服务产生的请求)。
  • 平均响应时间 RT:单位时间内版本收到的所有请求的响应时间取平均值。
  • QPS:单位时间内版本平均每秒处理的请求数。
  • HTTP 错误:单位时间内请求版本失败返回 HTTP 错误的次数。
  • CPU 用量:单位时间内版本 CPU 资源消耗,单位为(核 x 小时)。
  • 内存用量:单位时间内版本内存资源消耗之和,单位为(GiB x 小时)。
  • CPU 使用率:版本所有实例 CPU 使用率平均值,在单位之间内再取平均值。可作为设置扩缩容条件的参考值。
  • 内存使用率:版本所有实例内存使用率平均值,在单位之间内再取平均值。
  • 实例个数:版本的实时实例个数,在单位时间内取平均值。
  • 实例状态不正常个数:版本的实时实例状态不正常个数,在单位时间内取平均值。