# 服务监控
进入 微服务治理平台 > 监控中心 > 服务监控,您可在此查看服务总览、调用监控、链路查询和资源监控。
# 总览
进入服务监控后,默认进入总览页。
服务拓扑中可查看当前服务拓扑节点,以及与当前服务有直接关联的其他服务节点、中间件节点等。
- 平均吞吐量:选择时间段内,该服务的平均吞吐量。
- 平均响应时间:选择时间段内,该服务的平均响应时间。
- 请求错误率:选择时间段内,该服务的所有请求错误率。
- 服务实例:选择时间段内,该服务的实例数量。
点击具体服务可进入对应服务监控页,在此查看该服务的拓扑图、服务请求概览和服务调用分析排行。
服务拓扑展示节点间的调用关系、平均吞吐量、平均响应时间、请求错误率和服务实例数。服务请求概览展示该服务的吞吐量、平均响应时间、HTTP 状态和请求错误率。
Erda 提供了从 R.E.D指标继续下钻分析的能力,用户可以在性能曲线通过拖拽的方式选中一个时间段,会进入到该时间段内的 http 调用分析的页面,用户可以在该页面去寻找响应时间排名前几个的 http 调用,然后针对响应时间慢的 http 调用继续进行分析。
从R.E.D指标下钻到了 HTTP 调用,再到调用关联的 Trace 详情,用户就可以观察到具体是哪一个调用影响了响应时间,同时我们的 Span 处按照 Span 的发生时间,同时关联了主机,POD, JVM, 中间件,Log,Profile 等数据,从而使用户可以多方位,多角度来观测影响该 span 的各种因素,进而来锁定具体的问题发生时间点。
服务调用分析展示服务的高吞吐量接口、慢响应接口、错误接口、外部接口调用、慢响应 SQL 和异常类型的 Top 5 排行。
# 调用监控
调用监控页展示 Server 应用的事务详情,包括以下五类调用监控:
- HTTP 调用
- RPC 调用
- 缓存调用
- 数据库调用
- MQ 调用
# HTTP 调用
- 吞吐量:选择时间段内的吞吐量趋势图。
- 平均响应时间:选择时间段内的平均响应时间趋势图。
- 请求分布:选择时间段内的请求分布气泡图。
点击某事务名称,可查看其概览及慢调用情况。
# 概览
- 吞吐量:选择时间段内,当前调用 API 的吞吐量趋势图。
- 平均响应时间:选择时间段内,当前调用 API 的平均响应时间。
- 慢调用次数:选择时间段内,当前事务的慢调用次数。
# 慢调用
# PRC 调用
RPC 调用概览及慢调用与 HTTP 调用类似,具体请参见 HTTP 调用。
# 数据库调用
数据库调用概览及慢调用与 HTTP 调用类似,具体请参见 HTTP 调用。
# 链路查询
您可通过服务监控链路查询,查看当前服务中发生的链路情况,其功能与 诊断分析 > 链路追踪 中的 链路查询 一致。
# 资源监控
资源监控可通过以下三种方式监控服务的资源使用情况:
- 运行时监控:查看不同语言的运行时情况,例如 Java、NodeJS。
- 容器监控:监控容器的 CPU、内存使用情况等。
- 主机监控:查看当前服务实例所在的宿主机资源使用情况。
# 运行时监控
# Java 运行时
- 堆内存:JVM 堆内存使用情况。
- 非堆内存:JVM 非堆内存使用情况。
- Eden Space/Survivor Space/Old Gen:分别表示 JVM 堆内存的 Eden 区、Survivor 区和老年代区。
- GC 次数/GC 平均时间:分别表示 JVM GC 的次数和平均时间。
- Class 数量:JVM 从启动开始加载和卸载的类个数。
- JVM 线程:JVM 加载线程。
# NodeJS 运行时
- 堆内存:NodeJS 堆内存使用情况。
- 非堆内存:NodeJS 非堆内存使用情况。
- Cluster Count:Cluster 数量。
- Async Resources:Async Resources 数量。
# 容器监控
- 容器 CPU:当前服务实例所在容器的 CPU 趋势图。
- 容器内存:当前服务实例所在容器的内存趋势图。
- 磁盘 IO:当前服务实例所在容器的磁盘速率趋势图。
- 容器网络: 当前服务实例所在容器的网络速率趋势图。
# 主机监控
- CPU:当前服务实例所在宿主机的 CPU 趋势图。
- 内存:当前服务实例所在宿主机的内存趋势图。
- 系统负载:当前服务实例所在宿主机的系统负载趋势图,例如 Load 1、Load 5、Load 15。
- Pod 数量:当前服务实例所在宿主机的 Pod 数量趋势图。
- 磁盘 IO 速率:当前服务实例所在宿主机的磁盘 IO 趋势图。
- 网络速率:当前服务实例所在宿主机的网络速率趋势图。