应用性能监控

监控概览

2024-07-16 03:27:39

以应用为维度,统计整个应用的关键指标,帮助您快速掌握应用的整体状况。

功能入口

1.  选择目标资源池,并登录APM组件控制台。

2.  在左侧导航栏中选择「应用监控」-「应用列表」。

3.  在应用列表中选择您想查看的应用,点击「应用名称」打开新的应用详情链接。

4.  在左侧导航栏中选择「应用总览」-「概览」页签查看相应信息。

功能说明

总览指标

l  总请求量:筛选时间段内,应用提供服务请求量+应用依赖服务请求量。

l  平均响应时间:筛选时间段内,(所有应用提供服务响应时间+所有应用依赖服务响应时间)/总请求量。

l  错误数:error,筛选时间段内,请求出错的数量,通常指http状态码为4xx、5xx的请求。

l  FullGC:筛选时间段内,整堆垃圾回收的次数,回收的区域包括年轻代、老年代以及方法区。

l  慢SQL:筛选时间段内,执行时间大于等于慢SQL阈值的SQL数量,默认500ms,您可根据实际情况在「应用设置」中修改。

l  异常:exception,筛选时间段内,该应用报的异常数。

l  慢调用:筛选时间段内,响应时间大于等于慢调用阈值的调用数量,默认500ms,您可根据实际情况在「应用设置」中修改响应时间阈值。

应用提供服务

因用户访问该应用而产生的数据,例如用户在浏览器中访问该应用

l  应用提供服务请求量:筛选时间段内,用户向该应用发起的请求数量

l  应用提供服务平均响应时间:响应时间是指从用户发起请求到服务端给予反馈的时长,平均响应时间是筛选时间段内,所有请求的响应时间的平均值。

应用依赖服务

因该应用访问其他服务而产生的数据,例如该应用访问数据库

l  应用依赖服务请求量:筛选时间段内,该应用向其他服务发起的请求数量

l  应用依赖服务平均响应时间:响应时间是指从该应用发起请求到其他服务给予反馈的时长,平均响应时间是筛选时间段内,所有请求的响应时间的平均值。

l  应用实例数:筛选时间段内,有调用行为的应用实例数量。

l   HTTP-状态码统计

n   5xx:服务器异常,服务器在处理请求的过程中发生错误

n   4xx:客户端异常,请求包含语法错误或无法完成请求

n  3xx:重定向问题,需要进一步操作

n   2xx:成功,服务器成功接收请求并执行

n   200:请求成功

慢调用

该应用访问其他服务时,其他服务响应时间大于等于500ms(默认500ms,可在应用设置中修改阈值)的调用,定义为慢调用。显示饼图和详情表,表头显示如下

l  时间:判定为慢调用的时间点

l  服务名:被调用的服务名称

l  IP:被调用的服务的IP地址

l  耗时(ms):具体响应时间

l   响应码:200表示请求成功,03表示调用时长超过最大监听时长15秒

l  TraceID:Trace表示一个完整的请求链路,一个Trace包含了多个调用过程span,TraceID是该请求链路的唯一标识。

统计分析

以接口维度来统计调用的情况

l  接口名称:被调用的接口的名称

l  最大值:筛选时间段内,该接口被调用的响应时间的最大值

l  平均值:筛选时间段内,该接口被调用的平均响应时间

l  平均响应时间:筛选时间段内,每天的平均响应时间的趋势图

l  异常情况

l  异常类型:显示异常明细,与点击详情按钮看到的内容一致

l   出现次数:筛选时间段内,此类异常出现的次数


D7GhaJr5BGHO