已发布应用

2025-09-22 03:23:39

已发布应用列表

进入监控运维-已发布应用页面,可以查看当前项目下发布部署到不同环境下的应用列表。

应用总览

应用概览页面展示应用基本信息、部署规格、访问方式管理、应用监控概览及拓扑图、以及生命周期管理等相关信息。进入监控运维-已发布应用页面,选择应用,点击详情进入应用总览页面。根据部署方式的不同,应用总览页存在差别。MSAP支持镜像部署和微服务镜像部署两种部署方式,镜像部署应用没有应用监控相关信息。

  • 管理应用生命周期

将应用部署到MSAP后,用户在应用总览页面管理该应用的生命周期,包括部署新版本的应用、扩缩容、启动、停止、重启、删除等操作。

  • 部署新版本应用在应用

总览页面右上角点击部署,并选择需要的部署模式。镜像部署发布方式应用总览页面没有该操作,镜像部署发布方式部署新版本应用通过流水线实现。

  • 单批发布

单批发布适用于应用规模较小或服务架构比较简单,在开发、测试完成后,可以直接升级,即直接部署新版本的场景。

参数

描述

集群类型

默认Kubernets集群

应用运行环境

默认openjdk,根据程序包类型选择具体运行环境。通常JAR包选择openjdk,WAR包选择openjdk-tomcat。仅源码和程序包场景需要。

分支/Tag名称

对应源码仓库具体分支、Tag,仅从源码场景需要。

编译环境

用于源码编译,根据源码选择所需编译环境,默认选择openj-maven3编译环境。仅源码场景需要。

程序包名称

源码编译后的产物。仅源码场景需要。

程序包路径

程序包的相对路径,用于查找具体程序包。仅源码场景需要。

程序包版本

标记程序包,用于区分程序包。仅源码和制品场景需要。

部署版本

部署标识,可输入具体版本,也可单击右侧的用时间戳作为版本号,自动生成相应的时间戳。

Pod资源限额

限制Pod的CPU和内存资源,单Pod的CPU和MEM的资源预留必须大于0,CPU和MEM资源限制为0(即不做资源限制),如果您需要限制配额,请填写具体的数字。

微服务治理

微服务治理相关配置,注册中心实例必选。

可选

启动命令、环境变量、应用生命周期管理、日志收集管理、配置管理等可选高级配置,用户可根据实际需求按需配置。

  • 分批发布

分批发布适用于应用规模较大或服务架构比较复杂的应用,每次仅对应用的一部分实例进行升级,直至全量升级完成。分批发布过程中如果出现故障,可以及时终止并回滚,待问题修复后重新发布。分批部署模式需要应用实例数大于1的情况下才能使用。

参数

描述

集群类型

默认Kubernets集群

应用运行环境

默认openjdk,根据程序包类型选择具体运行环境。通常JAR包选择openjdk,WAR包选择openjdk-tomcat。仅源码和程序包场景需要。

分支/Tag名称

对应源码仓库具体分支、Tag,仅从源码场景需要。

编译环境

用于源码编译,根据源码选择所需编译环境,默认选择openj-maven3编译环境。仅源码场景需要。

程序包名称

源码编译后的产物。仅源码场景需要。

程序包路径

程序包的相对路径,用于查找具体程序包。仅源码场景需要。

程序包版本

标记程序包,用于区分程序包。仅源码和制品场景需要。

部署版本

部署标识,可输入具体版本,也可单击右侧的用时间戳作为版本号,自动生成相应的时间戳。

Pod资源限额

限制Pod的CPU和内存资源,单Pod的CPU和MEM的资源预留必须大于0,CPU和MEM资源限制为0(即不做资源限制),如果您需要限制配额,请填写具体的数字。

发布策略

用于配置分批发布策略参数

分批间处理方式:支持手动和自动两种方式;

手动:手动触发下一批次的发布。

自动:根据间隔自动分批发布,需要设置批次内部署间隔,单位为min.    

发布批次:应用实例按照设定的批次完成分批发布。

微服务治理

微服务治理相关配置,注册中心实例必选。

可选

启动命令、环境变量、应用生命周期管理、日志收集管理、配置管理等可选高级配置,用户可根据实际需求按需配置。

  • 金丝雀发布(灰度)

金丝雀发布适用于应用的新版本需要先进行小规模验证,验证后,再将应用全量升级到新版的场景。金丝雀部署模式需要应用实例数大于1的情况下才能使用。开始部署后,在变更记录页面查看变更记录信息。

参数

描述

集群类型

默认Kubernets集群

应用运行环境

默认openjdk,根据程序包类型选择具体运行环境。通常JAR包选择openjdk,WAR包选择openjdk-tomcat。仅源码和程序包场景需要。

分支/Tag名称

对应源码仓库具体分支、Tag,仅从源码场景需要。

编译环境

用于源码编译,根据源码选择所需编译环境,默认选择openj-maven3编译环境。仅源码场景需要。

程序包名称

源码编译后的产物。仅源码场景需要。

程序包路径

程序包的相对路径,用于查找具体程序包。仅源码场景需要。

程序包版本

标记程序包,用于区分程序包。仅源码和制品场景需要。

部署版本

部署标识,可输入具体版本,也可单击右侧的用时间戳作为版本号,自动生成相应的时间戳。

Pod资源限额

限制Pod的CPU和内存资源,单Pod的CPU和MEM的资源预留必须大于0,CPU和MEM资源限制为0(即不做资源限制),如果您需要限制配额,请填写具体的数字。

发布策略

用于配置发布策略参数和灰度规则。

灰度规则:

· 按内容灰度

协议类型:Spring Cloud需要设置path,Dubbo需要选择服务和方法

条件模式:选择同时满足下列条件或满足下列任意条件

条件列表:Spring Cloud可根据Cookie、Heade或者Parameter类型设置具体参数,Dubbo根据应用实际参数、参数值表达式设置

· 按比例灰度:流量回按配置的比例转发到当前的灰度分组

· 按泳道灰度:基于全链路流控泳道的环境隔离机制,在应用灰度发布过程中,被添加至灰度泳道的灰度分批实例将与基线版本实例隔离

策略名称:自定义泳道灰度策略名称。

泳道组:选择已创建的泳道组

泳道:选择已创建的泳道

微服务治理

微服务治理相关配置,注册中心实例必选。

可选

启动命令、环境变量、应用生命周期管理、日志收集管理、配置管理等可选高级配置,用户可根据实际需求按需配置。

金丝雀发布启动后,MSAP将先在指定的灰度分组中部署新版本应用。变更记录页面将显示部署进度和状态。灰度流量验证完成后,在变更记录页面右侧单击执行下一批,完成后续分批发布。如果在验证过程中发现新版本应用有问题,可以在变更记录页面右上角单击回滚,回滚应用到前期部署版本。


  • 部署历史版本

    在应用总览页面右上角点击部署>部署历史版本,在部署历史版本对话框选择要部署的历史版本,并单击部署该版本。

  • 启停应用

    当应用处于运行状态时,可以根据业务需求在应用总览页面右上角单击停止来停止应用。停止应用是通过将Pod数缩容至0个来实现的。应用内至少包含1个运行中的Pod时,才能进行应用停止操作。

    当应用处于停止状态时,可以根据业务需求来启动应用。在应用总览页面右上角单击启动,然后在启动应用对话框中设置应用Pod数,然后单击确认。

  • 重启应用

    对于正在运行的应用实例,在应用总览页面右上角单击重启应用,将会通过滚动发布,先启动新Pod,再停止旧Pod来重启应用。

  • 扩缩容

    在应用总览页面右上角选择扩缩 > 手动扩缩或扩缩 > 弹性扩缩。具体操作请参见3.6.2.2.3应用扩缩容。

  • 查看应用配置详情

    在应用总览页面右上角单击配置详情,在面板中查看应用配置详情,例如工作负载(Deployment)、容器组(Pod)和微服务治理等高级配置信息。

  • 删除应用

    在应用总览页面右上角单击删除,并在确认对话框中单击确认.


访问应用(发布服务)

应用发布部署环境后,无法直接被其他应用所访问。微服务云应用平台提供负载均衡(私网)、负载均衡(公网)以及服务(Service)三种访问方式。

  • 负载均衡(私网)

    此种方式用于VPC内网访问,使用Service的LoadBalancer模式,绑定一个VPC内的私网负载均衡,私网IP可以直接访问到服务后端的Pod。

    在应用总览页面的访问方式配置区域,单击负载均衡(私网)右侧的加号图标,设置负载均衡参数,完成参数配置后单击确认。

    弹性负载均衡开通说明:在天翼云产品->网络与CDN分类下,选择弹性负载均衡产品,点击立即开通,既可订购开通弹性负载均衡。



配置项

描述

服务名

自定义设置服务名称,服务名称必须唯一,不能和已有服务名称重复。支持小写字母、数字和短划线(-),且必须以字母开头,字母或数字结尾,长度范围为2~32个字符。

选择弹性负载均衡

在下拉列表中选择新建弹性负载均衡或已有弹性负载均衡

外部流量策略

外部流量策略分为Local和Cluster两种模式:

· Local:流量只发给本机的Pod。配置为Local模式时,只有集群中存在Service对应Pod的节点会被添加到弹性负载均衡后端,且流量不会转发到集群中其它节点的Pod中。

· Cluster:流量可以转发到集群中其他节点上的Pod。

TCP|HTTP协议

· 弹性负载均衡端口(应用名):公网负载均衡前端端口,通过该端口访问应用,可设置范围为[1,65535]。

· 容器端口(TargetPort):进程监听的端口,一般由程序定义。

UDP协议

· 弹性负载均衡端口(应用名):公网负载均衡前端端口,通过该端口访问应用,可设置范围为[1,65535]。

容器端口(TargetPort):进程监听的端口,一般由程序定义。

结果验证:

如果负载均衡右侧未出现IP和端口信息,只显示服务名称,则表示绑定负载均衡失败,请进入变更记录查看变更详情,根据变更记录排查并修复失败原因。如果显示IP和端口信息,在浏览器地址栏中输入<负载均衡IP>:<端口号>,再按回车键即可进入各自的应用首页。

  • 负载均衡(公网)

    此种方式用于公网访问,使用Service的LoadBalancer模式,绑定一个公网负载均衡,公网IP可以直接访问到服务后端的Pod。

    在应用总览页面的访问方式配置区域,单击负载均衡(公网)右侧的加号图标,设置负载均衡参数,完成参数配置后单击确认

    负载均衡(公网)相关配置参数和验证请参考负载均衡(私网)。

  • 服务(Service)

    此种方式用于集群内部访问,使用Service的ClusterIP或NodePort模式。此类访问将会转发给服务后端Pod,并为这些Pod提供负载均衡。

    在应用总览页面的访问方式配置区域,单击服务(Service)右侧的加号图标,完成参数配置后单击确认。

参数

描述

服务名

自定义设置服务名称,服务名称必须唯一,不能和已有服务名称重复。 支持小写字母、数字和短划线(-),且必须以字母开头,字母或数字结尾,长度范围为2~32个字符。

服务类型

· 虚拟集群IP:即ClusterIP,指通过集群的内部IP暴露服务。选择该值,服务只能够在集群内部可以访问,这也是默认的Service类型。

· 节点端口:即NodePort,通过每个Node上的IP和静态端口(NodePort)暴露服务。NodePort服务会路由到ClusterIP服务,这个ClusterIP服务会自动创建。通过请求<NodeIP>:<NodePort>,可以从集群的外部访问一个NodePort服务。

服务端口

服务前端端口,通过该端口访问应用,可设置范围为1~65535。

容器端口

进程监听的端口。一般由程序定义,可设置范围为1~65535。

节点端口

节点对外暴露该服务的端口。一般由程序定义,可设置范围为30000~32767。

协议

服务协议,包含TCP和UDP,默认值为TCP。

结果验证:

在当前应用添加服务(Service)后,可登录K8S集群中任一Pod,在Pod内根据服务相关信息访问应用。

应用扩缩容


1.手动扩缩 

在应用总览页面右上角选择扩缩 > 手动扩缩,在应用扩缩容对话框中设置要扩容或缩容的应用Pod数,单击确定。如果将Pod数量设置为0,系统将物理删除该应用下所有的Pod,仅保留应用的基本创建信息。 

开始扩缩容后,在应用总览页面出现应用正在变更...字样,您可以单击查看详情,查看应用变更的详细过程。应用变更需要几分钟,请您耐心等待。变更完成后在应用总览页面的基本信息区域查看实例的运行状态,如果显示为Pod运行中,说明应用部署成功。 

2.弹性扩缩 

弹性伸缩能够感知应用内各个实例的状态,并根据实例状态动态实现应用扩容和缩容。在保证服务质量的同时,提升应用的可用率。执行应用变更(如部署应用、应用扩缩、变更规格等)时,无法配置弹性策略。

应用处于变更中时,弹性策略将会自动关闭,待变更完成后,自动恢复弹性策略。 在应用总览页面右上角选择扩缩 > 弹性扩缩,在弹性扩缩容对话框中设置弹性策略。在策略名称的文本框,输入自定义的弹性策略名称。在触发条件区域,单击+新增触发器,然后在右侧弹出的创建触发器面板配置触发器规则,配置完成后,单击确定。


  • 触发器名称:必须必须以字母开头,允许数字、字母、下划线以及中划线组合。最大长度30个字符

  • 触发器类型:您支持定时触发和指标触发。

    • 定时触发:适用于负载强周期型应用。


配置项

描述

周期

在下拉列表选择每天、每周或每月。

说明:

选择每周后,根据需求可选择具体日期配置触发规则。如果一周内不同日期的单天内触发规则不同,可通过创建多条定时触发器来实现。

单天内触发时间

单击添加创建每天的触发时间和实例数。

1.如果错过设定的触发时刻,定时策略需要等到下一周期才会被触发。

2.两个邻近触发时间间隔要大于10分钟。

3.两个邻近触发时刻设定的实例数变化需要大于10%。

之后保持实例数

根据实际情况设置弹性策略执行后保持的实例数。

开启实例数保持

勾选后,若同时设置指标触发弹性策略,在设定时间段内,以两者中较大值为准。若不勾选,只会在设定的时刻执行一次伸缩动作,之后可能会受其他指标触发策略影响,实例数发生变化。


    • 指标触发:支持应用平均CPU使用率、应用平均内存使用率、应用提供服务平均每秒请求量、应用提供服务平均响应时间(毫秒)等系统来源指标。

配置项

描述

推荐使用创景

应用平均CPU使用率

基于实时数据统计,该应用每个实例平均CPU使用率,数据源来自K8s自身监控。

适用于绝大多数应用。

应用平均内存使用率

基于实时数据统计,该应用每个实例平均内存使用率,数据源来自K8s自身监控。

适用于可以归还内存给操作系统的应用(Java应用不适用)。

应用提供服务平均每秒请求量

基于过去1分钟数据统计,该应用每个实例平均每秒接收到的服务请求量,数据源来自MSAP产品应用监控。

适用于微服务流量的应用。

应用提供服务平均响应时间(毫秒)

基于过去1分钟数据统计,该应用处理请求的平均响应时间(毫秒),数据源来自MSAP产品应用监控。

适用于微服务响应延迟有要求的应用


配置最大应用实例个数和最小应用实例个数:

  • 最大实例个数:可设置的范围为(2,1000)。触发弹性伸缩条件后,应用扩容,其实例数可达到最大值。

  • 最小实例个数:可设置的范围为(0,1000)。触发弹性伸缩条件后,应用缩容,其实例数可达到最小值。

自定义弹性策略:启用弹性伸缩策略并配置扩容和缩容行为

  • 冷却时间:根据需要设置冷却时间。单位为秒,范围为(0,3600)。扩容行为冷却时间默认为0秒,缩容行为冷却时间默认为300秒。

  • 扩容行为:在扩容行为区域,单击添加扩容策略,在添加扩容策略对话框,配置扩容策略,然后单击确定

配置项

描述

策略类型

根据需要选择副本个数或百分比作为策略类型。支持Pods和Percent类型。

Pods:表示副本个数类型。

Percent:表示百分比类型。

最大步长/百分比

根据选择的策略类型设置该参数值。

时间周期

策略执行周期。例如,策略类型选择Percent,步长/百分比设置为10,时间周期为60秒,则允许在一分钟内最多扩容或缩容当前副本个数的百分之十。


  • 缩容行为:请参见扩容行为。

  • 选择策略:支持Min、Max和Disabled三种策略。默认为Max。

配置好弹性策略后,在弹性伸缩对话框右上角单击启用。弹性策略触发后,如果MSAP根据所设置的策略对应用实例进行扩容或缩容,表示自动弹性伸缩策略设置成功。同时您可以前往事件中心查看应用扩缩容相关事件。


变更记录

在MSAP上进行应用部署、启动、扩容、缩容等生命周期操作后,可以跳转到应用详情页查看当前变更状态,也可以通过变更记录页面查看该应用的历史变更记录。

  • 查看应用变更详情

    在执行完应用变更操作后,返回应用总览页面。在应用总览上方,会提示应用正在变更...查看详情。单击提示信息中的查看详情,查看该应用的变更过程信息。

  • 回滚应用

    应用在升级过程中或升级完成后,发现新版本应用有问题或异常,可以回滚应用,待问题解决后再升级。在变更记录页面右上角单击回滚,并在确认对话框中单击确定,确认手动回滚应用后,自动终止应用升级流程并回滚到之前的版本。执行状态显示为执行成功,表示回滚应用成功。


调用链查询

在应用总览页面左侧的导航栏单击调用链查询,查看应用的所有接口的被调用情况,包括产生时间、耗时、状态等信息。

点击操作列的查看,即可查看调用链详情。


监控

实例监控

实例监控包含了应用概览、JVM监控、Pod监控、SQL调用分析、异常分析等信息。 

概览 

1.在应用详情的左边导航栏中选择监控 > 实例监控 > 概览。 

2.应用拓扑 

应用拓扑区域显示该应用在指定时间段的内部服务的调用关系拓扑图。 

在应用拓扑区域,您可以执行以下操作: 

  • 向上滑动鼠标滚轮,放大应用拓扑图。

  • 向下滑动鼠标滚轮,缩小应用拓扑图。

  • 单击RESET图标,将应用拓扑图恢复至默认大小。

3.请求数 

请求数区域显示该应用在指定时间段的请求数时序曲线。 

在请求数区域,您可以执行以下操作: 

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。

4.响应时间 

响应时间区域显示该应用在指定时间段的响应时间时序曲线。 

在响应时间区域,您可以执行以下操作: 

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。

5.错误数 

错误数区域显示该应用在指定时间段的错误数时序曲线。 

在错误数区域,您可以执行以下操作: 

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。

6.HTTP状态码 

HTTP状态码区域显示该应用在指定时间段的HTTP状态码时序曲线。 

在HTTP-状态码统计区域,您可以执行以下操作: 

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。

  • 单击图例,隐藏或显示数据。


JVM监控 

1.在应用详情的左边导航栏中选择监控 > 实例监控 > JVM监控。 

2.监控指标 

  • GC(垃圾收集)瞬时和累计详情

    • FullGC次数

    • YoungGC次数

    • FullGC耗时

    • YoungGC耗时

  • 堆内存详情

    • 堆内存使用总和

    • 堆内存老年代字节数

    • 堆内存年轻代Survivor区字节数

    • 堆内存年轻代Eden区字节数

  • 非堆内存

    • 非堆内存提交字节数

    • 非堆内存初始字节数

    • 非堆内存最大字节数

  • 元空间

    • 元空间字节数

  • 直接缓冲区

    • DirectBuffer总大小(字节)

    • DirectBuffer使用大小(字节)

  • JVM线程数

    • 线程总数量

    • 死锁线程数量

    • 新建线程数量

    • 阻塞线程数量

    • 可运行线程数量

    • 终结线程数量

    • 限时等待线程数量

    • 等待中线程数量

3.查看JVM监控指标

您可在JVM监控页签查看GC瞬时次数、GC瞬时耗时、堆内存详情、非堆内存详情、元空间详情、直接缓冲区和JVM线程数的时序曲线。

  • 单击GC瞬时次数/每分钟区域右上角的瞬时值或累计值按钮,可以切换GC瞬时次数的瞬时值和累计值的时序曲线,默认为瞬时值。

  • 单击GC瞬时耗时/每分钟区域右上角的瞬时值和累计值按钮,可以切换GC瞬时耗时的瞬时值和累计值的时序曲线,默认为瞬时值。

  • 单击各监控区域的指标名称,可以打开或关闭该指标在图标中的可见性。

Pod监控 

1.在应用详情的左边导航栏中选择监控 > 实例监控 > Pod监控。 

2.CPU 

CPU区域显示该应用在指定时间段的Pod的CPU情况(累计CPU使用量)。 

在CPU统计区域,您可以执行以下操作:

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。

  • 单击图例,隐藏或显示数据。

物理内存

物理内存区域显示该应用在指定时间段的Pod的物理内存情况。

在物理内存区域,您可以执行以下操作:

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。

  • 单击图例,隐藏或显示数据。

SQL调用分析 

在应用详情的左边导航栏中选择监控 > 实例监控 > SQL调用分析。 

2.SQL调用统计 

调用统计区域显示该应用在指定时间段的SQL调用时序曲线。 

在SQL调用统计页签下,您可以执行以下操作: 

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。

  • 单击图例,隐藏或显示数据。

3.SQL语句列表

SQL语句列表显示该应用在指定时间段的所有SQL语句的列表。


NOSQL调用分析 

1.在应用详情的左边导航栏中选择监控 > 实例监控 > NOSQL调用分析。 

2.NOSQL调用统计 

调用统计区域显示该应用在指定时间段的NOSQL调用时序曲线。 

在NOSQL调用统计页签下,您可以执行以下操作: 

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。

  • 单击图例,隐藏或显示数据。 

3.NOSQL语句列表 

NOSQL语句列表显示该应用在指定时间段的所有NOSQL语句的列表。

异常分析 

1.在应用详情的左边导航栏中选择监控 > 实例监控 > 异常分析。 

2.异常统计 

异常统计区域显示该应用在指定时间段的异常的堆积柱状图和异常列表。 

在异常统计区域,您可以执行以下操作: 

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。 

3.异常列表 

异常列表显示该应用在指定时间段的所有异常的列表。 

在异常列表,您可以执行以下操作: 

  • 在异常的操作列,单击调用统计查看该异常的堆积柱状图。

  • 在异常的操作列,单击调用链查询查看该接口的调用链信息。

  • 在异常的操作列,单击详情查看该异常的详细信息。

错误分析 

1.在应用详情的左边导航栏中选择监控 > 实例监控 > 错误分析。 

2.错误数 

错误数区域显示该应用在指定时间段的错误时序曲线。 

在错误数区域,您可以执行以下操作: 

  • 将光标移到统计图上,查看统计情况。 

3.HTTP状态码 

HTTP-状态码统计区域显示该应用在指定时间段的HTTP状态码时序曲线。 

在HTTP-状态码统计区域,您可以执行以下操作: 

  • 将光标移到统计图上,查看统计情况。

  • 单击图例,隐藏或显示数据。 

4.错误列表 

错误列表显示该应用在指定时间段的所有错误的列表。 在错误右侧的TraceId列,单击TraceId名称,可以查看该错误的调用链。 

上游应用

1.在应用详情的左边导航栏中选择监控 > 实例监控 > 上游应用。 

2.请求量 

请求数区域显示该应用的上游应用在指定时间段的请求数时序曲线。 

3.平均延时 

请求数区域显示该应用的上游应用在指定时间段的请求耗时曲线。 

4.错误数 

错误数区域显示该应用的上游应用在指定时间段的错误数时序曲线。

下游应用 

1.在应用详情的左边导航栏中选择监控 > 实例监控 > 下游应用。 

2.请求量 

请求数区域显示该应用的下游应用在指定时间段的请求数时序曲线。 

3.平均延时 

请求数区域显示该应用的下游应用在指定时间段的请求耗时曲线。 

4.错误数 

错误数区域显示该应用的下游应用在指定时间段的错误数时序曲线。

调用链查询 

1.在应用详情的左边导航栏中选择监控 > 实例监控 > 调用链查询。 

2.调用链查询 

调用链查询页签下显示该应用在指定时间段内被调用的所有接口的列表。 

在调用链查询页签下,您可以执行以下操作: 

  • 在搜索框,选择接口名称,查看指定接口的快照。

  • 在接口的TraceId列,单击TraceId名称,查看该接口的调用链路。


服务接口监控

概述 

服务接口监控用于监控应用下的接口调用详情,包括SQL分析、NoSQL调用分析、异常分析、错误分析和链路上下游。 

服务接口监控 

1.在应用详情的左边导航栏中选择监控 > 服务接口监控。 

2.查看服务概览信息 

概览页签列出了应用监控探针自动发现的所有接口。您可以按照响应时间、请求数、错误数或异常数对该列表排序。选中一个服务,即可在概览页签上查看该服务的详细调用拓扑,以及请求数、响应时间、错误数的时序曲线。 

3.查看SQL和NoSQL调用分析 

在SQL调用分析页签和NoSQL调用分析展示了左侧选中服务的代码段内所发起的SQL和NoSQL请求列表。借助此页签,您可以找出是哪一个SQL或NoSQL造成某个服务过慢。您还可以单击某个SQL或NoSQL中的接口快照来查看一个SQL或NoSQL执行逻辑所处的完整代码链路。 

4.查看异常分析 

在异常分析页签展示了左侧选中服务的代码段内所抛出的Java异常。您还可以单击某个异常中的接口快照来查看一个异常堆栈所处的完整代码链路。 

5.查看错误分析 

在错误分析页签展示了应用的错误和HTTP状态码统计数据。您还可以单击需要查看的TraceId,即可在新页面查看调用链路相关信息。 

6.查看链路上游和链路下游的接口调用情况 

链路上游和链路下游页签分别列出了应用上游(调用应用的一方)和应用下游(被应用调用的一方)的接口及其调用性能指标,包括响应时间、请求数和错误数。 

调用链查询 

在总调用链次数图表中,超过500毫秒被定义为慢调用。慢调用受应用设置中阈值影响,但不包含因为异步产生的调用本地API的情况。 

说明 在总调用链次数图表中,正常调用次数指的是总调用链次数。慢调用次数包含在正常调用次数里。 

在调用链响应时间图表中,其展示的数据是基于接口调用数据的二次统计,并受采样率影响。 

在参数详情表格中,单击TraceId可以查看调用链路和业务轨迹。单击查看日志可以查看该接口的调用日志。

数据库调用监控

概述 

数据库调用监控用于监控数据库的调用详情,包括SQL调用分析、异常分析、调用来源和调用链查询。 

数据库调用监控 

1.在应用详情的左边导航栏中选择监控 > 数据库调用。 

2.概览 

概览页签下显示数据库的调用关系拓扑、请求数时序曲线、响应时间时序曲线、错误数时序曲线等信息。 

在概览页签下,您可以执行以下操作: 向上滑动鼠标滚轮,放大应用拓扑图。 向下滑动鼠标滚轮,缩小应用拓扑图。 单击RESET图标,将应用拓扑图恢复至默认大小。 将光标移到统计图上,查看统计情况。 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。 

3.SQL调用分析 

SQL调用分析页签下显示数据库的SQL调用数柱状图、响应时间时序曲线、SQL语句列表等信息。 

可选:在SQL调用分析页签下,您可以执行以下操作: 

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。

  • 单击图例,隐藏或显示数据。 

4.异常分析 

异常分析页签下显示数据库的异常情况。 

在异常分析页签下,您可以执行以下操作: 

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。

  • 在异常的操作列,单击调用统计,查看该异常的统计情况。 在异常的操作列,单击详情,查看该异常的详情。 

5.调用来源 

调用来源页签下显示数据库的调用来源情况。 

在调用来源页签下,您可以执行以下操作: 

  • 在搜索框,输入应用或接口名称,单击搜索图标,查看应用或接口的情况。

  • 将光标移到统计图上,查看统计情况。

  • 单击图标,可以扩大图表,在扩大的图表中能选中一段时间,查看指定时间段的统计情况。

  • 单击图标,查看该指标在某个时间段的统计情况或对比不同日期同一时间段的统计情况。 

6.调用链查询 

调用链查询页签下显示数据库的所有接口的调用情况。 

可选:在调用链查询页签下,您可以执行以下操作: 

  • 在搜索框,输入接口名称,然后单击搜索图标,查看接口的调用情况。

  • 在接口的TraceId列,单击TraceId名称,查看该接口的调用链路。

NoSQL调用

概述 

数据库调用监控用于监控数据库的调用详情,包括NoSQL调用分析、异常分析和调用链查询。 

NoSQL调用 

1.在应用详情的左边导航栏中选择监控 > NOSQL调用。 

2.概览 

概览页签下显示NoSQL数据库的调用关系拓扑、请求数时序曲线、响应时间时序曲线、错误数时序曲线等信息。 

3.NoSQL调用分析 

NoSQL调用分析页签下显示NoSQL数据库的NoSQL调用数柱状图、响应时间时序曲线、操作命令列表等信息。 

4.异常分析 

异常分析页签展示了左侧选中服务的代码段内所抛出的Java异常。您还可以单击某个异常中的调用链来查看一个异常堆栈所处的完整代码链路。 

5.调用链查询 

调用链查询页签下显示该应用在指定时间段内被调用的所有接口的列表。

外部调用

概述 

外部调用监控用于监控外部调用详情,包括了响应时间、请求数和调用来源等信息。 

外部调用 

1.在应用详情的左边导航栏中选择监控 > 外部调用 

外部调用页面的左侧列表展示了应用的所有外部调用。您可以按照响应时间、请求数、错误数或异常数对该列表排序。 

2.概览 

在左侧列表选中其中一个外部调用,可在概览页签上查看该外部调用的请求数、响应时间、错误数以及HTTP-状态码的时序曲线。 

3.调用来源 

在左侧列表选中其中一个外部调用,可在调用来源页签上查看该外部调用所有接口的响应时间、请求数和错误数的时序曲线。 

在调用来源页签上,可按需执行以下操作: 

  • 在页签顶部单击全部折叠/展开,即可折叠或展开下方的所有接口。

  • 在页签顶部的搜索框内输入应用名称或接口(Span)名称的关键字,并单击搜索图标,即可筛选出符合条件的接口。

  • 单击接口信息所在的折叠面板,或者单击行末的上箭头或下箭头,即可展开或折叠该接口的性能指标信息。


告警管理

告警规则

概述 

通过告警规则,您可以查看到当前已设置的告警规则列表。可以对当前的规则进行编辑、删除、启停、查看告警历史等操作。 

告警规则 

1.在应用详情的左边导航栏中选择告警管理 > 告警规则。 

2.告警管理 

在告警规则页面上,您可以创建告警规则并对告警规则执行启动、停止、编辑、删除、查看告警详情等操作。 

  • 如需创建告警规则,请单击创建告警规则按钮,在创建告警页面中填写规则内容,并单击保存。

  • 如需编辑告警规则,请单击编辑,在编辑告警页面中编辑告警规则,并单击保存。

  • 如需删除告警规则,请单击删除,并在提示对话框中单击确认。

  • 如需启动已停止的告警规则,请单击启动,并在提示对话框中单击确认。

  • 如需停止已启动的告警规则,请单击停止,并在提示对话框中单击确认。

  • 如需查看告警事件历史和告警发送历史,请单击告警历史,在告警事件历史和告警发送历史页面上查看相关记录。


告警事件历史

概述 

通过事件列表页面,您可以筛选并查看所有告警事件。 

告警事件历史 

1.在应用详情的左边导航栏中选择告警管理 > 告警事件历史。 

2.告警事件历史管理 

在告警事件历史页面上,您可以对告警事件历史数据进行筛选,单击事件名称、关联告警查看更多详细信息。 

  • 设置事件名称、事件状态、事件对象、对象类型等字段,单击查询筛选出符合条件的数据。

  • 单击事件名称,可以查看事件的详细信息,展示了事件等级、事件数量、事件开始结束时间。

  • 单击关联告警,可以查看告警发送的详细信息,展示了告警基本信息、关联事件、活动记录。

告警发送历史

概述 

通过告警发送历史页面,您可以筛选并查看根据通知策略分派的告警内容,并管理告警。 

告警发送历史 

1.在应用详情的左边导航栏中选择告警管理 > 告警发送历史。 

2.告警发送历史管理 

在告警发送历史页面上,您可以对告警发送历史数据进行筛选,单击告警名称查看更多详细信息。 

  • 设置告警名称、告警状态、告警等级、通知策略、创建时间等字段,单击查询筛选出符合条件的数据。

  • 单击告警名称,可以查看告警发送的详细信息,展示了告警基本信息、关联事件、活动记录等信息。

  • 告警状态无需人工操作,检测到系统指标正常后,状态会自动更新为已解决。

通知组

概述 

创建通知策略时,您可以将联系人组指定为通知对象,当通知策略的分派规则被触发时,告警管理会向该联系人组中的联系人通过短信、邮件和钉钉等方式发送告警通知。 

通知组 

1.在应用详情的左边导航栏中选择告警管理 > 通知组。 

2.通知组管理 在通知组页面上,您可以新建通知组和联系人,并对已经创建的联系人进行编辑和删除操作。

通知策略

概述 

通过设置通知策略,您可以制定针对告警事件的分派规则。当规则被触发时,系统会以您指定的通知方式向处理人发送告警信息,以提醒处理人采取必要的问题解决措施。 

通知策略 

1.在应用详情的左边导航栏中选择告警管理 > 通知策略。 

2.通知策略管理 在通知策略页面上,您可以新增通知策略,并对已经创建通知策略进行编辑和删除操作。


日志管理

MSAP对接了日志服务ALS。如果在MSAP上部署应用时开启了日志服务功能,则可以查看该应用的日志。在应用总览页面左侧的导航栏单击日志中心,单击查看日志,即可进入日志服务控制台查询及分析日志。点击查看日志按钮,可跳转到日志服务ALS控制台查看该日志单元采集的日志、配置采集规则等操作。新创建的日志单元初始化需要几分钟,才可查看采集的日志。


事件中心

事件中心将MSAP所生成的事件数据进行统一管理、存储、分析和展示,已接入应用扩缩容事件、POD启动失败、镜像拉取失败、POD被驱逐、POD OOM等K8s集群事件。 

在应用总览 > 事件中心页面,您可以查看该应用相关事件。


限流降级

限流降级包含限流和降级两个功能。限流是指通过调节流量阈值控制通过系统的最大流量值,保证系统安全可靠运行。降级通常用于对下游出现超时的非核心服务提供者进行低优先级调用,确保上游核心应用(服务消费者)不被影响。通过接入限流降级,您实时查看限流降级详情和动态变更规则,从而全面保障您的应用可用性。使用限流降级需要事先部署时配置限流降级高级配置接入限流降级。

前提条件

在使用限流降级功能前,您需要在部署应用时在限流降级高级配置开启接入限流降级。如果不接入限流降级,在进入限流降级页面您无法进行规则管理、接口监控以及操作日志管理,页面会显示以下内容。

规则管理

接入限流降级功能后,您可在应用总览 > 限流降级 >  规则管理页面配置各种限流降级规则,保障您的应用的可用性。

您可以配置以下规则:

  • 流控规则

    流控规则的原理是监控应用或服务流量的QPS指标,当指标达到设定的阈值时立即拦截流量,避免应用被瞬时的流量高峰冲垮,从而保障应用高可用性。适用于需要限制突发的流量,在尽可能处理请求的同时来保障服务不被击垮的场景。

    在规则管理页面下流控规则页,点击新增流控规则按钮,

    在新增流控规则对话框配置流控规则。选择或输入接口名称后,点击下一步进入配置防护规则

参数

描述

是否集群流控

开启集群流控,对集群内此资源的调用总量进行限制。

是否开启

打开开关表示启用该规则,关闭开关表示禁用该规则。

单机QPS阈值

触发对流控接口的统计维度对象的QPS阈值。

来源应用

该规则针对的来源应用,默认来源应用设为default,代表不区分来源应用。

统计维度

选择资源调用关系进行流控。

当前接口直接控制来自来源应用中调用来源的访问流量,如果来源应用为default则不区分调用来源。通常应用于流量匀速通过的场景。

关联接口:控制当前资源的关联资源的流量。通常应用于资源争抢时,留足资源给优先级高接口的场景。

链路入口:控制该资源所在的调用链路的入口流量。选择链路入口后需要继续配置入口资源,即该调用链路入口的上下文名称。通常应用于预热启动避免大流量冲击的场景。

流控效果

选择流控方式来处理被拦截的流量。

快速失败:达到阈值时,立即拦截请求。按照应用系统设置中的适配模块配置信息,进行内容返回。

预热启动:需设置具体的预热时间。如果系统在此之前长期处于空闲的状态,当流量突然增大的时候,该方式会让处理请求的速率缓慢增加,经过设置的预热时间以后,到达系统处理请求速率的设定值。默认会从设置的QPS阈值的1/3开始慢慢往上增加至设置的QPS值,多余请求会按照快速失败处理。

排队等待:请求匀速通过,允许排队等待,通常用于请求调用削峰填谷等场景。需设置具体的超时时间,达到超时时间后请求会快速失败。

配置防护规则后,点击下一步进入配置限流行为配置行为

主要是配置Fallback行为。Fallback行为定义某个埋点资源触发了某种规则(如流控、熔断、降级)后的处理行为。目前Fallback行为仅支持Web和RPC两种资源类型。如果您不需要自定义限流后的Fallback行为,则选择默认行为即可。点击确定即可新增流控行为。

  • 隔离规则

    隔离规则通过控制接口或依赖的并发线程数,来保证系统的稳定性。适用于在调用第三方服务时,防止过多的慢调用挤占正常调用的资源,避免服务不可用。

    在规则管理页面下隔离规则页,点击新增隔离规则按钮,在新增隔离规则对话框配置流控规则。因为新增隔规则步骤和流控规则一样,此处只介绍新增隔离规则的配置防护规则步骤具体参数,其他参考流控规则。

参数

描述

是否开启

打开开关表示启用该规则,关闭开关表示禁用该规则。

并发数阈值

资源的并发线程数(即该资源正在执行的线程数)阈值。

来源应用

该规则针对的来源应用,默认来源应用设为default,代表不区分来源应用。

统计维度

选择资源调用关系进行流控。

当前接口直接控制来自来源应用中调用来源的访问流量,如果来源应用为default则不区分调用来源。通常应用于流量匀速通过的场景。

关联接口:控制当前资源的关联资源的流量。通常应用于资源争抢时,留足资源给优先级高接口的场景。

链路入口:控制该资源所在的调用链路的入口流量。选择链路入口后需要继续配置入口资源,即该调用链路入口的上下文名称。通常应用于预热启动避免大流量冲击的场景。

  • 熔断规则

    熔断规则可以监控应用内部或者下游依赖的响应时间或异常比例,当达到指定的阈值时立即降低下游依赖的优先级。在指定的时间内,系统不会调用该不稳定的资源,避免应用受到影响,从而保障应用高可用性,当指定时间过后,再重新恢复对该资源的调用。用于避免局部不稳定因素(某个慢调用、异常服务)导致整体的雪崩。

参数

描述

统计窗口时长

统计的时间窗口长度,取值范围为1秒~120分钟。

阈值类型

选择慢调用比例异常比例、异常个数阈值类型

慢调用比例需要设置允许的慢调用RT(即最大的响应时间),请求的响应时间大于该值则统计为慢调用。规则开启后,在单位统计时长内请求数目大于设置的最小请求数目,并且慢调用的比例大于阈值,则接下来的熔断时长内请求会自动被熔断。

异常比例需要在降级阈值中设置触发熔断的异常比例。规则开启后,在单位统计时长内业务异常数目大于设置的最小请求数目,并且异常的比例大于阈值,则接下来的熔断时长内请求会自动被熔断。

    异常个数:需要在降级阈值中设置触发熔断的异常个数。规则开启后,在单位统计时长内业务异常数目大于设置的最小请求数目,则接下来的熔断时长内请求会自动被熔断。

降级阈值

触发阈值类型的阈值

熔断时长

即熔断触发后持续的时间。资源进入熔断状态后,在配置的熔断时长内,请求都会快速失败。

是否开启

打开开关表示启用该规则,关闭开关表示禁用该规则。

最小请求数目

触发熔断的最小请求数。

熔断策略

熔断器进入恢复阶段(半开启状态)的恢复策略。

单次探测恢复:经过熔断时长后,熔断器会对接下来的一个请求进行探测,若该请求符合预期(不为慢调用或没有异常),则结束熔断;否则重新回到熔断阶段。

渐进式恢复:需要设置恢复阶段数和每步最小通过数目。经过熔断时长后,熔断器按照设定的恢复阶段数进行渐进式恢复,若该阶段内请求达到一定量即每步最小通过数目,则触发检查。检查的请求若都未超过阈值,则逐步提高允许通过的请求比例,直到请求完全恢复;若某一步的指标超出阈值,则重新回到熔断阶段。

  • 主动降级规则

    主动降级规则可以指定对某些接口进行降级,被降级的接口会触发自定义的降级行为而不会执行原有的逻辑。主要用于在流量高峰时保障核心功能而将非核心功能返回预先准备的数据。

参数

描述

关联行为

统计表示开启该降级规则后,该接口调用的行为。默认行为对应应用设置页面基础设置中的模块适配设置Web的配置

若需要新增行为,单击新增行为,完成以下配置,然后单击新增

参数

描述

行为名称

该行为的名称。长度不超过128个字符,同个应用内名称不能重复。

针对的资源类型

支持Web和Rpc两种类型,此处仅为Web。

Web限流处理策略

定义Web接口访问触发某种规则后的行为表现。目前支持以下两种策略:

自定义返回:需设置HTTP返回状态码、返回内容的格式和返回的内容。表示Web接口访问触发规则后返回自定义的内容。

跳转到指定页面:需设置指定跳转的URL。表示Web接口访问触发规则后系统会跳转指定的页面URL。

HTTP返回状态码

默认为429。当Web限流处理策略为自定义返回时,需要填写。

返回content-type

设置返回内容的格式为普通文本(TEXT)或JSON。当Web限流处理策略为自定义返回时,需要填写。

HTTP返回文本

输入当Web接口访问触发规则后返回的内容。当Web限流处理策略为自定义返回时,需要填写。

跳转地址

输入当Web接口访问触发规则后系统会跳转的页面URL。当Web限流处理策略为跳转到指定页面时,需要填写。

 

参数

描述

行为名称

该行为的名称。长度不超过128个字符,同个应用内名称不能重复。

针对的资源类型

支持Web和Rpc两种类型,此处仅为Rpc。

缓存实例

是否缓存返回值。若开启,则会缓存生成的Fallback对象,在该行为触发时,均复用同一对象。

Rpc限流处理策略

定义Rpc接口访问触发某种规则后的行为表现。目前支持以下两种策略:

自定义返回:自定义返回结果。需设置返回类型和返回的内容,表示Rpc接口访问触发规则后返回自定义的实体类。

自定义异常:抛出自定义异常。需设置异常的类名和异常文本,表示Rpc接口访问触发规则后系统会返回指定的异常信息。

返回类型获取方式

填充返回值类名的方式,分别为:

手动输入:选择手动输入模式,需要填写自定义返回值的全限定类名(返回值类名),然后单击校验进行有效性校验,校验通过后可以创建行为。

自动探测:选择自动探测模式,需要选择创建RPC行为的接口方法(行为关联方法),控制台会根据选择的行为关联方法,自动填充方法返回值类名,然后填写完成对象内容(JSON格式)后可以创建行为。

行为关联类名

当返回类型获取方式为自动探测时,需要选择当前Rpc行为关联的接口方法,方法返回值类型即为当前自定义返回值的类型。

返回值类名

选择Rpc限流处理策略为自定义返回时,需填写的类名称路径。

对象内容

选择RPC限流处理策略为自定义返回时,填写当Rpc接口访问触发规则时返回结果的对象内容(JSON格式)。

异常类名

选择Rpc限流处理策略为自定义异常时,需填写的异常类名称路径。

异常信息文本

选择Rpc限流处理策略为自定义异常时,填写Rpc接口访问触发规则后抛出自定义异常的文本信息。

  • 热点规则

    热点规则通过分析统计参数,即资源调用过程中的调用次数较高的参数,并根据配置的热点规则对包含热点参数的资源调用进行限流,保护系统稳定性。适用于针对某些热点数据中访问频次最高的Top数据进行控制的场景。

参数

描述

参数位置索引

埋点传入参数的索引位置。

统计维度

可选择通过请求数或并发线程数。

通过请求数:限制一段时间内的调用次数。

并发数:限制该资源调用的并发数。

统计周期时间

统计窗口时间长度(单位为秒)

单机阈值

是作用于每个热点参数的阈值。

流控效果

当统计维度为通过请求数时,可以选择流控效果来处理被拦截流量。

快速失败:达到阈值时,立即拦截请求。该模式下可以额外设置一个缓冲请求数,即针对突发请求额外允许的请求数目。

排队等待:请求匀速通过,允许排队等待,通常用于消息队列削峰填谷等场景。需设置具体的超时时间,排队时会计算预计的排队时长,若超过最大超时时间则请求会直接被拒绝。

是否开启

打开开关表示启用该规则,关闭开关表示禁用该规则。

  • 自适应流控

    系统支持自适应流控或手动设置系统规则,自适应流控是根据系统的CPU使用率自动动态地调整应用程序的入口流量;系统规则是从整体维度手动设置规则,对应用入口流量进行控制。目的都是为了让系统的入口流量和系统的负载达到一个平衡,保证系统在最大吞吐量状态下稳定运行。

参数

描述

统计维度

CPU使用率当系统CPU使用率超过阈值即触发系统保护,阈值设置范围为0.0~1.0(代表0%~100%)。

Load限当系统的Load超过阈值,且系统当前的并发线程数超过系统容量时才会触发系统保护。

线程数:当单台机器上所有入口流量的并发线程数达到阈值即触发系统保护。

入口平均RT:当单台机器上所有入口流量的平均RT达到阈值即触发系统保护,单位是毫秒。

入口总QPS:当单台机器上所有入口流量的QPS达到阈值即触发系统保护。

阈值

对应统计维度的阈值。

是否开启

打开开关表示启用该规则,关闭开关表示禁用该规则。


接口监控

接口监控主要展示该应用所有接口的通过QPS、拒绝QPS、异常QPS、RT、并发数据等监控信息。


操作日志

操作日志记录限流降级相关操作日志,您可以查看所有的限流降级操作信息,如操作时间、类别、操纵内容和操作等。


云原生工具箱

云原生工具箱(Cloud Native Tools,简称cntools)针对云原生应用架构的研发提效工具,可提高在开发、测试、调试阶段的效率。 

典型应用场景包括:

  • 审计终端:提供命令审计的Webshell终端,并支持对多Pod进行切换操作。

  • 文件管理:支持Pod内的文件浏览与下载。

安装与访问配置

云原生工具箱在使用前,需要先安装插件并进行服务访问配置。

1.插件安装与卸载

1.插件安装

在监控运维-已发布应用菜单,选择已发布的应用,进入已发布应用页面,选择云原生工具箱菜单,进入云原生工具箱概览页面。点击安装按钮,等待云原生工具箱安装完成。云原生工具箱为每个云容器引擎实例1个,用户不需要在同个云容器引擎实例下再次安装插件。

2.插件卸载

当解绑服务访问配置的负载均衡实例(公网)之后,可点击卸载按钮,卸载云原生工具箱插件。

3.安装状态查询

插件的安装与下载为异步操作,用户可点击按钮刷新安装状态。


2.服务访问配置 

绑定负载均衡(公网) 

进入云原生工具箱概览页面,当已安装插件之后,点击添加按钮,可配置负载均衡(公网),之后用户可点击跳转链接,访问云原生工具箱主页。 

  •  选择ELB:选择已有点负载均衡(公网)实例。 

  • 外部流量策略:选择Cluster。 

  • 添加新的监听:设置云原生工具箱的访问端口。

  • 注:设置负载均衡(公网),用户可以选择已有的ELB,或前往天翼云产品->网络与CDN分类,选择弹性负载均衡产品,订购开通公网ELB,新的ELB需要与当前部署环境在相同VPC下才可使用。

配置完成后,点击进入云原生工具箱按钮,可进入云原生工具箱主页。

2.修改负载均衡(公网) 

点击按钮,进入负载均衡(公网)编辑页面,修改插件的访问端口。 

3.修改负载均衡(公网) 

点击按钮,可解绑负载均衡(公网),解绑后,云原生工具箱不可访问。 

4.刷新状态 

绑定、解绑操作为异步操作,用户可通过点击按钮,可查看云原生工具箱的访问状态。当显示为IP+端口的形式时,表示用户可访问云原生工具箱。


审计终端

用户可通过云原生工具箱连接Pod内的容器,打开终端进行调试等操作,云原生工具箱会对输入的命令进行审计,记录审计日志。

1.打开终端

点击打开终端按钮,可打开Pod的终端,在此终端输入命令后,cntools会记录输入的命令。

Pod审计日志

点击Pod审计日志按钮,进入终端命令查询页面,可对终端命令进行查询、下载操作。


文件管理

打开终端后,可对Pod内的文件进行管理。包括文件、文件夹浏览,文件预览,文件、文件夹下载操作。


YoAF6i8e5yc8