分布式缓存Redis

告警配置

2024-05-21 03:24:41

分布式缓存Redis管理控制台支持监控告警功能,同时支持对事件告警或阈值告警进行配置。

操作步骤

1. 登录 Redis管理控制台

2. 在管理控制台右上角选择实例所在的区域。

3. 在实例列表页,单击目标实例名称进入实例详情管理。

4. 点击【告警管理】,进入告警配置管理页面。

 

5. 设置通知组,先"新建联系人组",再新建联系人,填写告警通知联系方式

 

 

 

6. 点击"创建通知策略",设置通知信息模板

 

 

7. 创建告警规则

 

 

8. 查看已设置的告警规则,在该页面可新增、删除告警规则;

 

告警指标以及告警策略配置建议

指标名称

取值范围

说明

告警阈值设置建议

告警处理建议

指标名称

取值范围

说明

告警阈值设置建议

告警处理建议

redis客户端连接数过高告警

0-10000

该指标用于统计redis的已连接的客户端数

建议告警阈值:8000

应避免连接数超过最大上限,可以根据您的实际业务情况调整。

redis缓存命中率低

0-100%

该指标用于统计Redis的缓存命中率,其命中率算法为:keyspace_hits/(keyspace_hits+keyspace_misses)单位:%

建议告警阈值:80%

建议:较低的缓存命中率可能表示缓存数据不够完整或缓存策略不够有效,导致大量请求无法从Redis缓存中获取数据,增加了对后端资源的访问负载。建议合理设置缓存过期时间、使用合适的缓存淘汰策略、对热点数据进行预热等方式提高缓存命中率。

redis等待阻塞命令的客户端数告警

0-10000

该指标用于被阻塞操作挂起的客户端的数量。阻塞操作如BLPOPBRPOPBRPOPLPUSH

根据业具体业务制定,建议阈值:50

处理:检查是否存在慢请求;建议:优化调整Redis的配置参数,例如最大连接数、最大客户端等,确保其数值适当。

redis内存使用率告警

0-100%

该指标用于统计redis实例当前节点的内存使用情况。

建议告警阈值:70%

处理:检查是否可以清理不必要的redis内存数,降低内存使用率。建议:如果无法清理现有的缓存数据,建议进行扩容;

redis cpu使用率告警

0-100%

该指标用于统计redis实例当前节点的cpu使用情况。

建议告警阈值:70%

处理:检查当前业务是否存在查询大key、热key的请求等建议:如果存在大key、热key,请参考常见问题中的为了减少大Key和热Key过大,有什么使用建议?

access客户端连接数告警

0-10000

该指标用于统计代理节点的已连接的客户端数

告警阈值:8000

主处理:检查业务请求量是否为正常业务,如果业务请求正常可以持续观察一段时间;建议:应避免连接数超过最大上限,可以根据您的实际业务情况调整。检查业务是否当前连接数量是否正常;

access qps过高告警

0-100000

该指标用于统计代理节点的qps

告警阈值:10000

处理:检查业务请求是否为正常业务,如果业务请求正常可以持续观察一段时间;


CxaNUnskgWpY