压测性能上不去,如何检测?
检查后端云主机的负载状态,如果CPU达到100%,可能是后端应用达到性能瓶颈。
查看流量是否超过绑定到弹性负载均衡的EIP的带宽,带宽超限后,会有大量丢包和请求失败,影响压测性能。
如果是短连接测试,可能是客户端端口不足导致建立连接失败,可以通过客户端处于time_wait状态的连接数量来判断。可通过增加客户端IP来解决。
后端云主机的监听队列backlog满了,导致后端云主机不回复syn_ack报文,使得客户端连接超时。可以通过调整net.core.somaxconn参数来调大backlog的上限值。
负载均衡请求不均衡,怎样排查?
检查是否开启了会话保持。如果配置了会话保持,而客户端的个数又比较少时,很容易导致不均衡。
检查后端云主机的健康检查状态是否正常,特别要关注下是否有健康检查状态一会正常一会异常的情况。健康检查异常或者状态切换都会导致流量不均衡。
检查负载均衡算法是否是源IP算法。此时同一个IP发过来的请求都会分发到同一个后端,导致流量不均衡。
将云主机添加到ELB后端时是否设置了权重,权重不同,分发的流量也不同。