聊聊稳定性保障那些事 性能专题
一个应用是否稳定很重要。如果经常出现问题,会极大的影响用户体验,甚至带来直接的经济损失。那么如何保障应用的稳定性?其实是有一些原则和方法的。在本次分享中,我会和大家聊聊常见的稳定性问题有哪些,稳定性保障方面有哪些原则需要遵守。另外,我会以案例的方式说说我们在稳定性保障方面都做了那些工作。
一、 常见的稳定性问题
在日常测试正常,上线后出现问题
一个服务出问题,整个系统崩溃
调用关系复杂,很难追查问题
线上机器负载突然特别高,不知所措
线上突然出现问题,自己又恢复了
二、稳定性保障的原则
环境一致原则
适当隔离原则
有效监控原则
充分预案原则
追根溯源原则
三、稳定性保障的案例
我们在保障环境统一方面做的一些努力
服务物理隔离,并通过熔断等手段降低依赖
如何设计和使用服务调用链分析系统
设计多种预案,快速解决突发问题
解决线上问题的思路和手段