活动首页 >日程安排

携程混沌工程演进之路

时间: 10 月 23 日 13:30 - 15:00
内容介绍:

〇 分享简介 〇

随着业务发展和微服务的大行其道,给系统引入了更多的复杂性,微服务体系中任何一个环节发生故障都有可能对业务造成灾难影响,这对如何建设高可用性、强容错性、可观测性的服务治理体系提出了更高的要求。混沌工程通过主动攻防的方式,验证系统架构、组织机制、人员能力在应急防御时的有效性,从而及时对脆弱点进行加固,保障业务高速发展时系统的稳态运行。

携程经过对混沌工程的探索,逐步演化出了故障演练平台及常态化演练标准,本次将介绍携程在混沌工程落地方面的实践经验。


〇 分享收益 〇


1. 目标:

理解混沌工程的原理并了解其在企业内落地的方案

2. 要点:

如何针对典型历史故障设计实验场景;

如何度量系统稳态;

如何控制爆炸半径;

如何实现自动化演练;

如何在企业内落地及推广。


〇 分享亮点 〇


1. 混沌工程的背景

在复杂的微服务架构下,如何应对无处不在的故障

2. 携程混沌工程体系建设

以混沌工程”五条原则“及“成熟度模型”为指导,结合携程现状,建设故障演练平台

3. 携程混沌工程实战案例分享

从单一应用演练到数据中心演练

从人工值守演练到自动化演练

4. 未来规划与思考

拥抱面向失效设计的文化

持续降低演练成本

建立全面的演练管理体系

5 . QA


日程嘉宾
2021中国软件研发管理行业技术峰会
刘琦
携程SRE专家
十余年大型网站质量保障方面的工作,对分布式系统的可用性治理、容灾等方面具有丰富的经验。目前专注于混沌工程领域,负责携程故障演练平台的建设,推进混沌工程在携程的落地。