第79期百度技术沙龙,我们邀请了支撑全百度数十万规模服务器、在运维工具和平台研发方面经验丰富的百度云智能运维团队,从系统的体系架构设计和线上系统的高效运维出发,向大家介绍百度运维的技术演进之路。分享百度在AIOps、DevOps上的实战经验,并以百度统一前端接入(Baidu Front End, BFE)、数据库以及Redis三个具体系统为例,介绍百度在系统架构设计和变更、监控、故障处理和性能管理等贯穿线上系统生命周期的运维层面上,如何保证系统的高可用。
确保大型分布式复杂软件系统的可用性历来是一个严峻的技术挑战,具体而言,这种挑战一方面来自于系统的体系架构设计,另一方面来自于线上系统的高效运维,二者相辅相成。本次分享将从百度运维的技术演进切入,介绍百度如何从最初的手工操作为主发展到如今领先业界的AIOps实际落地;然后以变更管理作为一个典型的例子,阐述百度在实践DevOps方面的一些体会;最后,以百度统一前端接入(Baidu Front End, BFE)、数据库以及Redis为例,介绍保证线上系统高可用的实战经验。
讲师简介:章淼,百度架构师。2004年清华大学计算机系博士毕业。1997年至2006年在清华大学从事互联网协议和网络基础架构的研发。2006年至2012年在多家公司从事用户产品的研发工作。2012年加入百度,一直从事百度统一前端(BFE:Baidu Front End)的研发。热心代码和研发质量的提升,是百度Python和Golang两个编程语言规范委员会的成员;热心教育,在百度内组织“代码的艺术训练营”,传播正确的软件工程理念。
演讲概要:网络接入服务是用户和后台服务间的桥梁,对服务质量影响巨大。历时6年打造的百度统一前端(BFE:Baidu Front End)平台,目前已经覆盖百度的大部分流量,每日转发数千亿请求,并为百度的各产品线提供流量调度、防攻击、数据统计等附加功能。本次演讲将介绍BFE研发中包括网络协议、网络安全、高性能系统在内的多个技术方向,以及提升平台稳定性和研发效率的研发方法优化。