活动首页 >日程安排

业务驱动的超大规模智能运维实践

时间: 09 月 23 日 15:20 - 16:30
内容介绍:

〇 分享简介 〇

随着企业规模的不断扩大和业务的复杂化,对运维的要求也越来越高,超大规模智能运维成为了许多企业面临的痛点。在不稳定的环境下,运维团队在复杂性管理、故障检测与诊断、弹性伸缩、自动化运维任务和容量规划等方面面临着一系列的挑战。

本次分享将结合京东在业务驱动方面的理念和实践,面对庞大的业务规模、复杂的系统架构和高效的故障排查需求。如何更深入了解业务需求更好地规划和优化运维策略,确保业务系统的稳定性和可用性。此外,也会从智能运维角度,分享利用机器学习、自动化和监控技术,实现了智能故障检测、系统弹性伸缩和自动化运维,从而显著提升运维效率和响应速度。

〇 分享收益 〇

目标 

提升企业的运维效率和稳定性,降低故障风险,为企业的可持续发展提供有力支持。

成功要点

以业务驱动为理念,有针对性的规划和优化运维策略,同时引入AIOPS,持续改进和优化自动化和智能化技术,减少人工运维成本和不确定因素,提高运维效率和可靠性。

启示

在超大规模智能运维实践中,需要不断探索创新,及时采纳新技术和最佳实践,保持对技术发展的敏感性,寻找适合自身业务需求的解决方案。

〇 分享亮点 〇

1. 海量服务面临的挑战:在不稳定的环境中,构造一个稳定的系统

2. 与业务场景结合,海量服务下的架构设计策略和技术运营,

3. Serverless弹性伸缩:运用容器自动弹扩缩能力,应对S级营销活动的爆发性流量难题

4. 从AIOPS到SRE:将软件工程的方法应用于运维领域,通过智能化、自动化、监控和持续改进来确保系统的高可用性、高性能和高效率运行。

5. QA

日程嘉宾
2023中国软件研发创新科技峰会
魏子聪
京东商城架构师
负责大规模海量复杂系统的架构设计和智能运维,专注于构建面向海量用户的高可用服务。擅长在海量服务下的架构设计策略和技术运营,巧妙的运用过载保护、限流防刷、弹性伸缩等设计原则和策略,有效地解决应对爆发性流量的难题,有着丰富的实践经验。通过引入AIOps,利用机器学习和自动化技术,建立起故障预警、实时监控以及自动化决策一体化智能运维体系,大大提升系统的稳定性和运维效率。 曾认知微软技术中心和腾讯电商,并于2014年加入京东。在职业生涯中,跨足多个领域参与过多个大型系统的设计和实施,包括政府采购系统、地铁系统、内部OA和ERP系统、用户画像、推荐系统、用户增长以及数智化运营等,擅长将不同领域的思维方式和方法结合起来,以发现创新的解决方案。