微信分享
数智运维领航计划(PILOT计划)第一期:系统可靠性与连续性专场

使用微信扫一扫分享到朋友圈

活动分享
数智运维领航计划(PILOT计划)第一期:系统可靠性与连续性专场

使用微信扫一扫进入小程序分享活动

活动详情

数智运维领航PILOT(Project of DIgital InteLligent OperaTions)计划由中国信通院云计算与大数据研究所发起,旨在帮助企业构建更加智能、高效和可靠的运维体系,保障系统稳定运行,持续提升系统可靠性,为企业的数字化转型和业务发展提供坚实的技术支持。欢迎加入我们,共同开启数智运维新篇章!


在当今数字化转型步伐不断加快的时代,IT 应用系统的稳定运行成为了企业的业务正常运转的重要基础,SRE 的概念逐渐深入到企业内部。我们都知道 SRE 是一个体系化的工程,建设涉及的内容繁多,比如日常需求处理、容量规划、资源部署、监控告警、预案梳理、灾备演练、OnCall 值班、应急事件响应、故障处理、运维自动化建设等等。那么如此繁冗的体系,该如何落地?企业又该增强运营能力?


4月13日,由中国信通院主办,高效运维社区、DevOp 时代社区协办的数智运维领航计划(PILOT计划)第一期:系统可靠性与连续性专场将在北京隆重召开。活动中将邀请银行、证券、通信、互联网等一线企业专家共同探探分享,体系化的讲解SRE建设的思考与经验。


商务赞助及合作:周 静:130 7118 2180(微信同号)任 怡:132 6958 7068(微信同号) 

报名咨询:李 伟:130 2108 2989(微信同号)        刘毅菲:132 6188 5689(微信同号)

渠道合作:刘 欣:158 0111  5386(微信同号)



活动嘉宾
  • 尚梦宸
    中国信息通信研究院
    云计算与大数据研究所
    审计与治理部 工程师
    演讲主题: 研发运营体系下的系统稳定性探索与实践
    主题简介:
    随着数字化时代的到来,企业和组织对于其业务系统的可靠性和连续性要求越来越高。传统的运维方式已经不能满足这种需求,需要一种更加系统化、工程化的方法来保障系统的稳定性和可用性。SRE研发运营系统可靠性与连续性工程帮助组织建立高可靠、高效的系统保障体系,确保系统的稳定运行。
    听众收益:
    1、了解 SRE 系统可靠性与连续性工程标准背景故事;
    2、了解研发运营系统可靠性与连续性工程能力建设架构;
    3、了解如何通过提升研发侧与运营侧保障能力提升系统稳定性;
    4、SRE 研发运营系统可靠性与连续性工程评估最新动态。
    个人简介:尚梦宸,DGA-分布式系统稳定性实验室负责人,AIOps 国际标准编辑人,从事 DevOps、AIOps、SRE 等发展研究与行业标准制定工作,是《研发运营一体化( DevOps )能力成熟度模型》系列标准,《云计算智能化运维( AIOps )能力成熟度模型》系列标准、《中国 AIOps 现状调查报告(2022)》等的编写成员之一。
  • 张雁丽
    中国移动通信集团北京有限公司
    SRE 运维专家
    演讲主题: OnCall 驱动下的 IT 系统稳定性运营实践
    议题简介:北京作为国家的战略核心,北京移动 IT 支撑系统稳定性具有放大镜效应,如何执行系统保障至关重要。基于以上背景,北京移动依据国家信息安全标准、行业最佳实践制定分级保障要求,设置 OnCall 策略,并基于大模型、元宇宙打磨出一套高效响应、精准定位、快速恢复的 OnCall 机制。该机制依据节假日、上线变更、营销活动、社会重大活动等不同的场景,分级制定保障要求及标准。通过实时获取故障信息、科学调配资源配置,确保出现异常时,能够迅速调动跨部门专业团队进行问题排查与修复,从而最大限度的降低系统故障对业务连续性的影响。
    演讲提纲:
    1、实施背景与目标
    2、运营商故障管理实践
    3、未来展望
    听众收益: 1、了解北京移动 IT系统分级保障实践,共同探讨、优化保障方法
    2、了解大模型、元宇宙等前沿技术在IT系统保障中的应用方法与作用
    个人简介:张雁丽,中国移动通信集团北京有限公司,从事 IT 系统运维工作。
  • 陈 刚
    高效运维社区
    资深 DevOps 专家
    演讲主题:【超级五分钟】拨云见月:提升新时代下的运维能力认知
    个人简介:陈刚,高效运维社区 资深 DevOps 专家,超过20年 IT 职位生涯,聚焦于技术运营及运维全领域。工作遍及电信,日本软件开发企业,美国电商公司,国内头部金融企业。使用 python 、js 、go、java 等语言开发过各种 IT 应用。技术领域涵盖持续交付流水线,技术运营,K8s 容器化集群技术转型和 AI 项目运维。全程参与过200+以上的研发团队进行 DevOps 落地实施。10年以上团队管理经验。
    已出版持续交付类书籍,GOPS 2018全球运维大会(2018深圳站)专题讲师,SRE Foundation及DevOps Enterprise Coach 证书。
  • 腾讯PCG SRE研发负责人王晓川
    王晓川
    腾讯PCG SRE研发负责人
    演讲主题: 腾讯 SRE 质量运营体系建设与实践
    议题简介:提升产品稳定性是每个SRE团队的核心工作,但是稳定性提升又是非常复杂非常多元的,可持续投入的领域非常多。如何能够通过客观数据探明产品稳定性的不足,持续观测产品稳定性的改进提升,科学有效地决策人员投入是非常关键的。在此需求背景的基础上,参考业界领先的解决方案,实践Google SRE的核心理念,引入SLO与On-Call的管理机制。经过一年多的探索实践,建立起PCG质量运营体系,覆盖腾讯视频、QQ、腾讯文档、腾讯新闻、内部各平台中台等几十个产品,实现故障运营各环节的标准化,满足各个角色的使用需求,实现数据驱动,科学决策的质量运营体系。
    演讲提纲:
    1. 质量体系总体建设思路 – 理论层面 与 产品层面,从顶层具象质量体系概念
    2. 质量体系建设过程中所走的实践与成果 – 包括SLO管理、On-Call机制落地、MTTx各环节标准化,质量数据模型落地,以及过程中所走的弯路与最终可以得到的收益。
    3. 未来要在质量体系建设中继续做的事情
    听众收益:
    1. 从宏观视角了解SRE质量运营体系所包含的核心内容,了解如何科学的量化与提升产品稳定性
    2. 详细介绍SRE质量运营体系在鹅厂的落地经验,提供其间遇到问题的解决思路与所需工具,以及最终的价值收益
    个人简介:
    14年北京大学毕业,先后在工行、美团、腾讯任职,现任腾讯PCG SRE研发团队负责人,负责SRE相关领域的建设,主要领域包括质量运营体系、可观测平台、混沌工程、技术风险管理等。
  • 活动日程
    2024-04-13
    2024-04-13
    14:00-14:40

    尚梦宸@《研发运营体系下的系统稳定性探索与实践》

    2024-04-13
    14:40-15:20

    张雁丽@《北京移动 IT 运维转型经验》

    2024-04-13
    15:20-16:00

    陈刚@《中国企业 SRE 落地的方法论》

    2024-04-13
    16:00-16:40

    王晓川@《腾讯 SRE 质量运营体系建设与实践》

    2024-04-13
    16:40-17:00

    话题互动

    2024-04-13
    17:00-17:10

    结束:下期精彩预告

    尚梦宸@《研发运营体系下的系统稳定性探索与实践》

    张雁丽@《北京移动 IT 运维转型经验》

    陈刚@《中国企业 SRE 落地的方法论》

    王晓川@《腾讯 SRE 质量运营体系建设与实践》

    话题互动

    结束:下期精彩预告

    活动门票
    活动筹备中
    售票推广中
    活动结束
    选择票
    门票名称
    单价(¥)
    截止时间
    数量
    沙龙报名
    免费
    2024-04-13 17:00
    已售罄
    此门票需要主办方审核

    退票说明:不支持退票

    票价
    0
    活动主办方