活动首页 >日程安排

GödelCloud:字节跳动大规模集群管理系统实践

时间: 10 月 23 日 13:30 - 16:30
内容介绍:

〇分享简介〇 

随着字节跳动业务领域的不断扩展,公司内部逐渐发展形成了丰富多样的业务形态,例如基于自研 RPC 框架的微服务、感知单机CPU 拓扑的广告服务、FaaS 类的弹性计算服务、偏离线计算的训练和机器学习服务、满足不同特性需求的存储系统等。通常来说,特定的业务场景需要独占机器部署,并基于此演化出分裂的运维体系,其结果是,机器整体利用率低下,资源流转效率不高。

从基础架构视角,头条希望基于 GödelCloud 这样一套云原生操作系统承载内部所有业务场景以实现:向上,提供云原生标准的编排调度和容器封装能力,最大化剥离云应用中的非业务代码部分,支持业务系统快速迭代;向下,利用资源池化和混合部署技术,有效提升数据中心整体资源利用率。

〇分享收益〇

目标

1. 字节跳动容器化历程

2. 大规模集群管理系统实践和技术演进

3. 资源优化实践,有效提升资源利用率

4. 云原生运维&运营实践经验

成功要点:

从数据中心整体视角看待容器编排调度系统的设计和演进思路

启示:

1. 基于 Gödel/K8S 调度系统,整合在离线计算池,统一调度

2. 作为在线服务、大数据、机器学习以及存储服务等业务的基础底座,提供新的资源玩法以及调度能力

3. 面向下一代集群管理系统,整合新的技术尝试

〇分享亮点〇

1. 字节跳动容器化历程

2. K8S 云原生实践

3. 混合部署和调度融合

4. 云原生运维体系建设

5.QA



日程嘉宾
2021中国软件研发管理行业技术峰会
向武
字节跳动基础架构部门编排调度团队负责人
本硕毕业于清华大学,曾先后就职于Google和Hulu,现任职字节跳动基础架构部门编排调度团队负责人,近10年技术架构和管理经验,在大数据、广告系统和分布式调度系统等领域拥有丰富的研发和架构经验。目前主导推进字节的业务系统、大数据、ML和存储系统全面云原生化改造和落地,并基于离在线混合部署等项目提升数据中心整体利用率。