CommunityOverCode - The ASF Conference Asia 2023 阿帕奇软件基金会亚洲大会

免费报名中

25062 人关注

时间 2023-08-18 09:30 ~ 08-20 18:00

地址北京海淀区丽亭华苑酒店

活动由 The ASF 主办

免费报名中

25062 人关注

微信分享

使用微信扫一扫分享到朋友圈

活动分享

使用微信扫一扫进入小程序分享活动

活动详情

CommunityOverCode (原 ApacheCon) 是 Apache 软件基金会（ASF）的官方全球系列大会。自 1998 年以来--在 ASF 成立之前 -- ApacheCon 已经吸引了各个层次的参与者，在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。CommunityOverCode 通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式，展示 Apache 项目的最新发展和新兴创新。

CommunityOverCode 展示了无处不在的 Apache 项目的最新突破和 Apache 孵化器中即将到来的创新，以及开源开发和以 Apache 之道领导社区驱动的项目。与会者可以了解到独立于商业利益、企业偏见或推销话术之外的核心开源技术。

CommunityOverCode 项目是动态的，每次活动的内容都是由精选的 Apache 项目开发者和用户社区直接推动的。CommunityOverCode 提供了最先进的内容，在一个协作、厂商中立的环境中，展示了大数据、云计算、社区发展、金融科技、物联网、机器学习、消息中间件、编程、搜索、安全、服务器、流媒体、网络框架等方面的最新开源进展。

本次会议将以线下的方式于 2023 年 8 月 18 日至 8 月 20 日在北京丽亭华苑酒店举行，并进行线上直播，欢迎各位嘉宾的光临。

活动门票

活动筹备中

售票推广中

活动结束

选择票

门票名称

单价(￥ )

截止时间

数量

单日普通票

￥ 299

2023-08-20 18:00

已售罄

门票包含：
8 月 18 日至 20 日任意一天的 Keynote 演讲
8 月 18 日至 20 日任意一天的技术分论坛
参会日当日的工作午餐
大会纪念礼包

学生/Committer 单日普通票

仅邀请

￥ 199

2023-10-08 18:00

已结束

此门票需要主办方审核

需审核，Committer 需在购票时提供 Apache Committer ID，学生需在报名时提供 edu 邮箱，并凭有效期内的学生证签到入场

门票只能通过使用邀请码获得

三日普通票

￥ 599

2023-08-20 18:00

已售罄

门票包含：
8 月 18 日至 20 日三日的 Keynote 演讲
8 月 18 日至 20 日三日的技术分论坛
8 月 18 日至 20 日三日的工作午餐
大会纪念礼包

学生/Committer 三日普通票

￥ 399

2023-08-20 18:00

已售罄

此门票需要主办方审核

需审核，Committer 需在购票时提供 Apache Committer ID，学生需在报名时提供 edu 邮箱，并凭有效期内的学生证签到入场

个人赞助门票（单日）

￥ 999

2023-08-20 18:00

已售罄

门票包含：
8 月 18 日至 20 日任意一天的 Keynote 演讲
8 月 18 日至 20 日任意一天的技术分论坛
参会日当日的工作午餐
大会纪念礼包
8 月 18 日讲师欢迎晚宴门票

个人赞助门票（三日）

￥ 1,299

2023-08-20 18:00

已售罄

门票包含：
8 月 18 日至 20 日三日的 Keynote 演讲
8 月 18 日至 20 日三日的技术分论坛
8 月 18 日至 20 日三日的工作午餐
大会纪念礼包
8 月 18 日讲师欢迎晚宴门票

Community Leadership Workshop 培训套票

￥ 6,999

2023-08-20 18:00

已售罄

此门票需要主办方审核

门票包含：
8 月 17 日会前的 Community Leadership Workshop 闭门培训
8 月 18 日至 20 日三日的 Keynote 演讲
8 月 18 日至 20 日三日的技术分论坛
8 月 18 日至 20 日三日的工作午餐
大会纪念礼包
讲师欢迎晚宴门票

SPEAKER

仅邀请

免费

2023-08-20 18:00

已售罄

此门票需要主办方审核

门票只能通过使用邀请码获得

SPONSOR

仅邀请

免费

2023-08-20 18:00

已售罄

此门票需要主办方审核

门票只能通过使用邀请码获得

赞助商工作人员

仅邀请

免费

2023-08-20 18:00

已售罄

此门票需要主办方审核

门票只能通过使用邀请码获得

优惠或邀请码

使用优惠或邀请码

票价

￥ 0

活动已结束

论坛主席

姜宁

Keynote / 性能工程

谭中意

Keynote / 人工智能 / 机器学习

活动日程

按时间

全部

2023-08-18

2023-08-19

2023-08-20

按会场

全部

鸿运厅1

鸿运厅2

鸿运厅3

金辉厅1

金辉厅2

金辉厅3

金辉厅 5

天鸿厅3

主会场

按专题

全部

主题演讲

人工智能 / 机器学习

API / 微服务

数据存储与计算

云原生

开源社区

性能优化

孵化器

物联网 / 工业物联网

消息系统

远程过程调用 / 服务网格

流处理

Web 服务器/ Tomcat

数据湖与数据仓库

DataOps

OLAP & Data Analysis

通用

重复演讲

2023-08-18

09:30 - 12:00

Keynote 主题演讲

主会场

2023-08-18

09:30 - 09:35

大会组委会欢迎致辞

2023-08-18

09:35 - 09:40

陆首群和David多位大咖为大会致辞

2023-08-18

09:40 - 10:10

The ASF: Past and Future

Since 1999 when The Foundation was established, the open source landscape has changed in many ways but the founding principles remain. The ASF continues to operate as a charity to serve the public interest. The projects, under the direction of the Project Management Committees, are the primary governing bodies, subject to oversight by the Board of Directors.

Over the past few years, both internal and external events have required changes to the way the ASF operates:
Governments have recognized that open source software presents new security challenges to the way the internet works;
Privacy concerns require changes to the ASF approach to transparency;
The ASF needs to recognize that new communications products and protocols change the way communities interact, both within and external to them.

嘉宾

Craig Russell

Apache 软件基金会董事

2023-08-18

10:10 - 10:30

Introduction to Apache Doris 2.0

如果说在过去 Apache Doris 更多是服务于高性能在线实时分析场景的话， 2022年底发布的 1.2 版本无疑标志着 Apache Doris 能力边界得到进一步拓展，越来越多用户开始基于 Apache Doris 构建高效的实时数据分析服务，而最近发布的 2.0 版本更是全面强化了 Apache Doris 在半结构化数据分析、混合工作负载以及数据湖联邦分析等场景下等场景下的能力。在本次的分享中，我将会为大家揭秘 Apache Doris 2.0 版本的最新重磅特性。同时结合过去几年里社区研发方向的思考，将会分享后续社区的重要发展方向以及版本迭代的详细计划。

嘉宾

马如悦

Apache Doris 项目创始人 & 飞轮科技 CEO

2023-08-18

10:30 - 11:00

人间清醒：开源的最深层次动机

通常而言，人们认为开源是一个利他行为，但我们知道，所有的利他都有着利己的基础，那么开源开发者的心理动机到底是怎样的？他们是如何考虑自身的利益的？是什么让他们在没有任何实际利益回报的情况下，仍然不断地输出和贡献？对于企业而言，又是怎么回事？企业难道不应该更注重实际利益吗。本演讲试图拨开这些迷雾，展示一个掩藏在利他表象之下的最真实也是最能让人理解的开源动机。

嘉宾

卫剑钒

《大教堂与集市》中文译者，国际信息系统安全认证专家（CISSP），中国金融学会金融科技专委会委员

2023-08-18

11:00 - 11:20

一路前行，阿里云大数据从拥抱开源走向引领开源

阿里巴巴自 2009 年开始采用 Apache Hadoop 技术进行大数据分析，2010 年第一次将 Apache HBase 技术在商品搜索中大规模投产，2016 年将处于萌芽状态的 Apache Flink 在双 11 实时推荐场景落地，并在同年阿里云上发布支持 Apache Hadoop/Hive/Spark/Kafka 等主流开源大数据技术的 E-MapReduce 云产品。在最近几年，阿里云开源大数据 Flink 团队作为 Apache Flink 最主要的贡献者推动 Flink 成为全球流计算事实标准，并向 ASF 捐赠了 Apache Celeborn 和 Apache Paimon 开源大数据项目，本议题将介绍阿里云大数据如何一步步从拥抱、贡献开源走向开源社区的引领者。

嘉宾

王峰

阿里巴巴花名“莫问”，在阿里云任研究员职位，开源大数据平台负责人

2023-08-18

11:20 - 12:00

开源的未来：挑战与机遇

在我们的数字世界中，开源软件已经成为了像路桥一样的基础设施的一部分，发挥着越来越大的作用。然而，随着开源生态系统的发展，我们也面临着诸多挑战。开源软件供应链安全，开源的可持续发展，以及如何处理好开源与商业之间的关系，已成为开源世界急需需要解决的问题。在这次圆桌讨论中，我们将与 Apache软件基金会的资深人士一起，探讨开源世界面临的挑战以及可能的解决方案。

嘉宾

Craig Russell

Apache 软件基金会董事

Rich Bowen

Apache 软件基金会董事，AWS 开源战略师

Justin Mclean

Apache 软件基金会董事

姜宁

大会议题评审组成员 | Apache 软件基金会董事

大花

Answer 社区经理

2023-08-18

13:30 - 17:15

OLAP & Data Analysis

金辉厅 5

2023-08-18

13:30 - 14:00

Apache ECharts 的图表服务端渲染方案

With over 20 chart types, Apache ECharts' package size can be as much as 1MB, causing prolonged loading times on mobile devices without 4G connectivity. Discover how Server-Side Rendering (SSR) resolves this issue, while also exploring the implementation of SVG animation techniques that enable users to interact with rendered images. Learn innovative methods to optimize performance and create engaging, interactive visualizations that captivate your audience while keeping package sizes minimal. Don't miss this opportunity to unlock the full potential of Apache ECharts on mobile devices and revolutionize your data visualization practices.

嘉宾

Ovilia

Apache ECharts PMC Chair

2023-08-18

14:00 - 14:30

日志存储分析的数仓化

从ElasticSearch到Apache Doris，构建十倍性价比的新一代日志系统 1. 日志系统的典型应用场景和特点 2. 基于ES的日志系统典型架构和面临的挑战，包括对schema free的支持不够、分析能力较弱、写入和存储成本很高 3. 基于Doris的日志系统典型架构和优势，包括对schema free的原生支持、基于SQL引擎的强大分析能力、支持倒排索引的基础上性价比提升十倍

嘉宾

肖康

SelectDB 技术副总裁

2023-08-18

14:30 - 15:00

Apache Arrow DataFusion: 向量化查询引擎揭秘

Apache Arrow DataFusion是一个快速的、可扩展的、向量化执行框架，使用Arrow作为其内存数据格式，使用Rust语言进行实现。 DataFusion提供了多种层次的扩展接口：用户在实现数据库或者查询系统的时候，可以轻松地将DataFusion集成进去，从而利用其极致的性能，避免重复实现查询引擎的问题。本次介绍主要包含： 1. DataFusion是什么以及其发展历史 2. DataFusion的架构 3. DataFusion提供了哪些扩展能力（udf，logical plan，execution plan/node等) 4. DataFusion使用的场景是什么 5. DataFusion当前有哪些使用案例

嘉宾

刘昆

eBay大数据工程师，Apache Arrow Committer & PMC Member

2023-08-18

15:00 - 15:30

Apache Impala 4.2 & 4.3 版本新特性一览

Apache Impala是一个基于MPP架构实现的分布式查询引擎。本次演讲将分享Impala社区的最新进展，包括已经发布的4.2的核心功能，以及将要在4.3中发布的新功能

嘉宾

黄权隆

Impala PMC Member & Committer，Cloudera 研发工程师

2023-08-18

15:30 - 15:45

茶歇

2023-08-18

15:45 - 16:15

Apache Doris 在衔远科技的应用实践

随着实时数据分析需求的不断增长，实时数据仓库在衔远科技内部承担着越来越重要的分析诉求。经过多个版本的迭代，正式确定了以Apache Doris为核心的实时数据仓库架构。在本次的分享中，我将会为大家分享 Apache Doris在衔远科技的实践经验，以及在实际业务场景中如何为我们降本增效。

嘉宾

王永臣

北京衔远科技大数据开发工程师

2023-08-18

16:15 - 16:45

字节跳动大数据 SQL 权限精细化管理实践

背景：近年来，数据安全问题逐步受到各国政府和企业的重视，随着国家数据安全法、个人信息保护法的相继颁布和实施，对于数据最小够用原则也提出了明确的要求。因此，如何更细粒度管控权限也变成了每个企业都必须解决的问题。当前问题：业界通常基于规则对SQL中的权限点进行提取，将这些权限点横向按照行维度，或者纵向按照列维度进行管控。这种单一维度的权限管控粒度过粗，无法支持多条权限间的组合关系。在字节跳动这种多业务线数据统一存储的中台大宽表场景下，现有方案难以满足业务侧对数据权限细粒度管控的需求。解决方案：基于上述问题，火山引擎LAS研发团队基于ByteQuery查询引擎及自研权限服务Gemini设计了一套行列混合权限的精细化管理方案。 - 基于SQL血缘的精准权限提取 - 基于血缘能力，精准定位SQL中真正使用到的权限点信息(表，行，列等)，进行精细化权限提取。 - 行列混合权限多维度精细管控 - 在传统的库权限，表权限，列权限之上，新增加了一种行限制权限，行权限可以作为一种特殊的资源附属在表权限/列权限上面。 - 每一个表权限/列权限可以同时捆绑多个行权限资源，不同表权限/列权限的行限制相互独立。 - 通过横向/纵向权限点的捆绑组合，将查询资源定位到行列重叠的'资源单元格'上，达到更细粒度的资源级别权限方案优势：在新的方案下，通过精准细粒度的权限点提取，以及多维度的行列混合权限支持，将资源管控由横向的某一行，或者纵向的某一列，细化到行列重叠的'资源单元格'上。进一步细化了权限管控范围，在保证用户正常使用的前提下，最小粒度的授予所需权限。具体典型案例和实现原理将会在演讲PPT中进行介绍。

嘉宾

朱江

火山引擎 LAS 高级研发工程师

2023-08-18

16:45 - 17:15

基于 Apache Calcite 的多引擎指标管理最佳实践

数据分析中有着各种各样的指标，在维护海量指标的时候，常常有如下的痛点： - 重复片段无法得到复用。 - 不同引擎需要编写不同的SQL。 - 口径变更难以同步到所有下游。为了解决这些问题，字节跳动尝试过用已有的技术能力设计方案： - 将指标尽可能地存储到 Hive 表中：会极大增大存储成本和回溯成本，不太可行。 - 将指标封装到View中：不仅会在Hive产生额外的表信息导致表数量翻倍，而且对分区的支持不友好。查询使用体验较差，因此难以推广。因为目前已有的技术不足以解决上述问题，所以字节跳动基于Apache Calcite设计并实现了两套新的语法能力： - 虚拟列：列级别的视图，复用表列权限，推广简单。 - SQL Define Function：使用SQL直接定义函数，方便SQL片段的复用。这两项能力结合，可以有效降低指标管理的成本例如： - 指标仅需修改一次，无须下游再同步修改。 - MAP、JSON等集合类型中的字段可以定义成虚拟列，逻辑更加清晰、使用更加方便。具体典型案例和实现原理将会在演讲PPT中进行介绍。

嘉宾

谢佳君

火山引擎 LAS 高级研发工程师，Calcite Committer

2023-08-18

13:30 - 17:15

数据存储与计算

金辉厅3

2023-08-18

13:30 - 14:00

What's new in the recent and upcoming HBase releases

Apache HBase™ is the Hadoop database, a distributed, scalable, big data store. The HBase community is preparing new major release 3.0.0 and new minor release 2.6.0, with some brand new features. In this presentation, we will introduce these new features, about how they benefit our users and how we implement them in HBase： 1. Tracing Improvements: OpenTelemetry integration 2. TLS Support: secure and encrypted rpc communication 3. Cloud Native Support: Better OSS support, k8s deployment, etc. 4. Other Notable Improvements: HBase on ozone, new region replication framework, etc. Additionally, we will delve into our plans for the future and discuss the exciting directions in which HBase is heading.

嘉宾

张铎

神策数据首席架构师，Apache HBase PMC Chair

2023-08-18

14:00 - 14:30

Deep dive into resource manageability in ozone storage

Organizations need to manage resources allocated and used by different entities within it. In the context of Apache Ozone, resources are storage space and namespace (count of files, keys and directories). Apache Ozone provides capability to define, and control resource usages by specifying quota. Ozone provides ways to manage resources different from the hadoop system. The paper will present the resource management capabilities, behavior with respect to multiple ozone features such as trash, snapshot, and comparison differences with the hadoop system.

嘉宾

Sumit Agrawal

Senior Staff Engineer, Cloudera

2023-08-18

14:30 - 15:00

Spark SQL Shuffle Join Improvement at eBay

Join operation is one of the most important and widely used operations in data warehouse. The Join operator in Apache Spark is one of the most expensive operators, especially Shuffle Join. In this presentation, we will introduce a series of Shuffle Join optimizations recently added at eBay. Specifically, 1. Unwrap cast in join condition to use bucket join. 2. Enhance shuffle exchange reuse to reduce table scans. 3. Push down partial aggregation through Join.

嘉宾

王玉明

eBay 软件工程师，Apache Spark PMC

2023-08-18

15:00 - 15:30

字节跳动千亿文件 HDFS 集群实践

随着大数据技术的深入发展，数据规模和使用复杂度越来越高，Apache HDFS 面临着新的挑战。在字节跳动，HDFS 既是传统 Hadoop 数仓业务的存储，也是存算分离架构计算引擎的底座，还是机器学习模型训练的存储底座。字节跳动大数据存储团队基于 HDFS 本身，搭建了服务于大规模计算资源调度跨多地区的存储调度能力提升计算任务稳定性；也提供了统合用户侧缓存、常规三副本、冷存的数据识别和冷热调度能力。本次分享介绍字节跳动如何认识新兴场景对传统大数据存储的新要求，并分享技术和运维体系演进来支持不同应用场景。

嘉宾

熊睦

基础架构工程师

2023-08-18

15:30 - 15:45

茶歇

2023-08-18

15:45 - 16:15

Apache Kyuubi & Celeborn(Incubating): 助力 Spark 拥抱云原生

在过去数年中，网易在大数据云原生领域进行了长足的探索。本次演讲围绕如何基于 Apache Kyuubi & Celeborn 等开源技术，构建企业级 Spark on Kubernetes 云原生离线计算平台展开，包含技术选型、架构设计、经验教训、缺陷改进、降本增效等内容，深入剖析网易在该领域的探索成果。

嘉宾

潘成

网易数帆软件工程师，Apache Kyuubi PMC，Apache Celeborn PPMC

2023-08-18

16:15 - 16:45

Resilient Data: Exploring Replication and Recovery in Apache Ozone

Data resilience is crucial in modern distributed systems to ensure data availability and durability. Apache Ozone, a scalable and distributed object store that has the capability to handle billions of objects, addresses the need for resilient data storage through its replication and recovery mechanisms. This talk delves into the concepts and techniques employed by Apache Ozone to achieve high data resilience. The first part of the talk explores data replication in Apache Ozone. It discusses how Ozone maintains strong consistency by keeping consistent copies of blocks across all nodes . The second part, which is the crux of the talk, deals with data backup and recovery. It will discuss how one can use effective backup strategies like cross-cluster replication, Ozone snapshots, etc. This talk serves as a comprehensive guide for exploring the resilience aspects of Apache Ozone, enabling practitioners to leverage its capabilities effectively and make informed decisions when designing data-intensive applications.

嘉宾

Sadanand Shenoy

Software Engineer II , Cloudera

2023-08-18

16:45 - 17:15

Linkis 在理想汽车的应用实践

Apache Linkis 是在上层应用程序和底层引擎之间构建的一层计算中间件。本次分享的内容主要包括：为何我们选择 Linkis 作为理想汽车内部的中间件；在 Linkis 的落地实践过程中，我们添加和修复了哪些功能。以及这些功能如何让我们能够更好地满足开发需求，提高工作效率；我们在实践中遇到的一些挑战和问题以及我们所采取的解决方案和建议；计划添加的新功能和改进。希望通过本次分享为正在使用和计划使用Linkis作为中间件的团队提供一些经验。

嘉宾

郗世豪

理想汽车高级大数据工程师

2023-08-18

13:30 - 16:45

开源社区

鸿运厅3

2023-08-18

13:30 - 14:00

OpenDAL 的开发者体验分享

本次分享主要围绕开源项目 OpenDAL 的开发者体验实践展开，分享 OpenDAL 项目的实践，并根据实际经验做出自己的总结。

嘉宾

丁皓（Xuanwo）

Databend 研发工程师

2023-08-18

14:00 - 14:30

Apache Kvrocks 社区演进

- Apache 孵化器对社区的帮助和影响 - 社区发展现状 - 社区如何获得第一位社区 PPMC - 社区如何获得第一位海外 Committer - 孵化一年的总结

嘉宾

王源

百度资深工程师

2023-08-18

14:30 - 15:00

社区和贡献者如何找到彼此？

《社区和贡献者如何找到彼此？》 Where is the community? Who is contributor? 看起来是两个显而易见的问题，但却是在开源社区最常见的两个问题。在这个演讲中，我们将深入探讨开源社区的本质以及贡献者的角色。从三人成众，到志同道合。从来了就是朋友，到有效激励贡献者的长期贡献。总之，我们将展示社区和贡献者如何相互发现对方，以及他们如何建立并维持长久的关系。我们会探讨一些成功的策略，包括如何吸引新的贡献者，如何为他们提供支持，以及如何帮助他们发展成为项目的领导者。无论你是新手，还是经验丰富的开源贡献者，我们都希望你能从这个演讲中获得有价值的洞察和灵感。

嘉宾

庄表伟

开源社理事

2023-08-18

15:00 - 15:30

自研分布式数据库的开源之路

OceanBase 历经10多年的发展, 从最早淘宝收藏夹使用的电商数据库, 一路成长, 开始慢慢成为蚂蚁集团所有核心系统的数据库, 再成长成为众多企业尤其是金融行业的核心系统的数据库数据库承担着数据的存储和管理职责, 是应用系统的核心保障, 牵一发以动全身, 而阿里和蚂蚁每年双11, 又会带来海量的流量, 这些流量, 让所有的系统变得错综复杂, 而数据库又承担着稳定性和数据准确性要求, 就让一个分布式数据库的稳定性和数据准确性成为一个世界级难题。面对这样一个世界级难题, OceanBase 沉淀了12年的架构, 研发和运维经验在2021年6月正式开源。本次分享将以开源原生分布式数据库 OceanBase 实践为例，分享从0到1搭建健康的开源社区，包括企业级开源项目从商业化到开源的决策思考，开源项目由内向外的生态探索和健康活跃开源社区的建设之路。

嘉宾

段少婷

OceanBase社区经理

2023-08-18

15:30 - 15:45

茶歇

2023-08-18

15:45 - 16:15

AI时代与智能组织：从Apache得到的启示

1.Apache的故事与组织模式 2.人工智能时代与超级个体 3.新型组织模式：以Midjourney和LAION

嘉宾

张雅琪（Alphatu）

ChaosAI 创始人

2023-08-18

16:15 - 16:45

从0到“20000+”用户，Apache DolphinScheduler社区如何实现双向奔赴？

在过去的三年中，Apache DolphinScheduler 取得了惊人的30倍增长，这离不开其强大的技术优势和卓越的社区运营。本次演讲将探讨 Apache DolphinScheduler 是如何通过创新的社区运营、高效的技术支持和密切的用户互动来实现与用户的双向奔赴，以及这一成功经验对其他开源项目的启示。让我们共同揭开 Apache DolphinScheduler 快速发展背后的奥秘，探索其持续增长的动力来源。

嘉宾

曾辉

白鲸开源高级社区经理

2023-08-18

13:30 - 16:45

数据湖与数据仓库

金辉厅1

主持人

代立冬

2023-08-18

13:30 - 14:00

Challenges and Solutions on building Realtime Data warehousing with Apache Flink , Apache Hive and Apache Iceberg

There are many technologies that can be used to build an Enterprise level real-time data warehouse. In order to fully migrate the Batch ETL processing of your EDW towards Real Time ETL, there are challenges such as late events, dirty data routing, etc require extra attention to handle. The purpose of this speech is to provide the recent community works on Apache Flink, Apache Hive, and Apache Iceberg and architecture design related to migrating Batch Processing EDW to Real-time PRocessing EDW. 在当下，有很多的技术组合可以用于迁移基于批处理的数据仓库至实时处理的数据仓库。为了能够完整的迁移批处理的数据仓库，我们需要额外的处理在实时架构下遇到的迟到事件，脏数据路由以及由这些问题引起的结果集修复等问题。本演讲主要关注在Apache Flink ， Apache Hive 和 Apache Iceberg在围绕上述挑战下的社区工作总结以及如何使用Apache Flink， Apache Hive 和 Apache Iceberg 构建一个企业级的实时数据仓库。

嘉宾

Yan Liu 刘岩

Cloudera Solution Eng

2023-08-18

14:00 - 14:30

基于 Flink 构建实时数据湖的实践

实时数据湖是现代数据架构的核心组成部分，它允许企业实时分析和查询大量数据。在这场分享中，我们将首先介绍实时数据湖目前存在的痛点，比如数据的高时效性，多样性，一致性和准确性等。然后介绍我们如何基于 Flink 和 Iceberg 构建实时数据湖，主要通过如下两部分展开：如何将数据实时入湖、如何使用 Flink 进行 OLAP 临时查询。最后介绍一下字节跳动在实时数据湖中的一些实践收益。

嘉宾

王正

火山引擎云原生计算研发工程师

2023-08-18

14:30 - 15:00

OpenEuler and Bigtop with Ambari : Empower Data Lake in the real world

At present, there are no available free data lake platforms to streamline data management and analytics, as Cloudera Data Platform (CDP) is no longer offered free of charge. As more users show interest in similar platforms, Bigtop with Ambari provide free open-source solutions for the data lake stack as an alternative to CDP that can deliver faster and easier data management and analytics. The Bigtop team, along with people from Oracle, NTT DATA, Visa, Arm and some individual developers, re-incubated Apache Ambari last year. Roman Shaposhnik, the founder of Bigtop and Director of the ASF Board, spearheaded the effort to bring Ambari back. In this talk, we will provide an overview of the new Bigtop 3.2.0 release and an in-depth perspective on the Bigtop+Ambari solution as a data lake platform. Furthermore, Bigtop has started to work on supporting OpenEuler, which has over 300 organizational members and has seen significant enterprise deployments, particularly in China. We will introduce the current work status and roadmap of Bigtop on OpenEuler.

嘉宾

Yuqi Gu

Staff Software Engineer, Arm

2023-08-18

15:00 - 15:30

Apache Linkis 在湖仓一体架构下的数据处理实践

主要分享邮储银行作为一家大型国有银行，在湖仓一体架构下，如何结合Linkis解决实际面临的问题，以及后续的发展建议。邮储银行大数据领域坚持技术自主可控、开放理念，以开源Hadoop+MPP的结合的湖仓一体技术架构，融合批量实时数据处理双链路，搭建开源Hadoop集群上千台，紧跟前沿技术，基于Iceberg数据湖格式，使用Spark（批量）、Flink（实时）计算引擎，基于Apache Linkis构建湖仓一体的技术平台底座，不断提升数据服务质效。在技术实施过程中，也遇到技术组件多，基础环境维护复杂、技术有难度，数据开发技术门槛高、流批一体架构下，组件版本升级快、不同算引擎的元数据存储不同，统一视图难等诸多问题，通过引入Apache Linkis，实现了计算组件的底层对接，对外提供统一接口调用；优先使用sql开发，降低了应用开发门槛；支持同一组件多版本共存，具备了灰度升级能力；以Hive Catalog为主，提供了元数据统一入口。在使用Apache Linkis过程中，邮储银行积极参与Apache linkis社区共建，主要贡献了数据访问层增加Postgresql支持、文件存储层S3支持等PR，未来也将持续加强社区互动，就Iceberg数据湖治理、容器化部署等方面贡献力量。

嘉宾

王华磊

中国邮政储蓄银行副主任工程师

2023-08-18

15:30 - 15:45

茶歇

2023-08-18

15:45 - 16:15

数据湖 Iceberg 在小米的实践与优化

本次分享着重于介绍小米内部引入Iceberg的原因和现状，及利用Iceberg实现业务架构升级的实践，也包括了对Iceberg Parquet文件过滤能力的优化，和托管式表优化服务架构演进及落地等内容。

嘉宾

肖杰宝

小米软件研发工程师

2023-08-18

16:15 - 16:45

字节跳动基于 Parquet 格式的降本增效实践

字节跳动离线数仓默认使用 Parquet 格式进行数据存储，但是在业务使用过程中我们遇到了小文件过多，数据存储成本高等相关问题。针对小文件过多问题，现有技术方案一般是通过 Spark 读取多个 Parquet 小文件后，再将这些数据重新输出并合并到一个或多个大文件。对于存储成本过大问题目前离线数仓只有分区级的行级 TTL 方案，如果需要删除分区中不再使用且占比较大的明细字段数据（列级 TTL)，则需要通过 Spark 将数据读取出来并将需要删除的字段置为 NULL 的覆写方式来完成。无论是小文件合并，列级 TTL，都存在对 Parquet 数据文件的大量覆写操作。由于 Parquet 格式有特殊的编码规则，需要经过特殊的（反）序列化、（解）压缩、（反）编码等一系列操作，才能实现对 Parquet 中数据的读写。在这一过程中，编解码、解压缩之类的操作是 CPU 密集型计算，会消耗大量计算资源。为了提高 Parquet 格式文件覆写效率，我们深入研究了 Parquet 文件格式定义，采用了二进制 copy 的方法优化数据覆写操作，跳过了普通覆写中编解码之类的多余操作，相比于传统方法大幅提高了文件覆写效率，性能是普通覆写方式的 10+ 倍。为了提高易用性，我们同时提供了新的 SQL 语法来支持用户方便的完成小文件合并、列级 TTL 等操作。

嘉宾

徐庆

火山引擎LAS高级研发工程师

王恩策

火山引擎 LAS 高级研发工程师

2023-08-18

13:30 - 17:45

人工智能 / 机器学习

金辉厅2

2023-08-18

13:30 - 14:00

生成式AI的分布式缓存：优化云上的LLM数据管道

大型语言模型（LLM）训练是一个资源密集型的过程，需要大量的存储、CPU和GPU资源，以及众多小文件的频繁输入输出。随着LLMs越来越复杂，对高性能、可扩展的数据处理解决方案的需求也在增加，特别是在分布式云训练的背景下。传统的数据平台架构难以维持所需的I/O吞吐量，导致GPU利用不足和资源使用效率低下。在此背景下，专为优化云上LLM数据管道的Alluxio最新分布式缓存架构系统应运而生。 Alluxio与Spark是来自加州大学伯克利分校AMP实验室的姊妹项目。Spark+Alluxio的组合在AI场景下提供了高性能、可扩展和强大的数据处理和分析能力。它可以加速大规模数据处理和机器学习任务，提供快速的数据访问和共享机制，同时优化数据管道和保持数据一致性。这使得AI工作负载能够更高效地处理和分析大规模数据集，从而加速模型训练、推理和决策过程。 1、分布式缓存系统的设计和实现及如何解决LLM训练和推理的I/O挑战 2、探讨数据访问模式的独特要求，以及分享通过云上分布式缓存优化数据管道的最佳实践 3、基于Alluxio+Spark的实现提升效率打造现代化的数据平台 4、实践案例：微软、腾讯和知乎的Alluxio应用 5、探索如何利用可扩展、高效和强大的数据基础设施进行LLM训练和推理

嘉宾

傅正佳

Alluxio 开源布道师

胡梦宇

知乎大数据基础架构开发工程师

2023-08-18

14:00 - 14:30

字节跳动 Spark 支持万卡模型推理实践

随着云原生的发展，Kubernetes 由于其强大的生态构建能力和影响力，使得包括大数据、AI 在内越来越多类型的负载应用开始向 Kubernetes 迁移，字节内部探索 Spark 从 Hadoop 迁移到 Kubernetes，使得作业云原生化运行。同时搜索有大量GPU需求量极大的离线批处理任务，随着潮汐任务上量，发现一系列问题： GPU 算力供给(卡时数)仍有较大缺口、单机房资源池规模无法匹配业务单位任务计算量增长、在线资源池算力浪费问题、缺乏统一平台入口。Spark 和 AML(应用机器学习)合作，通过 GPU 共享技术、混部 GPU 调度、Spark引擎增强，平台及周边生态完善等途径，支持万张卡混部 GPU 模型推理离线计算，支持作业80亿多模态训练数据使用混部 GPU 7k卡 7.5h完成模型打分数据清洗，并且资源使用效率、稳定性均得到了显著提升。

嘉宾

刘畅

字节跳动基础架构工程师

张永强

字节跳动机器学习系统工程师

2023-08-18

14:30 - 15:00

为什么我们需要面向异构计算的编译器体系

随着计算任务的复杂性和数据量的增加，传统的通用计算平台已经无法满足高性能计算的需求。异构计算体系的加速到来，不同的计算平台具有不同的指令集和架构特点。面向异构计算的编译器体系可以提供更高的性能和效率，并且支持不同类型的计算单元和平台之间的无缝集成，从而推动计算技术的发展和创新。

嘉宾

王臣汉

OpenBayes 贝式计算创始人兼 CEO

2023-08-18

15:00 - 15:30

Flink ML 2.2.0 的新特性解析与应用

Flink ML是基于Apache Flink的流批一体的机器学习算法库，是Apache Flink的子项目。在此报告中，我们将介绍Flink ML 2.2.0的新特性与Flink ML在阿里巴巴的落地场景。 - 支持在线推理服务的基础设施 - 丰富的特征工程算法 - 在线学习算法的设计与在实时日志聚类场景的应用

嘉宾

洪帆

阿里巴巴算法专家

张智鹏

阿里云智能算法专家

2023-08-18

15:30 - 15:45

茶歇

2023-08-18

15:45 - 16:15

Bringing LLM to Everywhere via Machine Learning Compilation

Significant progress has been made in the field of generative artificial intelligence and large language models (LLMs), which possess remarkable capabilities and the potential to fundamentally transform many domains. However, nowadays, LLMs require extensive computation and memory to run and usually run on servers with cloud GPUs. And we introduce MLC-LLM, an open-sourced project based on Apache TVM to run LLMs on PC, Mobile, and even WebGPU with GPU acceleration.

嘉宾

Siyuan Feng

Ph.D. Student, Shanghai Jiao Tong University

2023-08-18

16:15 - 16:45

字节跳动深度学习批流一体训练实践

随着公司业务发展，算法复杂度不断提升，越来越多的算法模型在离线更新的基础上探索实时训练以提提升模型效果。为实现复杂的离线和实时训练灵活编排、自由切换，能在更大范围内调度在离线计算资源，机器学习模型训练逐渐趋于批流一体化。在字节跳动内部批式训练数据主要基于Apache Iceberg、Apache HDFS等，流式数据主要基于Apache Kafka。在此背景下，我们实践并开源了具有海量多阶段多源数据灵活编排能力，高效训练的批流一体机器学习训练框架。支撑了字节跳动日均1万+作业，500万核心CPU任务，1万卡GPU任务，单任务平均数据量500TB 训练规模。我们将分享包括字节跳动机器学习训练调度框架的架构演进、批流一体实践、异构弹性训练等部分内容。着重介绍在MFTC（批流一体协同训练）场景下，多阶段多数据源混合编排、流式样本全局Shuffle、全链路Native化，训练数据洞察等实践经验。全新的调度架构，实现了更有效的利用机器资源池，统一资源调度入口，更灵活的多角色调度，弹性扩缩容，提高资源利用率。批流一体的混合训练能力可以支持更高的数据消费吞吐，实现灵活的离线数据与实时数据混合编排，同时提供数据优先级保障，数据可视化能力。演讲提纲： 1. 现状与背景 1. 批流一体训练整体架构介绍：IceBerg 及 Kafka 选型优势 2. 字节跳动调度框架演进过程 3. Primus 开源项目介绍 2. 批流一体训练实践 1. 批流一体业务背景、问题与挑战 2. 字节跳动实战经验 1. IceBerg及Kafka多阶段多数据源编排 2. DataLoading技术演进与性能优化 3. All2Allshuffle、Batch/Stream 优先级调度 4. Insight训练数据洞察 3. Primus Flow实践：与Spark结合，实现具有预处理功能的训练

嘉宾

毛洪玥

字节跳动基础架构工程师

2023-08-18

16:45 - 17:15

Unifying Real-time and Batch ML Inference using BentoML and Apache Spark

BentoML provides tooling for packaging, deploying, and serving machine learning models at scale. Apache Spark is an open-source cluster computing framework for large-scale data processing. This talk will highlight how BentoML can unify real-time and batch inference workloads by integrating with Apache Spark. BentoML has rapidly gained popularity among its user base owing to its seamless open standards for constructing online AI applications as distributed services through simple Python code. In this regard, we present the novel integration of BentoML with Spark, which allows users to employ the Bento service, originally designed for real-time inference, within a Spark cluster for offline batch inference without altering any code. This functionality is enabled by the run_in_spark API, which automatically propagates the models and inference logic across all Spark worker nodes during batch inference. This integration offers an optimal solution for teams to manage both their real-time and batch inference logic under the same standards, facilitated with version control, and ensuring consistent library dependencies. As a result, this eliminates the concerns regarding divergence in the inference logic over time between real-time and batch inferences. The unified approach ensures consistent model application, fostering efficient AI service development and deployment. Attendees will learn how to:
1. Package models with BentoML;2. Deploy BentoServices to production;3. Invoke BentoServices from Spark for batch inference at scale;4. Leverage the same models for both real-time and batch predictions.

嘉宾

Bo Jiang

Product Engineer, BentoML

2023-08-18

17:15 - 17:45

Boost ML networks on specific HW platform with Apache TVM on the example of Qualcomm Adreno™ GPU

In our presentation, we will introduce Apache TVM - tensor compiler for boosting execution of ML networks. Apache TVM is a powerful tool for optimizing DL models. On the example of Adreno GPU we will demonstrate how user can significantly improve performance of his model with TVM, by utilizing HW specific of a target platform. In 2021, initial research to enable Adreno textures in Apache TVM was prototyped based on Mobilenet v1 workload and demonstrated promising performance results, meanwhile other networks still worked slowly on Qualcomm Adreno GPU. In 2022, a big amount of optimization work was done, and significant performance boost was achieved. In our talk, we will demonstrate how users can use TVM to run models on their target platforms and what should they do to achieve the best performance.

嘉宾

Egor Churaev

Sr. Software Engineer, Deelvin Solutions

2023-08-18

13:30 - 16:45

流处理

鸿运厅2

主持人

李钰

王鑫

2023-08-18

13:30 - 14:00

Apache Flink 流批自适应 Shuffle

在 2022 年的 Flink Forward Asia 上，我们首次提出了以云原生、流批融合、自适应为核心的 Flink Shuffle 3.0 架构。新的 Shuffle 架构具有以下优势： ‒ 更加适应云原生环境的资源编排与隔离特点 ‒ 兼具传统流式与批式 Shuffle 技术的优势 ‒ 能够根据运行时的资源与负载情况做出自适应调节，更加易用本次分享，我们将介绍 Flink 1.18 版本在这方面取得的最新进展与未来规划。

嘉宾

宋辛童

阿里云高级技术专家，阿里云 Flink Shuffle & SDK 团队负责人

谭玉新

阿里云高级开发工程师

2023-08-18

14:00 - 14:30

基于Apache Calcite/Gremlin构建流式图处理系统

典型的流计算主要针对表模型的处理场景，而针对图模型如何进行流式的处理和分析，目前通用流计算还难以支持。本次分享主要介绍蚂蚁自研的流式图引擎GeaFlow,以及GeaFlow如何围绕Apache Calcite和Apache Gremlin构建流式图查询语言的能力。同时也会分享基于流式图计算在蚂蚁内部的实践和应用。

嘉宾

潘臻轩

蚂蚁集团资深技术专家

2023-08-18

14:30 - 15:00

联通基于Apache StreamPark的大规模实时计算生产实践

1.大数据实时计算平台支持基于事件的低延迟处理以及流批一体的数据处理，支撑了30+内部和外部组织的实时化业务和10000+的数据服务订阅，每天处理2.3万亿条数据、600TB+数据量，集群规模独享480+服务器，服务了十几条业务生产产品线 2.基于Apache StreamPark一站式的面向实时计算作业的管理平台，支撑了生产环境500+Flink ON YARN实时计算作业管理，通过可视化的简洁的操作流程完成了项目管理、作业管理、团队管理、权限管理、告警管理、日志管理、版本管理、集群管理、资源配置、Flink JAR、Flink SQL、监控大屏等管理功能，实现了实时作业全生命周期管理，帮助团队解决了作业运维泥沼、提升了管理效率、减低了故障率、提高了业务支撑质量，全面实现了实时计算的一体化、平台化的管理

嘉宾

穆纯进

联通数字科技有限公司大数据实时计算平台研发负责人

2023-08-18

15:00 - 15:30

FlinkSQL的字段血缘及数据权限解决方案

数据血缘和数据安全是搭建企业级数据仓库不可或缺的能力。近年来随着各行各业对大数据实时化的需求越来越强烈，以 Flink 为代表的实时数仓快速兴起，但由于发展时间相对较短，离线数仓领域基于 Apache Ranger 和 Apache Atlas 相对成熟的数据血缘和安全解决方案尚未支持 Flink SQL，且依赖 Ranger 和 Atlas 会导致系统部署和运维过重。因此，如何在对 Flink 和 Calcite 源码零侵入的前提下实现 FlinkSQL 的字段血缘及数据权限管理，就显得尤为重要。本次分享将详细介绍相关解决方案，帮助听众打造 Flink 实时数仓领域的 Atlas+Ranger。

嘉宾

白松

杭州数澜科技有限公司联合创始人，研发中心副总经理

2023-08-18

15:30 - 15:45

茶歇

2023-08-18

15:45 - 16:15

Streaming Apache Kudu within Apache Flink

So far CDC is not supported within Apache Kudu, so there is no way to read data from it in a streaming style like other CDC enabled data sources when integrating with Apache Flink. To overcome this, a Apache Flink source connector has been built to unlock the ability for Apache Kudu to stream the data in a continuous and incremental way. In this speech, we will discuss and share the detailed design and implementation for the solution.

嘉宾

Wei Chen

Staff Software Engineer of eBay

2023-08-18

16:15 - 16:45

Shaping the Future: Unveiling High-Concurrency Streaming Analytics with Apache Druid

"Stream processing is rapidly evolving to meet the high-demand, real-time requirements of today's data-driven world. As organizations seek to leverage the real-time insights offered by streaming data, the need for robust, highly concurrent analytics platforms has never been greater. This presentation introduces Apache Druid, a modern, open-source data store designed for such real-time analytical workloads. Apache Druid's key strength lies in its ability to ingest massive quantities of event data and provide sub-second queries, making it a leading choice for high concurrency streaming analytics. Our exploration will cover the architecture, its underlying principles, tuning principals and the unique features that make it optimal for high concurrency use-cases. We'll dive into real-life applications, demonstrate how Druid addresses the challenge of immediate data visibility, and discuss its role in powering interactive, exploratory analytics on streaming data. Participants will gain an in-depth understanding of Apache Druid’s value in the rapidly evolving landscape of streaming analytics and will be equipped with the knowledge to harness its power in their own data-intensive environments. Join us as we delve into the future of real-time analytics, discovering how to 'Shaping the Future: Unveiling High-Concurrency Streaming Analytics with Apache Druid'.

嘉宾

Tijo Thomas

Lead Solutions Architect

2023-08-18

13:30 - 17:15

消息系统

鸿运厅1

主持人

王殿进

2023-08-18

13:30 - 14:00

Apache Pulsar 3.0：首个LTS版本及其新特性

Apache Pulsar 社区最近推出了 Apache Pulsar 3.0，这是 Pulsar 的第一个 LTS 版本。在本次演讲中，我们将深入探讨Pulsar LTS 版本的重要性。我们还将介绍 Pulsar 3.0 中引入的主要特性，包括新的负载均衡器、大规模延迟消息的支持以及Direct IO 优化等。

嘉宾

Zike Yang

Software Engineer of StreamNative

2023-08-18

14:00 - 14:45

Apache Pulsar 限流功能在移动云云原生场景下的应用实践

移动云为了实现 Pulsar 在云原生容器化场景下的多租户网络资源隔离，针对 Pulsar 的限流功能、ResourceGroup 以及负载均衡等特性做了大量优化。本次演讲将介绍 Pulsar 的限流实现原理，我们如何优化 ResourceGroup 来实现集群级别的限流，以及在集群级别限流场景下如何优化负载均衡策略。

嘉宾

王嘉凌

中国移动云能力中心软件开发工程师

2023-08-18

14:45 - 15:30

华为终端云在容器场景中对Apache Pulsar的优化实践

Apache Pulsar是一款云原生消息队列，基于其存算分离架构，通常可以在业务低峰期缩容计算层来节省资源。我们在容器化场景下，针对Apache Pulsar做了大量优化。如：现在Pulsar负载均衡算法依赖于节点过去的负载数据，达到平衡的过程比较缓慢。当开启HPA，节点在负载均衡的过程中很可能又会触发扩容，而扩容又会引发新的负载均衡。我们要如何优化来让Pulsar更加云原生？

嘉宾

林琳

华为 SDE 专家

2023-08-18

15:30 - 15:45

茶歇

2023-08-18

15:45 - 16:30

Kafka without Zookeeper

Currently, Kafka relies on ZooKeeper to store its metadata, ex: brokers info, topics, partitions...etc. KRaft is a new generation of Kafka that runs without Zookeeper. This talk will include: 1. Why Kafka needs to develop the new KRaft feature. 2. The architectures of the old (with Zookeeper) Kafka and new (without Zookeeper) Kafka 3. Benefit of adopting KRaft 4. How it works internally. 5. The monitoring metrics 6. Tools to help troubleshoot issues in KRaft 7. A demo to show what we've achieved so far. 8. The roadmap for the Kafka community to move toward KRaft. After this talk, the audience can have better knowledge of what KRaft is, and how it works, and what's the difference with Zookeeper based Kafka, and most importantly, how to monitor it and troubleshoot it.

嘉宾

Luke Chen

Senior Software Engineer, RedHat

邓子明

字节跳动数据开发

2023-08-18

16:30 - 17:15

Deep Dive the replication protocol in Kafka

Being a messaging system, the data durability is very important. The replication ensures automatic failover to other replicas when a server in the cluster fails so messages remain available in the presence of failures. In Apache Kafka, the replication protocol is not only used to achieve durability, but also to achieve high throughput. In this talk, we'll deep dive how the replication protocol works internally in Kafka. We'll also explain what's the pros and cons of this kind of design. Furthermore, we'll also introduce the other kind of replication protocol in Kafka, which is used for KRaft controllers (i.e. quorum based way). After this talk, the audience can rethink these replication protocols, and maybe some of the ideas can be brought into some other distributed system projects. Hope it will also help audience know more about Apache Kafka.

嘉宾

Luke Chen

Senior Software Engineer, RedHat

2023-08-19

09:30 - 12:00

Keynote 主题演讲

主会场

2023-08-19

09:30 - 10:00

The Apache Way: Building Community and Longevity

Join us for an engaging discussion on how the Apache Way fosters community and ensures the longevity of open source projects. Explore the key principles behind successful Apache communities, including consensus-based decision-making, transparent communication, independent governance, and open development practices. Discover how embracing the Apache Way can cultivate a vibrant community, attract new contributors, and drive the sustained success of your open source project.

嘉宾

Justin Mclean

Apache 软件基金会董事

2023-08-19

10:00 - 10:20

开源贡献难吗？

也许很多同学都有想过参与一些开源贡献，来提升自己的技术能力和影响力。但是理想跟现实之间通常有一些距离：因为工作太忙，没有时间参与；开源项目门槛太高，不知道怎么入门；尝试过一些贡献，但是社区响应度不高，没有坚持下去。本次 keynote，李本超会结合自己的经历，分享他在贡献开源社区过程中的一些小故事和思考，如何克服这些困难，最终在开源社区取得突破，并且在工作和开源贡献之间取得平衡。

嘉宾

李本超

字节跳动 Flink SQL 技术负责人

2023-08-19

10:20 - 10:50

社区的力量

开源社区如同有机的生物系统，本次演讲将会和大家一起来探讨社区发展的源动力，从道（Purpose）法（Principle）术（Process）器（products）多个角度来讲社区的力量，Community is people 揭示出社区最核心最有价值就是社区中的每一个人（People）。我们将会探讨每一个人参与到社区中贡献的源动力和收益是什么？再优秀和成功的项目，失去了社区共同体，失去了投入其中的开源贡献者，开源项目就失去了生命力。因此，不管是企业开源和维护的开源项目，还是个人发起或者基金会维护的开源项目，都是需要优秀的开发者以一种自驱的方式长期投入到这份开源事业之中，秉持长期主义，把视线拉长，享受开源带来的成就感和幸福感。

嘉宾

陈阳

开源社理事长

2023-08-19

10:50 - 11:10

数字金融时代的云原生技术应用与创新

在这个充满挑战和机遇的时代，云原生技术正引领金融行业的变革与创新。本次演讲将分享将深入探讨和分享数字金融时代，云原生技术的应用与创新应用案例，以及其在分布式金融新核心转型中的重要性。

将以分布式金融新核心转型实践为例，介绍云原生技术在数字金融时代中实现分布式金融新核心转型的案例，聚焦于新一代无服务器事件中间件 Apache EventMesh，共同探讨如何提升业务效率、用户体验以及开源和云原生创新的重要性。

嘉宾

陈广胜

微众银行技术专家，Apache 软件基金会成员，Apache EventMesh PMC Chair，ALC Shenzhen 联合发起人

2023-08-19

11:10 - 11:40

社群长青：开源社群如何可持续发展

嘉宾

tison

大会议题评审组成员 | 格睿科技（Greptime）开发者关系总监

2023-08-19

11:40 - 12:00

面向数字基础设施的通信新基座——移动云消息队列矩阵

消息中间件作为消息通信的基础软件，已在业界诸多的IT系统（比如，大数据分析领域、面向云计算基础设施的 OpenStack 领域和物联网/车联网、边缘计算应用领域）中被广泛使用。

移动云在消息中间件的技术演进与发展方向上一直坚持着自研和开源融合的发展路线，在做好自研的基础上积极拥抱开源生态，尤其是近年来随着移动云业务的持续高速发展，

基于开源技术生态的消息中间件云产品体系越来越受到市场的青睐。

从18年开始，移动云一直积极参与Apache RocketMQ、Apache Pulsar和Apache Kafka等开源社区的共同建设工作。

目前，移动云消息中间件团队已经培养出超过多位 Apache 顶级项目 Commiter / PMC Member。

本次 Talk 我们将向大家介绍移动云在过去几年来的开源消息中间件发展历程、业务探索与实践以及未来规划。

嘉宾

胡宗棠

中国移动云能力中心消息中间件领域技术专家，移动云消息队列团队负责人

2023-08-19

13:30 - 16:15

通用

金辉厅 5

2023-08-19

13:30 - 14:00

基于EventMesh构建超大规模云原生事件网格-EventGrid

EventMesh 是新一代无服务器事件中间件，它能够简化事件驱动的架构，提升开发效率，采用微内核插件化设计，具备丰富的开箱即用的事件连接器，它提供了各种现成的功能，无需从头构建事件连接器。它符合 CNCF Serverlesswork-flow 标准的事件编排，支持标准的 PubSub 事件发布订阅模型，能够与不同的事件存储、消息代理和云平台的无缝集成。本次演讲主要从架构规划，生态建设，实践案例等方面介绍EventMesh在华为云的落地与实践情况。

嘉宾

薛炜明

微众银行中间件研发工程师

王海军

华为云中间件团队技术专家

2023-08-19

14:00 - 14:30

Apache Royale Externs

Welcome to this informative talk on Apache Royale externs. In this session, we will explore the concept of externs and their significance in Apache Royale development. Externs play a vital role in seamlessly integrating external JavaScript libraries and extending the capabilities of Apache Royale applications. Join us as we delve into the world of Apache Royale externs and discover how they can enhance your development process and empower your applications.

嘉宾

Alina Kazi

Apache Royale Committer, The Apache Software Foundation

2023-08-19

14:30 - 15:00

统一 AD、Linux 和 Apache Openmeetings 的基于角色的访问控制机制

MS活动目录在大多数企业中是 Windows系统事实上的身份验证系统。我们可以通LDAP和活动目录集成，以授予域用户登录系统的权限。在本次演讲中，演讲者将讨论RBAC机制，即如何通过验证LDAP用户登录Linux客户端计算机来统一AD和Linux。并将讨论Linux 模块的概念，例如 PAM、SSSD、NSS 和活动目录的概念，例如林、域等。 Openmeetings是Apache的TLP。与其他视频会议工具相比，它是完全开源且基于浏览器的的。Apache openmeeting提供本地、容器等不同安装方式。Openmeetings可以与LDAP & Active Directory集成，授予域用户登录系统的权限。在本次演讲中，演讲者将详细说明如何配置Openmeetings集成LDAP和活动目录，演讲将从用户的角度讨论配置文件，并将解释Apache Openmeetings代码片段中的类和函数。听众应具有Java和LDAP的基本知识。演讲结束时，将给出开发和系统配置的演示。

嘉宾

刘文涛

高级软件工程师

2023-08-19

15:00 - 15:30

What's inside a Smartphone? Exploring the internals with Apache NuttX Real-Time Operating System

Smartphones are incredibly complex gadgets. What if we could learn the internals of smartphones... By booting Apache NuttX RTOS (Real-Time Operating System) on our phone? Over the past year, we have written a series of 24 articles explaining the inner workings of PINE64 PinePhone, and how we implemented the smartphone features with Apache NuttX RTOS. The articles cover the essential (and esoteric) topics on smartphone technology: MIPI DSI LCD Display, I2C Touch Panel, USB Controller, LTE Modem, Accelerometer / Gyroscope, Arm64 Interrupts and many more. We are also experimenting with newer, easier ways to create Smartphone Apps, with LVGL Graphics Library, Zig Programming Language, WebAssembly Simulation and Arm64 Emulation. More about Apache NuttX RTOS on PinePhone: https://lupyuen.github.io/articles/what

嘉宾

Lup Yuen Lee

IoT Techie and Educator, Apache NuttX PMC

2023-08-19

15:30 - 15:45

茶歇

2023-08-19

15:45 - 16:15

如何基于云原生技术帮助 Apache Kafka 实现弹性能力

Apache Kafka 作为事件流平台通常被大多数企业用作数据传输通道、流计算分析和数据集成。在这场分享中，我们将首先介绍 Apache Kafka 目前存在的痛点，比如难以弹性伸缩只能为峰值准备容量、计算和存储耦合绑定等。然后介绍我们如何结合 Elastic Stream 使 Kafka Serverless 化，主要内容通过以下三部分展开：1）基于 Elastic Stream 实现的无状态 Kafka Broker 弹性架构；2）Elastic Stream 弹性架构；3）如何充分利用云基础设施，助力 Kafka 节省至多 70% 成本。

嘉宾

韩旭

安托盟丘（AutoMQ）存储技术负责人

2023-08-19

16:15 - 16:45

Apache HugeGraph 图数据库在货拉拉的应用与调优

本演讲将重点介绍基于 Apache HugeGraph 图数据库的落地实践，并侧重于离线导入和同步查询性能优化，以及围绕稳定性构建日志和监控大盘。同时，我们也将强调参与图数据库社区建设的重要性。在演讲中，我们将深入探讨以下方面： 1. 落地实践：我们将分享基于HugeGraph图数据库的实际应用案例，并讨论如何将图数据库成功应用于业务场景中。涉及图建模，图数据质量保障等方面。重点关注在线实体关系图谱的构建，以支持实时的图数据查询和分析。 2. 离线导入性能优化：我们将探讨如何优化离线导入过程，以实现高效的大规模图数据导入。涵盖数据预处理、并行导入等关键技术，以提升导入性能和效率。 3. 同步查询性能优化：我们将介绍基于HBase开发的核心功能，以优化同步查询的性能和响应时间。 4. 日志和监控大盘构建：我们将讨论如何建立完善的日志和监控系统，以实现对图数据库平台的实时监控和故障排查。重点关注日志记录、异常检测、性能监控等方面，以确保系统的稳定性和可靠性。 5. 参与社区建设：我们将强调图数据库社区建设的重要性，并鼓励听众积极参与其中。我们将分享社区资源和合作机会，以及如何与其他开发者和用户共同推动图数据库平台的发展和创新。通过本演讲，您将深入了解基于 Apache HugeGraph 的图数据库在业务中的落地实践，以及如何优化离线导入和同步查询性能优化，构建日志和监控大盘，并参与图数据库社区建设。这将帮助您更好地应用图数据库技术，提升业务应用的性能、稳定性和可靠性。

嘉宾

杨嘉奇

货拉拉大数据工程师

2023-08-19

13:30 - 17:45

RPC / Service Mesh

天鸿厅3

主持人

刘军

2023-08-19

13:30 - 14:00

Apache Dubbo 静态化 GraalVM Native Image 解决方案与实践

Java 应用的内存占用大等问题一直是 Java 语言的劣势，并且随着 Serverless 架构的兴起，Java 应用的冷启动开销大的问题所造成的影响愈发严重。而 GraalVM 的出现让 Java 应用在这些问题的解决上看到了希望。本次演讲将会为大家介绍 Dubbo 集成 GraalVM Native Image 技术的发展历程，Dubbo 是如何通过 AOT 技术实现静态化加速、RPC 框架在集成 Native 技术上的一些思考。除此之外，还会带来Dubbo 集成 GraalVM Native Image 的示例与未来规划。

嘉宾

华钟明

杭州有赞科技有限公司中间件技术专家

2023-08-19

14:00 - 14:30

Apache Dubbo 云原生可观测性的探索与实践

Dubbo3 开始重点加强了内部可观测性建设，维护了多个纬度的可观测模块，支持多种方式的可视化监测，本次演讲重点展示如何基于 Dubbo3 可视化检测微服务集群状态，同时讲解 Dubbo 在指标、全链路追踪、日志等方面的一些设计原理与最佳实践。

嘉宾

宋小生

平安壹钱包中间件资深工程师

2023-08-19

14:30 - 15:00

基于 Triple 协议实现Web、移动端、后端服务全面打通

这次演讲我们将全面讲解如何基于 Dubbo 构建一套前、后端互通的微服务体系。Dubbo Triple 协议设计为一种通用的、构建在 HTTP 之上的 RPC 协议，Triple 易于浏览器访问、兼容 gRPC 且支持 Streaming 通信的协议，可同时运行在 HTTP/1、HTTP/2 协议之上。结合 Dubbo Triple 协议的特性，以及 Dubbo 提供的多语言 SDK，我们可以基于 Dubbo 轻松实现前后端互通的微服务体系。如 Dubbo 提供了 Java 客户端可以让开发者编写工作在浏览器侧的 web 应用程序，使用 Dubbo 的 Node.js、Java、Go、Rust 等后端语言 sdk 可以构建后端互通的微服务体系。

嘉宾

陈有为

陌陌研发工程师

2023-08-19

15:00 - 15:30

精进云原生 - Dubbo Kubernetes 最佳实践

随着云原生的兴起，越来越多的应用选择基于 Kubernetes 进行部署，相关的 DevOps 等工具也应运而生。而 Dubbo 作为微服务体系的主流解决方案，如何开发面向 Kubernetes 部署和运维的微服务应用是很多开发者与架构师要解决的问题。本次演讲将从开发、部署、监控、运维等多维度视角分析，详细的介绍如何基于 Dubbo 在Kubernetes 体系下构建高效、可靠的微服务应用。

嘉宾

江河清

阿里云研发工程师

2023-08-19

15:30 - 15:45

茶歇

2023-08-19

15:45 - 16:15

政采云基于dubbo的混合云跨网方案实践

对云岛业务结构的公司来说，云平台属于公司内部、完全可控的局域网，而岛端则是有自己安全网络策略的独立内部网络。需要云岛通信时，会基于需求，按客户要求走流程开通一些端口，这个过程需要一定的成本且不完全可控。业务上，如果这种跨网需求增多，则会逐渐变成痛点。如果可以搭建一个透明的跨网传输网络，配合良好的顶层设计，就可以在业务支撑、安全管控和运维成本中寻求较好的平衡。本次演讲将介绍政采云基于 Dubbo 的跨网方案落地过程中面临的技术挑战、社区合作以及更深层次抽象的一些思考。在政采云这种政企业务场景中的数据跨网，与业界公有云、自建私有云的公司相比，既有共性又有自己的特点，希望能为大家提供新的思路或者启发。

嘉宾

王晓彬

政采云资深开发工程师

2023-08-19

16:15 - 16:45

OpenSergo & Dubbo 微服务治理最佳实践

在现代微服务架构中，针对复杂微服务架构的稳定性治理是广大开发者关注的重点。本次分享主要围绕微服务治理展开，介绍如何结合微服务治理 OpenSergo+Sentinel 技术体系，结合全链路灰度、流量防护、服务容错等能力来保障 Apache Dubbo 微服务的稳定性，并结合常见稳定性场景介绍微服务治理的最佳实践以及背后的技术内幕与生态发展。

嘉宾

何家欢（屿山）

阿里云 MSE 研发工程师

2023-08-19

16:45 - 17:15

工商银行分布式建设及转型实践

本议题主要介绍中国工商银行通过技术手段解决分布式架构转型过程中分布式服务领域遇到的一些挑战，譬如:大规模集群场景下万级连接网络高性能优化、ZK注册中心性能优化、深度定制多点接入等;以及工商银行在分布式服务领域的建设情况与规划。

嘉宾

丁兴中

中国工商银行软件研发中心云计算实验室分布式微服务框架架构师

2023-08-19

17:15 - 17:45

Seata：微服务架构下的一站式分布式事务解决方案

随着云原生架构的普及，微服务架构已经成为了主流的应用开发模式。在微服务架构中，服务被拆分成了多个小而独立的服务，并通过网络通信来完成业务处理。这种架构下，分布式事务的问题就凸显出来了。分布式事务面临很多挑战和问题，例如多个服务之间如何保证数据一致性、如何保证分库分表数据一致性，异构数据库的数据一致性等。如果没有一个良好的分布式事务解决方案，这些问题会给应用的使用带来很多不可预期的风险。一套好的分布式事务解决方案，它能够帮助企业在云原生架构下保证数据一致性，提高服务质量和可用性，减少业务风险和提升开发迭代效率。本次分享将围绕以下几个方面展开分享： 1. 微服务架构下数据一致性的挑战 2. 分布式事务Seata的架构演进 3. 如何基于Seata扩展RPC框架

嘉宾

季敏（清铭）

阿里云分布式事务产品负责人，Seata 开源项目创始人，微服务开源治理负责人

2023-08-19

13:30 - 17:15

数据存储与计算

金辉厅3

2023-08-19

13:30 - 14:00

数据安全：Apache Ozone 如何保证数据的存储和访问安全

Apache Ozone 是 Apache 基金会下的新一代分布式存储，构架简洁，扩展性好，同时支持 S3 对象协议，和 Hadoop 文件系统。支持 MR, Hive, Spark 和 Impala 等计算引擎; 支持 AWS 客户端访问；丰富的企业级特性。数据安全是存储系统的基石。本次分享将主要介绍 Apache Ozone 数据安全功能，包括数据的存储可靠性，副本容灾性，数据巡检，数据校验等等，和访问安全性，认证，鉴权，加密，日志等等。通过这些功能，帮助用户实现一个安全可靠的大数据存储系统。

嘉宾

陈怡

Cloudera 首席存储工程师

2023-08-19

14:00 - 14:30

字节跳动 MapReduce -> Spark 平滑迁移实践

随着业务发展，字节跳动内部每天线上约运行 120万个 Spark 作业，与之相对比的是，线上每天依然约有两万到三万个 MapReduce 任务。作为一个历史悠久的批处理框架，从大数据研发的角度来看，MapReduce 引擎的运维面临了一系列问题。例如，框架更新迭代的的 ROI 较低，对于新的计算调度框架适配性较差等等。而从用户的角度来看， MapReduce 引擎的使用也存在一系列的问题。例如，计算性能不佳，需要额外的 Pipeline 工具管理串行运行的 Job，希望迁移 Spark 但是存量作业数量多且大量作业使用了 Spark 本身不支持的各种脚本。在此背景下，字节跳动 Batch 团队设计并实现了一套 MapReduce 任务平滑迁移 Spark 的方案，该方案使用户仅需对存量作业增加少量的参数或环境变量即可完成从 MapReduce 到 Spark 的平缓迁移，大大降低了迁移成本，并且取得了不错的成本收益。

嘉宾

魏中佳

字节跳动基础架构工程师

2023-08-19

14:30 - 15:00

Apache Kudu 在神策的应用和实践

Apache Kudu 在神策的应用中遇到的困难，我们的解决方案，以及我们未来对Apache Kudu的规划。重点介绍以下3点： 1. Apache Kudu的数据迁移 2. 解决Apache Kudu启动慢的问题 3. 解决Apache Kudu metadata存储问题

嘉宾

汪细勖

神策网络科技（北京）有限公司分布式软件开发工程师

2023-08-19

15:00 - 15:30

小米 HDFS 数据治理实践与演进

HDFS 作为小米底层数据存储系统，随着公司业务的高速发展，数据规模飞速增长，存储成本也快速上升， HDFS 数据治理成为了一件无法避开的事情。本次分享着重于介绍小米内部进行 HDFS 数据治理的背景，如何基于冷热温数据分层存储思想，利用性价比更高的公有云对象存储，实现 HDFS 数据治理的实践与演进过程，以及未来的数据治理规划。

嘉宾

王成伟

小米高级软件研发工程师

2023-08-19

15:30 - 15:45

茶歇

2023-08-19

15:45 - 16:15

Apache Celeborn(Incubating): 让 Spark 和 Flink 更快更稳更弹性

Apache Celeborn(Incubating)是一个高性能，高可用，可伸缩的通用Shuffle服务，支持Spark/Flink两大主流引擎(未来将支持Tez/MR等更多引擎)。Celeborn在阿里及多家知名企业支撑每天数十P的生产Shuffle，提升稳定性和性能的同时降低成本。本次分享将介绍Celeborn的高性能高可用核心设计，支持多引擎的统一架构，用户案例，以及如何更好的参与社区。

嘉宾

周克勇

阿里云 EMR Spark引擎负责人

2023-08-19

16:15 - 16:45

基于Apache Linkis快速高效构建数据应用工具

简要介绍Apache Linkis以及社区发展情况，并讲述Apache Linkis是如何作为数据应用工具的开发基座，降低上层应用工具在连通、扩展、管控、复用等计算治理方面的开发工作量，比如数据质量工具只需关注质量规则的管理，而无需处理任务的高并发和多租户问题。此外，我们还将探讨基座为数据应用工具提供了哪些必不可少的功能。

嘉宾

王和平

微众银行高级工程师

2023-08-19

16:45 - 17:15

How increasing partition size in Apache Cassandra can reduce disk usage by over 30%

Did you know that over-partitioning in Apache Cassandra can lead to excessive storage requirements? In this presentation, we explore how, at Instaclustr, were able to reduce the storage footprint of our metrics data by over 30%, from 244tb to 157tb, and improve general performance of our cluster - simply by making a small change to the schema of the tables we were using. Instaclustr manages a fleet of over 10 000 customer servers as part of our managed service offering and part of that system includes real time metrics collection from the operating system and running applications which are stored in a 70 node Apache Cassandra cluster. We will go into detail explaining what problems the existing schema was designed to solve, how our Cassandra experts determined what we needed to change, and why the change was able to drastically improve our storage efficiency without major changes to our downstream systems.

嘉宾

John Del Castillo

Technology Evangelist, NetApp

2023-08-19

13:30 - 17:15

开源社区

金辉厅2

2023-08-19

13:30 - 14:00

Apache ShenYu社区建设的道与术

1.History of Apache ShenYu 2.The prepared for Apache incubator 3.The graduate way of ShenYu

嘉宾

肖宇

京东科技架构师

2023-08-19

14:00 - 14:30

开发者内容体验解密之旅，追风踏浪

最近几年，软件行业步入了云原生 2.0 时代，新兴技术的层出不穷给开发者带来了甜蜜的负担——他们既享受了更多的选择权，也承担了更大的复杂性。随着「开发者至上」文化的兴起和开发者对产品选型的决策权重越来越大，全球各大科技巨头正在从传统的销售思路转变为以开发者为中心的思路来推广产品（B2D），而优质的内容是最有效的营销策略。面对这群挑剔玩家，为了加速飞轮效应，如何设计令开发者一见钟情的内容？为了提升开发体验，如何打造内容的「Aha Moment」？为了增强用户粘性，如何通过内容让开发者日久生情？为了夯实品牌竞争力，如何为开源和商业产品制定差异化的内容策略？——本次分享将以顶级开源项目 Apache Pulsar 和行业最佳实践为例，深度解析如何为开发者设计引人入胜的内容体验。

嘉宾

Yu Liu

Technical Writer, StreamNative

2023-08-19

14:30 - 15:00

面对开源，你还只有用“爱”发电吗？

用爱发电，似乎成了开源爱好者的必备标签，外行看来没有对开源的“爱”也就没参与的理由和动力。Rick 经过他自己的实践、摸索，对为什么要参与开源有了一些新的认识，用“爱”发电来参与开源本身没有问题，但对如何更广泛地推广开源还是不够的。兴趣可以让人们开始走向开源之路，但没有理智、利益的加持是无法持久、深入到开源中来。Rick 希望借助这次分享，让已经在用“爱”发电的开源人士可以想清楚未来之路，对开源尚未产生兴趣的人们看到开源不止于“爱”。

嘉宾

Rick

开源面对面布道师

2023-08-19

15:00 - 15:30

开源之夏——致力点亮新生代开发者的星星之火

开源之夏是中科院软件所“开源软件供应链点亮计划”指导下的系列暑期活动，旨在鼓励在校学生积极参与开源软件的开发维护，培养和发掘更多优秀的开发者，促进优秀开源软件社区的蓬勃发展，助力开源软件供应链建设。开源之夏如今活动已迈入第四个年头，开源之夏与众多蓬勃发展的开源社区携手并进，不断推动开源技术在高校学生中的普及和推广，使得越来越多的学生参与到开源项目中来，更多优秀的开源贡献者和开源项目应运而生，为推动开源生态发展提供了有力的支持。开源之夏将继续点燃星星之火，助力新时代开发者人才的挖掘和培养。

嘉宾

李梦

中科院软件所开源之夏品牌负责人

2023-08-19

15:30 - 15:45

茶歇

2023-08-19

15:45 - 16:15

开源之夏最佳实践

举办一些编程社区活动，是促进学生们参与开源项目、加入开源社区的有效方式。开源之夏是一个中科院软件所举办的一项面向暑期开源活动，类似Google Summer of Code（GSOC），是国内此类活动的先驱。做为开源之夏第一位校园先锋，这次演讲主要希望分享在校园中开源相关的经验和收获。包括学生们在参与开源社区时遇到的一些困难，社区如何有效引导学生积极参加开源项目，以及做为一个校园大使在开源布道中的一些经验和教训。此外，对于想要参与或正在参与开源的学生，我写了一个名为开源之夏最佳实践的文档项目，为对开源感兴趣的同学提供相关的帮助。

嘉宾

王嘉树

北京邮电大学学生

2023-08-19

16:15 - 16:45

Apache Doris 毕业一周年：全球最活跃开源数据库项目的共建之道

Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库，以极速易用的特点被人们所熟知。截止目前 Apache Doris 已经成为全球大数据和数据库领域最活跃的开源项目之一，在本次的大会上我将分享 Apache Doris 从孵化到成为顶级项目的成长之一，并分享如何推动社区用户和开发者快速增长。

嘉宾

鲁志敬

Apache Doris 社区 Committer

2023-08-19

16:45 - 17:15

《开源 PolarDB-打造世界级云原生数据库开源社区》

云原生数据库 PolarDB 是阿里云自研产品，在存储计算分离架构下，利用了软硬件结合的优势，100%兼容 MySQL 和 PostgreSQL 生态，为用户提供秒级弹性、高性能、海量存储、安全可靠的数据库服务。PolarDB 分布式版历经十余年淬炼，始终保持对阿里集团“双十一购物狂欢节”所有相关业务的全面支撑。PolarDB 坚定遵循自主可控、开放生态的发展思路，持续围绕 MySQL、PostgreSQL 开源生态构建企业级、分布式能力，以求最大程度降低用户的学习使用成本。本次分享主要包括数据库发展趋势、阿里云对于数据库开源的思、以核心开源项目PolarDB为例，讲述如何打造一个健康活跃的数据库开源社区的探索实践之路。演讲大纲： 1.数据库业界发展趋势：全面拥抱云原生； 2.阿里云数据库整体开源策略； 3.开源产品系列； 4.开源数据库PolarDB社区运营及生态建设。

嘉宾

周正中

阿里云数据库高级产品专家，阿里云PolarDB开源社区运营负责人

2023-08-19

13:30 - 16:15

数据湖与数据仓库

金辉厅1

2023-08-19

13:30 - 14:00

云原生数据湖如何提速两倍以上

随着云计算与大数据技术的融合，云原生湖仓逐渐成为业界的热点。Kubernetes和Apache Spark做为云原生和大数据领域的开源技术领导者，彼此结合成为很多人的首选。然而将Spark在Kubernetes上作为湖仓分析引擎，面临诸多挑战，例如资源管理、任务调度、存储对接、弹性伸缩、高可靠性等。Kyligence 在服务各类客户的过程中积累了丰富的经验，并积极参与和回馈社区；此次演讲将分享如何基于一系列开源技术如 K8S、Spark、Gluten、Volcano、Kyuubi 等打造开箱即用的云原生湖仓分析引擎。

嘉宾

史少锋

首席架构师，Kyligence Inc

2023-08-19

14:00 - 14:30

Apache Paimon 流式数据湖：CDC 入湖与流读

Apache Paimon (incubating) 是一项流式数据湖存储技术，可以为用户提供高吞吐、低延迟的数据摄入、流式订阅以及实时查询能力。Paimon 采用开放的数据格式和技术理念，可以与 Apache Flink / Spark / Trino 等诸多业界主流计算引擎进行对接。此次分享主要介绍 Paimon： - CDC 入湖 Schema Evolution - CDC 整库入湖 - CDC 入湖部分列更新 - 实时变更日志流读

嘉宾

李劲松

阿里巴巴高级技术专家，阿里云开源大数据表存储团队负责人

2023-08-19

14:30 - 15:00

下一代超高性能大数据集成工具 - Apache SeaTunnel 在数据湖场景的应用

当今数据源多达几百种，来源不仅有关系型和非关系型数据库，还有 SAAS、日志及接口数据等，离线批量同步已不能满足业务需求，越多越多的业务要求实时同步，如何让这些数据源之间可以快速高效进行离线和实时同步，且做到数据一致性及完善的监控同时占用最少的资源，这是对数据集成的一个极大的挑战解决思路: 利用 Apache SeaTunnel 数据同步管道结合 SeaTunnel 自己专用同步引擎 Zeta 来解决集成难问题，同时可以以尽可能低的资源完成数据同步，对于大规模的数据集成同步提供更优的表现。听众收益 1、Apache SeaTunnel 功能与架构设计 2、为何研发 SeaTunnel 自己的同步引擎 Zeta、而不是选择基于 Spark/Flink？ 3、用户使用案例及后续 Roadmap 等内容

嘉宾

代立冬

白鲸开源联合创始人

2023-08-19

15:00 - 15:30

基于 Apache Iceberg, Apache Arrow 和 Apache Parquet 的创新 lakehouse 设计

云器科技成立于2021年，是一家多云及一体化的数据平台提供商。本次讲座我们将揭秘如何使用和优化Apache Iceberg、Apache Arrow和Apache Parquet，来打造一个拥有开放生态系统和极佳性能的多云lakehouse。

嘉宾

吴刚

云器科技软件工程师

付旭炜

云器科技软件工程师

2023-08-19

15:30 - 15:45

茶歇

2023-08-19

13:30 - 17:15

物联网/工业物联网

鸿运厅3

2023-08-19

13:30 - 14:00

工业互联网背景下的应用与时序数据管理解决方案

工业互联网不仅仅是物与物，人与物之间互联互通，而是包括上层应用与数据的系统工程。本次分享将向大家讲述应用与时序数据的管理会遇到怎样的挑战，以及用什么技术来解决这些问题。

嘉宾

许浩

上海道客网络科技有限公司技术顾问

2023-08-19

14:00 - 14:30

基于 IoTDB Pipe 玩转工业物联网端边云数据同步

Apache IoTDB 是一款专为工业物联网场景设计的时序数据库，可支持在端边云各侧进行灵活的单机或分布式部署。在工业物联网场景中，端边云数据协同是一种常见的应用。本次分享将介绍 Apache IoTDB 在端边云数据协同中的应用，并将主要内容分为以下五部分： 1. 通过新能源和重型制造业场景探讨端边云数据同步的需求。 2. 分析现有的端边云数据同步解决方案的优点和痛点。 3. 讲述 IoTDB 端边云数据同步解决方案的演进历程。 4. 介绍全新的端边云数据同步一站式解决方案：IoTDB Pipe。 5. 展示基于 IoTDB Pipe 的数据生态系统构想，展示其无限可能性。

嘉宾

苏宇荣

天谋科技内核研发工程师

2023-08-19

14:30 - 15:00

面向IoT的消息队列核心设计

RocketMQ这样的传统消息队列主要面向的是微服务系统之间的消息异步通信，然而在消息这个大类下，还有一个非常重要且常见的消息领域，即IoT类终端消息。随着智能家居、工业互联而兴起的面向IoT设备类的消息正在呈爆炸式增长。设计一个同时面向IoT设备类消息和面向微服务的服务端消息的消息队列会具有非常大的价值。数据如果只存在一个系统内，可以最大地降低存储成本，同时可以有效地避免数据因在不同系统间同步带来的一致性难题和挑战。

嘉宾

潘东元

阿里云消息研发工程师

2023-08-19

15:00 - 15:30

释放物联网潜力：EMQX 与 Apache IoTDB 的结合

EMQX 作为一个大规模分布式物联网消息接入平台，能够高效可靠地连接海量设备，同时提供了很多专为物联网场景设计的功能，例如规则引擎、MQTT over QUIC 等等。而 Apache IoTDB 作为物联网时序数据库，专为高效存储、管理和分析大规模物联网数据而设计。本次演讲我们将探索 EMQX 和 Apache IoTDB 为物联网应用下带来的改变。演讲提纲： 1. EMQX 和 Apache IoTDB 分别是什么？ 2. EMQX 和 Apache 各自的优势是什么？ 3. 如何通过 EMQX 与 Apache IoTDB 结合进一步放大这些优势？ 4. 通过 Neuron + EMQX + Apache IoTDB 为工业物联网带来更多可能。

嘉宾

周子博

杭州映云科技有限公司 EMQ 社区布道师

2023-08-19

15:30 - 15:45

茶歇

2023-08-19

15:45 - 16:15

智能厂务耗量分析

工业领域的能源消耗一直是困扰企业可持续发展的大事，企业需要满足产能和环保及减排，同时为了可持续发展，就必须要节能。在这场分享中，将介绍我们厂务能源消耗统计存在的痛点，比如人工计算存在误差、消耗情况不透明，无法知道哪些环节存在浪费等。然后介绍我们如何使用IoTDB将传感器数据存储，并分析利用，主要内容通过以下四部分展开：1）IoTDB数据建模及部署；2）如何利用Spark强大的批处理能力，实现IoTDB离线写入；3）低延迟高效写入IoTDB的架构实践；4）如何利用IoTDB分析厂务系统真实耗量，并找到人工计算的误差。

嘉宾

李博

中芯国际助理专家

2023-08-19

16:15 - 16:45

RocketMQ-MQTT 在小米 IoT 场景的落地与实践

演讲介绍：本次演讲将从 MQTT 协议本身出发，介绍 MQTT 协议在小米物联网场景中的应用和小米是如何从实践中成功实现 MQTT 消息网关的技术架构迭代。提纲： - MQTT 协议与小米应用场景概述本节简要介绍 MQTT 协议的基本功能与特点，以及 MQTT 在小米 IoT 生态中的应用场景和典型案例 - 小米 MQTT 技术发展历程 - 架构演进本节主要介绍小米在落地物联网消息网关的过程中，针对 RocketMQ-MQTT 架构的吞吐性能、实时性、可靠性等方面遇到的问题以及解决思路 - 功能特性完善 MQTT 协议 V5.0 版本新增了一些功能和约束，本节主要阐明小米对新版本功能的取舍，以及如何通过实现 MQTT 认证鉴权、共享订阅、QoS2、CleanSession 等功能来为小米 IoT 业务赋能 - 容灾体系建设本节主要介绍小米 MQTT 容灾体系从无到有的过程，以及如何融合端-云两侧的容灾能力来共同保障小米 IoT 消息通信场景的高可用 - 总结与未来规划 RocketMQ-MQTT 在小米 IoT 场景的落地已经进入了快速发展的阶段，未来除了继续引入 MQTT 5.0 协议的新特性，如点对点消息、保留消息、遗嘱消息等外，还会探索更多可以极大提升业务效能的功能，例如物模型、规则引擎等

嘉宾

房成进

小米消息中间件研发工程师

2023-08-19

13:30 - 16:45

流处理

鸿运厅2

主持人

李钰

王鑫

2023-08-19

13:30 - 14:00

阿里云基于 Flink CDC 的实时数据集成实践

CDC（Change Data Capture）是用于从数据库中捕获变更的技术，Flink CDC 是实时数据集成框架的开源代表，具有全增量一体化、无锁读取、并发读取、分布式架构等技术优势，在开源社区中非常受欢迎。 Flink CDC 支持强大的数据加工能力，可以通过 SQL 对数据库数据做实时关联、聚合、打宽等, 配合 Flink 丰富的下游生态可以将加工后的数据方便地写入 Kafka、Hudi、Iceberg 、Doris等下游，实现数据实时入湖入仓。在本次分享中，我们将首先会介绍 Flink CDC 技术的核心设计和关键实现，详细讲解 2.4.0 版本的新特性。然后结合具体的业务场景，分享阿里云内部 Flink CDC 在不同场景针对业务痛点的解决方案，如入湖入仓场景，Binlog过期问题等。

嘉宾

阮航

阿里云高级研发工程师

2023-08-19

14:00 - 14:30

自如基于 Apache StreamPark 的大规模 On Kubernetes 实时计算生产实践深度解析

1. 在此次演讲中，我们将深度探讨如何借助Apache StreamPark——一站式实时计算作业管理平台，精细化管理自如超过300个Flink On Kubernetes 实时作业。Apache StreamPark为我们提供了一套直观的可视化界面，协助我们管理了众多关键功能，包括 Flink 作业的开发，作业部署到 Kubernetes，Flink Docker镜像管理、Flink Kubernetes Pod Template管理等。 2. 我们基于StreamPark 也探索出了一些创新实践：我们进一步与调度系统结合，实现了基于FlinkSQL的离线数据同步，从而优化了数据处理过程。通过Apache StreamPark，我们实现了实时作业的全生命周期管理，开发和管理人效都得到极大提升。这个过程生动展现了实时计算平台化管理的强大能力和其在实际生产环境中的巨大价值。

嘉宾

陈卓宇

自如大数据平台研发工程师

2023-08-19

14:30 - 15:00

Flink K8S Operator AutoScaling

流处理在当今大数据领域，其中，Apache Flink 正是一片黑马不断出现在大家眼前，但是其带来的24小时的运维挑战不可忽视。在当前降本增效的大背景下，资源的有效利用率成为了大家关注的重点。本次演讲详细阐述了Apache Flink社区衍生出来的子项目：Flink K8S Operator，简单介绍这个项目来源以及发展历史，同时介绍最新版本中引入的自动调优功能，从当前社区实现的自动调优（FLIP-271）功能到进行详细讲解其工作原理和最佳实践，同时引出社区正在实现的无停机更新功能（FLIP-291），最后介绍当前Flink社区和StreamPark在自动调优工作的一些未来规划

嘉宾

陈政羽

Apache Flink中文社区志愿者（大数据开发工程师）

2023-08-19

15:00 - 15:30

RSQLDB 基于消息队列的流数据库

随着数字化程度的加深，数据在爆炸性增长，对数据处理的实时性、正确性都提出了越来越高的要求，流计算应运而生。同时，消息队列产品作为数据流转平台，被广泛的运用在大数据计算架构之中，通过消息队列/消息引擎进行流计算的案例也是不胜枚举。然而在云计算时代，使用成本成为架构设计或者演进的主要目标。RSQLDB是一款基于消息队列RocketMQ为存储的分布式流计算引擎。最小支持2节点生产部署，标准化SQL交互方式极大降低使用门槛；功能上，RSQLDB支持窗口、JOIN和状态恢复等等。本演讲将从一下几个方面介绍RSQLDB： 1、流计算演进之路，为什么需要RSQLDB 2、RSQLDB架构设计原理 3、RSQLDB在阿里云的应用实践

嘉宾

倪泽

阿里云消息团队研发计算专家

2023-08-19

15:30 - 15:45

茶歇

2023-08-19

15:45 - 16:15

State of Scala API in Apache Flink

As a Scala developer writing new Flink job, you expect to use latest Scala 3 version, rather the one Flink was compiled with. Support of Scala 2.13 and Scala 3 was not really possible until Flink 1.15 came out. In this talk we will review how the Scala API was done in Apache Flink prior the version 1.15 and what has changed in that release. Apache Flink chose quite opposite way to enable Scala developers to use any Scala version than Apache Spark project and that is interesting discussion on its own. During this talk we will go through the SBT example project to build Flink jobs with Scala 3. We will look at the current community options of Scala wrappers for Flink Java API and challenges related to that. In the result, we will see that using Scala in Flink jobs is much more convenient than writing your streaming jobs with Java API. An introduction of the Scala CLI makes the whole packaging experience of Scala Jobs a pure joy.

嘉宾

alexey

Solution Architect of Ververica

2023-08-19

16:15 - 16:45

小米 Flink 实时计算平台的建设实践

演讲介绍：本次分享将聚焦实时计算平台的建设，结合小米自身的业务实践经验，分享小米在实时计算领域的探索与建设，打造具备资源弹性、低成本、易用等特性的统一实时计算平台。提纲： - 小米实时计算平台介绍该部分将介绍小米实时计算的业务全貌，并结合小米实时计算平台的演变发展解读遇到的痛点与解法。 - 实时计算平台的演进该部分将介绍小米整体的实时计算平台架构，结合统一的元数据管理、权限管理、血缘、调度管理等方面展开小米在实时计算平台易用性方面的探索。 - 平台运维与治理该部分将深入探索实时计算的运维与治理工作，分享小米在框架层和平台层的探索，以及在治理闭环方法论的指导下通过产品化使小米实时计算平台具备资源弹性、低成本、易用的能力。 - 未来规划介绍小米实时计算平台未来的相关规划。

嘉宾

陈子豪

小米软件研发工程师

2023-08-19

13:30 - 16:45

性能工程

鸿运厅1

2023-08-19

13:30 - 14:00

Developing Fast Applications With Open Source Software - Without The Fury

Developing fast scalable Big Data applications has been made significantly easier over the last decade with horizontally scalable open-source databases and streaming technologies such as Apache Cassandra and Apache Kafka. Cloud-native trends have also accelerated the uptake and ease of use of these technologies, and they are available as managed services on multiple cloud platforms.

But maybe it has become too easy to embark on building complex distributed applications using multiple massively scalable open-source technologies, as there are still many performance and scalability issues to be aware of.

In this talk, I will give a high-level overview of some of the performance and scalability challenges I’ve overcome over the last six years building realistic demonstration applications using Apache Cassandra and Apache Kafka (and more), supplemented with performance insights from our operation of thousands of production clusters.

嘉宾

Paul Brebner

Open Source Technology Evangelist, NetApp

2023-08-19

14:00 - 14:30

基于 Kubernetes 部署 Apache JMeter 进行大规模负载测试

Apache JMeter 作为优秀的开源测试工具，自身具备分布式部署能力以支持较大并发，但仍难以支撑大型并发规模。为了使 JMeter 适用于百万量级规模的负载测试，我们对 JMeter 进行了改造，提升它在消息和数据处理上的吞吐能力，并以容器方式提供更强大灵活的水平扩展能力。为了统一管理发压容器的生命周期，进一步降低部署复杂性，并可从不同区域发起测试压力，我们将 JMeter 部署在 Kubernetes 集群上，以支持同时运行多个大规模负载测试，并设计了相关策略，在云环境上基于 VPC 对等连接实现多租户的私网负载测试。

嘉宾

殷翀元

EMQ 项目经理

2023-08-19

14:30 - 15:00

Apache Arrow Optimization on Arm

This speech introduces our practices of optimizing Apache Arrow on Arm platform. Using upstream PRs as solid examples, we will present the techniques to profile and optimize complex workloads on Arm, including but not limited to Top-down methodology, Arm SPE (Statistical Profiling Extension), NEON, etc. Apache Arrow is a multi-language toolbox for accelerated data interchange and in-memory processing. This speech focuses on Arrow C++ implementation. As an example, we will show how Arm SPE helps to identify a performance bottleneck from a mis-predicted branch in Arrow CSV writer benchmark, which leads to an optimization that achieves ~50% performance uplift with trivial code changes. Audience may learn general software profiling and optimization knowledge from this speech, as well as Arm specific techniques.

嘉宾

Yibo Cai

Principal Software Engineer, Arm

2023-08-19

15:00 - 15:30

Java profiling Internals and Its Applications

Better application performance can provide better user experience, reduce enterprise IT costs, and make the system more stable and reliable. This topic will introduce the principles, internals and best practices of commonly used Java performance analysis tools (such as Java Flight Recorder, async-profiler), and how to create continuous profiling products, as well as the experience of continuous profiling on real Kafka projects. Java性能剖析详解及其应用 Java是目前最流行的服务端语言之一，如何诊断和改善Java应用的性能，是广大开发者非常关心的问题。更好的应用性能，可以提供更好的用户体验，可以降低企业IT成本，可以让系统更稳定和可靠。本主题将介绍最常用的Java性能剖析工具（如Java Flight Recorder、async-profiler）的原理和最佳实践，也会介绍如何搭建持续性能剖析系统以及在真实的Kafka项目中的应用和经验。

嘉宾

杨龙

Tool Development Engineer, Alibaba

2023-08-19

15:30 - 15:45

茶歇

2023-08-19

15:45 - 16:15

OPPO大数据Spark、Flink引擎诊断系统的设计与实践

OPPO在EB级数据量、大数据组件多、问题种类多情况下，从问题触发、快速定位、问题优化到问题收敛，打造一个引擎诊断平台，提供给用户在大数据Flink、Spark作业方面的性能优化工具，提升用户解决问题效率，降低用户作业资源使用，最后开源系统 https://github.com/cubefs/compass，为社区贡献力量。

嘉宾

庄泽波

OPPO 高级后端研发工程师

2023-08-19

16:15 - 16:45

优化 HDFS 性能:在 KUNPENG920 上实现硬件加速器和 ARM64 多核能力的均衡利用

在当今快速发展的技术环境中，利用硬件加速器来减轻CPU以计算为中心的任务已经变得司空见惯。传统上，压缩和加密等任务都是由这些加速器完成的。然而，随着我们继续增强整个系统的各种组件(包括内存、磁盘I/O和网络功能)，我们遇到了瓶颈的转变，在某些场景中再次强调以计算为中心的任务。虽然升级硬件加速器可能并不总是一个可行的解决方案，但我们仍然可以利用Arm64服务器架构的多核特性的固有功能和多功能性来提取额外的带宽。这次演讲的目的是介绍一种复杂的软件方法，有效地识别这些瓶颈，并提供我们如何将更多的CPU内核重新集成到以计算为中心的任务中的见解。最终目标是在硬件加速器和多个CPU内核之间实现高效智能的任务分配。在本演示的最后，将展示一个标准化基准，以演示通过实现此方法所获得的显著增强。此外，我们将概述我们未来的计划，并热切欢迎社会各界以任何身份合作。

嘉宾

Guodong Xu

Senior Tech Lead, Linaro Ltd.

2023-08-20

09:30 - 12:00

Keynote 主题演讲

主会场

2023-08-20

09:30 - 10:00

AI大模型来袭：开源治理和开发者关系的挑战和机遇

随着AI大模型的快速崛起，我们不得不重新审视以社区贡献为本的经典开源治理方式——"Community Over Code"的精神是否还能适应新的挑战。同时，以开发者体验为中心的开发者关系也在向新的范式转变，以适应日渐壮大的开发者社区的需求和期望。本演讲将探讨在这个发展飞速的AI大模型新纪元，开源项目的不同角色如何应对可能遭遇的挑战，如何抓住其中的机遇，并思考未来开源商业模式可能的变迁。希望通过这次分享，我们能共同探讨开源社区在面对AI大模型来袭时如何保持"Community Over Code"的精神，并找到适应新时代的方法和路径。

嘉宾

林旅强 Richard Lin

零一万物开源负责人

2023-08-20

10:00 - 10:30

Talking with management about open source

For those of us who already know how important open source is, it can
be challenging to persuasively make the case to management, because we
assume that everyone already knows the basics. This can work against
us, confusing our audience and making us come across as condescending
or concerned about irrelevant lofty philosophical points.

In this talk, we take it back to the basics. What does management
actually need to know about open source, why it matters, and how to
make decisions about consuming open source, contributing to open
source, and open sourcing company code?

嘉宾

Rich Bowen

Apache 软件基金会董事，AWS 开源战略师

2023-08-20

10:30 - 11:00

借助开源生态的力量，探索自我成长与职业发展的价值

开源社区与开源技术为各行各业的发展带来强大动力，也为在开源社区探索的组织、社区、个人带来文化与思想的转变。在开源生态里，参与方的角色不同，所关注的问题、参与的方式、收获的价值存在较大差异。本次分享将主要聚焦在作为个体，如何看待开源社区及开源技术、如何在开源社区里找到个人的参与方式，从而发现更多兴趣、进行自我提升、并在职业发展中获得新的能量和价值。

嘉宾

潘娟 Trista

SphereEx 联合创始人 & CTO

2023-08-20

11:00 - 12:00

闪电演讲

闪电演讲每场5分钟，大概安排 8 - 10 场演讲

2023-08-20

13:30 - 15:45

孵化器

金辉厅 5

2023-08-20

13:30 - 14:00

Navigating the ASF Incubator Process

This talk provides an overview of the Apache Software Foundation (ASF) and its incubation process. It guides projects on learning the Apache Way, ensuring compliance with licensing and intellectual property rights, and fostering community growth. The process involves creating a proposal, entering the incubator, focusing on community building and making releases, and eventually graduating as a top-level ASF project. Key aspects covered in this talk include, complying with licensing, engaging in open and transparent practices, and adopting a vendor-neutral approach. This presentation offers valuable insights for those interested in joining the ASF or seeking an understanding of the incubation process.

嘉宾

Justin Mclean

Apache 软件基金会董事

2023-08-20

14:00 - 14:30

Apache HugeGraph在图数据库开源领域的思考与实践

1. 图系统的背景与当前概况 2. HugeGraph 的开源历史 3. 加入 Apache 基金会的苦与甜 4. 开源社区如何在有限资源下提升运营 5. 外部贡献者 & 高校合作之路 6. "开源节流" & "降本增效"的思考图数据库是一种专门存储和处理图结构数据的数据库，它在社交网络、知识图谱、推荐系统等领域有着广泛的应用。 HugeGraph 支持多种后端存储、多种图计算框架、多种图分析算法，以及丰富的工具和接口。HugeGraph 于2018年对外开源，并在 2022 年正式加入Apache孵化 (Incubating)。加入 Apache 基金会对 HugeGraph 有着重要的意义，它不仅提升了项目的知名度和影响力，也让项目遵循了 Apache 的开放、包容、合作的理念和规范。当然，加入 Apache 也有一些挑战和困难，比如如何适应 Apache 的流程和文化，如何吸引和留住更多的贡献者和用户，如何平衡商业利益和社区利益等。为了让 HugeGraph 的开源社区能够在有限的资源下提升运营，我们采取了一些措施，比如建立了项目网站、文档、论坛、博客等平台，组织了线上线下的活动和培训，制定了贡献者指南和代码规范等。我们也积极地寻求外部贡献者和高校合作的机会，通过多种方式激励更多的人参与到项目中来。最后，我们也在思考如何在"开源节流"和"降本增效"的方面做得更好，比如如何利用云计算等技术降低图数据库/图计算系统的部署和运维成本，如何通过标准化、模块化、组件化等方式提高图数据库的开发和测试效率，如何通过创新、优化、协作等方式提升图数据库的性能和功能。

嘉宾

金子威

百度资深研发工程师

2023-08-20

14:30 - 15:00

StreamPark ─ 从个人项目到 Apache 孵化器

随着流计算的火热发展，Apache Flink/Spark 等开源项目被广泛使用，流作业的开发和管理成为广大用户不得不面对的问题，鉴于此 StremaPark 项目开源了，提供了作业的快速开发框架和一站式是流计算管理平台。开源后受到很大关注，多家公司投入生产使用，不乏一二线大型企业。随后于2022年9月正式通过投票，进入 ASF 孵化器，成为中国第二个以个人名义捐赠到 Apache 的项目，本次分享将会介绍StreamPark的发展历程以及在孵化过程中经历的各种挑战和背后的故事。

嘉宾

王华杰

Apache StreamPark 创始人

2023-08-20

15:00 - 15:30

Apache OpenDAL(Incubating)：笨办法践行 Apache 之道

数据是未来最重要的资产之一，而数据访问是数据价值实现的关键环节。市场上存在着各种各样的存储服务，每个服务都有自己独特的接口和特性，给数据访问带来了很多复杂性和不便。 2023 年 2 月 27 日，OpenDAL 项目顺利通过投票，正式进入 Apache 软件基金会的孵化器。OpenDAL 提供一个统一、简单、高效、可靠、可观察的数据访问层，让开发者可以无缝地使用不同的存储服务，并享受到最佳的用户体验。本次分享将会围绕 OpenDAL 的发展历程与现状这条主线，着重介绍 OpenDAL 如何践行开源理念和 The Apache Way ，以及在孵化过程中的机遇与挑战。

嘉宾

尚卓燃（PsiACE）

Databend 研发工程师实习生

2023-08-20

15:30 - 15:45

茶歇

2023-08-20

13:30 - 17:45

Web 服务器 / Tomcat

金辉厅3

2023-08-20

13:30 - 14:00

Tomcat 的技术内幕和在喜马拉雅的实践

对tomcat的整体架构，网络模型，线程模型，内存copy，缓冲区，协议解析，类加载器等进行系统的分享，让你对tomcat有一个全新的认识，同时结合tomcat 在喜马拉雅的实践过程中的遇到的问题和调优措施，以及怎么配合下游的网关比如nginx，api网关的最佳实践。

嘉宾

彭荣新

喜马拉雅资深架构师

2023-08-20

14:00 - 14:30

GraalVM 静态编译在 Web 容器应用中的使用实践

本次分享会介绍了 GraalVM 静态编译技术的最新发展，以及它在 Web 容器应用领域的最新应用实践。

嘉宾

饶子昊

阿里云智能研发工程师

2023-08-20

14:30 - 15:00

如何参与 Tomcat 社区

您可能知道，Apache Tomcat 是用于部署和运行 web 应用程序的最流行的 Java 应用程序服务器之一。参与 Tomcat社区不仅允许您为服务器的开发和改进做出贡献，而且还为您提供了向有经验的开发人员学习和与志同道合的人合作的绝佳机会。在本节中，我将为您介绍一些参与 Tomcat 社区的方法，并现场演示如何这样做，您会发现这比您想象的要简单。

嘉宾

李晗

网易有道高级工程师

2023-08-20

15:00 - 15:30

使用APM工具链快速定位Tomcat问题最佳实践

Tomcat作为业界最广泛使用的Web容器，在用户实际的使用过程中，由于使用场景各不相同，往往也会遇到千奇百怪的问题。如何利用APM工具链在业务出现问题的时候快速定位问题、优化性能是一个让所有工程师都头疼的问题。本次演讲将会给大家分享本人多年以来在服务阿里巴巴内部业务以及公有云用户的过程中，总结出的一整套Tomcat问题排查最佳实践，帮助您在业务出现问题可以做到宝典在手、遇事不抖

嘉宾

陈承

阿里云高级开发工程师

2023-08-20

15:30 - 15:45

茶歇

2023-08-20

15:45 - 16:15

Dubbo-Go-Pixiu的前世今生

Dubbo-Go-Pixiu是一款开源的Dubbo生态的API网关和集群接入解决方案。作为API网关，Pixiu具备接收外部HTTP/Dubbo/Triple网络请求的能力，并将其转换为Dubbo/Triple等协议的请求，以实现Dubbo生态中HTTP/Dubbo/Triple的无缝连接。即将发布的1.0版本中，我们还将引入Dubbo Mesh Proxyless控制面的首个版本。

嘉宾

吕梦超

上海联蔚数字科技集团股份有限公司高级 JAVA 工程师

2023-08-20

16:15 - 16:45

Securing Tomcat

This presentation provides an overview of securing Tomcat, one of the widely used Java-based web server and servlet container. The presentation covers key security considerations, security features within Tomcat, and various techniques and industry best practices to secure different aspects of Tomcat.

嘉宾

Dennis Jacob

Senior Consultant at a Payments Technology Organization

2023-08-20

16:45 - 17:15

Secure by default web applications with Apache Sling

A product that works is not done, as there are many facets to consider - availability, scalability, security. Of those, security is probably the most costly to get wrong. This talk will build a threat model for a sample web application, showcasing a structured approach to securing your web application. Various vulnerabilities are shown and mitigated, based on current best practices. We take special care to show to eliminate entire classes of vulnerabilities, rather than tackling problems one by one. The code samples will be built on top of Apache Sling, but previous knowledge of Sling or its components is not required. After this talk attendees will have learned of a structured approach for proactively handling security as part of the development process.

嘉宾

Robert Munteanu

Senior Computer Scientist of Adobe

2023-08-20

13:30 - 16:45

DataOps

金辉厅2

主持人

郭炜

聂励峰

2023-08-20

13:30 - 14:00

新一代数据集成平台Apache SeaTunnel

Apache SeaTunnel是一个批流一体数据同步工具，本次分享将分享数据集成以及数据集成领域常见的痛点，以及Apache SeaTunnel是如何解决这些问题并做到数据同步全场景支持，如何实现断点续传和数据一致性保障。同时会分享ApacheSeaTunnel未来的roadmap，以及可视化Web的研发情况。

嘉宾

高俊

白鲸开源架构师

2023-08-20

14:00 - 14:30

DataOps 在联通数科的实施构建数据研发运营一体化能力

联通使用接近70个DolphinScheduler节点调用15000+Hadoop平台进行相关任务调度和开发。本次分享中分享联通数科基于DolphinScheduler实现DataOps的实施过程，在实施过程中遇见的问题以及我们的解决方案。

嘉宾

王兴杰

联通数字科技有限公司数据平台架构师

2023-08-20

14:30 - 15:00

如何使用 Apache SeaTunnel 快速接入新数据源

Apache SeaTunnel是一个快速同步多种数据源的开源项目，它可以对接SaaS、数据库、Kafka、云数据库等，本次演讲会介绍在遇到新数据源的时候，如何开发新数据源接入SeaTunnel，从而可以和100多种数据源对接1.介绍SeaTunnel v2架构source/sink的新接口2.使用SeaTunnel接入新数据源的最佳实践3.如何从0到1参与到SeaTunnel贡献4.SeaTunnel的未来展望与愿景

嘉宾

田超

Apache SeaTunnel PMC 大数据开发工程师

2023-08-20

15:00 - 15:30

Apache DolphinScheduler与云对象存储的对接与整合

对象存储是一种以非结构化格式存储和管理数据的技术，是数据湖场景下的理想存储方案。Apache DolphinScheduler作为一个云原生大数据工作流调度平台，与当今主流的云对象存储（Amazon S3, Google Cloud Storage, Aliyun OSS等）都进行了对接与整合。本次演讲主要分享Apache DolphinScheduler在资源中心的文件存储和任务日志的远程存储两个场景下，如何与云对象存储进行对接与整合。

嘉宾

程鑫

阿里云研发工程师

2023-08-20

15:30 - 15:45

茶歇

2023-08-20

15:45 - 16:15

Apache DolphinScheduler 指标体系分享

介绍Apache DolphinScheduler指标体系，核心业务埋点等。分享如何通过指标监控保障Apache DolphinScheduler调度系统的稳定性，从而确保阿里云在DolphinScheduler上的任务稳定且快速跟踪。

嘉宾

高楚枫

阿里云 EMR 数据开发团队工程师

2023-08-20

16:15 - 16:45

数据集成技术在小米的应用与实践

简介：在大数据领域，数据集成技术应用场景广泛，为异构数据系统提供便利的数据同步、共享、融合等解决方案。本次分享将深入探讨小米在数据集成技术方面的应用实践场景，包括内部的演进、自研中间件引擎能力，以及平台化的实践等方面的说明，共分为以下3个方面： - 数据集成服务现状介绍分享数据集成技术的演进路线、整体服务架构以及服务规模，从离线/实时同步场景、多源异构同步实现、链路异常容错、性能与稳定性方面遇到的问题与解决方案进行说明 - 自研引擎能力剖析阐述流批一体实践、引擎任务编排模型，以及实践中的多项优化规则。从自研分布式引擎的实现原理、整体的技术能力与设计初衷进行说明 - 平台化能力剖析数据质量与链路监控、异构数据平台融合，以及链路数据修正与资源预估等方面的能力。从平台化的角度出发，说明实际应用过程中，数据集成在引擎平台化过程中的实践

嘉宾

郑钧元

小米高级软件研发工程师

2023-08-20

13:30 - 16:45

OLAP & Data Analysis

金辉厅1

主持人

陈明雨

2023-08-20

13:30 - 14:00

Apache Impala 在神策数据仓库中的最新实践

引言 1.1 Apache Impala 简介 1.2 神策数据仓库概述优先级调度实践 2.1 优先级调度原理 2.2 神策数据仓库中的应用与效果弹性计算实践 3.1 弹性计算原理 3.2 神策数据仓库中的应用与效果物化视图实践 4.1 物化视图原理 4.2 神策数据仓库中的应用与效果近期的工作 5.1 介绍神策近期开展的相关工作

嘉宾

张倩琼

大数据架构师

2023-08-20

14:00 - 14:30

Federated Cross-platform SQL with Apache Wayang

Federated query processing enables distributed query processing across multiple data sources, eliminating silos and improving data accessibility. It allows organizations to seamlessly query and analyze diverse databases or systems as a unified virtual database. By leveraging federated query processing, businesses gain deeper insights from distributed data sources, while data remains in its original location. This approach simplifies data integration, enhances governance, and empowers informed decision-making. In this talk, I will present how we can achieve federated cross-platform query processing with Apache Wayang. Apache Wayang (incubating) is a scalable cross-platform system that decouples applications with data processing platforms and hence it frees developers from developing applications for specific platforms. It provides an abstraction layer on top of existing data processing platforms, such as Apache Spark and Apache Flink, with the aim of enabling cross-platform optimization and interoperability. It automatically selects the best data processing platforms for a given task and also handles cross-platform execution. Apache Wayang comes with a cross-platform optimizer at its core to achieve this. To enable federated SQL analytics, we have built a library on top of Wayang that provides a unified SQL interface for cross-platform SQL processing. The SQL library allows users to embed SQL queries in their cross-platform applications. I will talk about how we utilize Apache Calcite to support cross-platform SQL. The major benefit of Calcite integration in Wayang is that of platform independence and opportunistic cross-platform data processing. Apache Wayang with Calcite integration leads to a powerful system capable of federated data processing in a platform-agnostic way.

嘉宾

Kaustubh Beedkar

Assistant Professor, Indian Institute of Technology Delhi

2023-08-20

14:30 - 15:00

Apache Druid 开源十年后的 26.x 大版本

Apache Druid 作为一款著名的 OLAP 分析引擎，从 2012 年年底的 0.1 版本开始，十年磨一剑，终于迎来了最新的 26.x 大版本，使得整个架构设计和性能水平都达到了前所未有的高度。本次演讲我将带着大家深入了解 Druid 的发展历程，以及最新版本所带来的强大功能。

嘉宾

金嘉怡

Shopee 技术专家，Apache Druid Committer & PMC Member

2023-08-20

15:00 - 15:30

Kylin 5：现代化的大数据分析平台

Kylin 5 经过一年的准备终于在 2023 年上半年正式发布，新的版本在提升性能、降低使用门槛和增加使用场景上得到了大幅提升，社区老用户也在对新版本进行二次开发和上线测试。在未来的半年时间内，社区的路线图还会有更多的特性会被开源，主要包括 1) 增加 Native Runtime 2)增加对包括 Metrics Platform 的支持 3) 对云原生的支持等。在这次演讲中，我将为大家详细介绍 Kylin 5 今年的开发进展和未来即将发布的特性。

嘉宾

俞霄翔

Kylin Committer & PMC , Kyligence 大数据研发工程师

2023-08-20

15:30 - 15:45

茶歇

2023-08-20

15:45 - 16:15

小米基于Apache Doris的OLAP实践

简介：Apache Doris 在小米集团有着广泛的应用，主要用于满足集团内部对于报表分析和BI看板的需求，支持了小米内部近百个核心业务，并且在小米内部已经形成了一套以 Apache Doris 为核心的数据生态。本次演讲将重点分享 Apache Doris 在小米的应用实践以及小米对Apache Doris的优化实践。提纲： - 历史选型及应用现状介绍小米内部OLAP系统的发展历史、选型情况，以及Apache Doris目前在小米集团的应用现状。 - Apache Doris 在小米的应用实践介绍Apache Doris在集团BI平台数据流中的位置及使用方式；介绍小米数据工场针对Apache Doris的权限管理、元数据管理机制及数据治理情况；介绍Apache Doris在小米用户行为分析平台的应用实践；介绍小米Apache Doris的监控报警机制。 - 小米对Apache Doris的优化实践主要从Stream Load两阶段提交功能和单副本数据写入功能介绍小米对Apache Doris的优化。 - OLAP未来规划介绍小米用户在使用Apache Doris过程中遇到的痛点，及小米OLAP未来的发展规划（多OLAP引擎方案探索和OLAP Service能力研发等）。

嘉宾

魏祚

小米数据库内核研发工程师，Apache Doris Committer & PMC Member

2023-08-20

16:15 - 16:45

中国移动基于 Apache HAWQ 的云原生分析型数据库

随着数字化转型的深入发展，数据仓库技术正在不断深度融合云计算的特点，为用户提供大规模、高弹性、高性能、低成本的极致使用体验。中国移动信息技术中是集团“大数据”重点工作责任单位，具备丰富的大数据业务场景和国产自主可控需求，整合中国移动大数据平台资源与人才优势，打造了一款“好用、易用、管用”的创新产品——中国移动梧桐云原生分析型数据库。中国移动梧桐云原生分析型数据库是中国移动信息技术中心研发，通过了信创测试，安全可控。采用存算分离架构，兼容主流厂商云生态，并可基于云基础设施的弹性伸缩、按需使用。通过向量化执行引擎可以支持高性能的分析查询计算和超高并发。原生对接多种存储，支持数据融合分析。中国移动梧桐云原生分析型数据库适用于多种大数据分析场景，特别是在混合业务负载及高并发、全实时数据处理和湖仓融合等场景下表现优异。我们在2022年底完成了v1.0版的研发，成果已应用于河南、江苏，并在江西、甘肃、青海、黑龙江等省公司正在进行主数仓的国产化替代。

嘉宾

王小玉

中移动信息技术公司数据库内核架构师，分析型数据库产品负责人

2023-08-20

13:30 - 17:45

云原生

鸿运厅3

2023-08-20

13:30 - 14:00

SkyWalking的Golang自动探针实践

分布式追踪技术在可观测领域尤为重要，促使各个语言的追踪探针的易用性获得了更多的关注。目前在golang语言探针方面大多为手动埋点探针，接入流程过于复杂，而且局限性很强。本次讨论的重点着重于简化golang语言探针的接入方式，创新性的使用了自动埋点技术，并且突破了很多框架中对于上下文信息的依赖限制。

嘉宾

刘晗

Engineer of Tetrate

2023-08-20

14:00 - 14:30

Resilient and secure applications with Apache APISIX and KEDA

KEDA is an event-based automatic scaling component in Kubernetes, and Apache APISIX is a high-performance dynamic API Gateway. What can we bring by combining them? In this speech, I will introduce how to combine KEDA and APISIX to bring more flexibility and security to the business, thus bringing more possibilities for the business.

嘉宾

Jintao Zhang

Cloud Native expert, API7.ai

2023-08-20

14:30 - 15:00

BanyanDB:一个高扩展性的分布式追踪数据库

追踪数据是一种用于分析微服务系统性能和故障的重要数据源，它记录了系统中每个请求的调用链路和相关指标。随着微服务系统的规模和复杂度的增长，追踪数据的量级也呈指数级增长，给追踪数据的存储和查询带来了巨大的挑战。传统的关系型数据库或者时序数据库往往难以满足追踪数据的高效存储和灵活查询的需求。 BanyanDB是一个专为追踪数据而设计的分布式数据库，它具有高扩展性、高性能、高可用性和高灵活性的特点。BanyanDB采用了基于时间序列的分片策略，将追踪数据按照时间范围划分为多个分片，每个分片可以独立地进行存储、复制和负载均衡。BanyanDB还支持多维索引，可以根据不同的维度对追踪数据进行快速过滤和聚合。在本次演讲中，我们将介绍BanyanDB的设计思想、架构和实现细节，以及它在实际场景中的应用和效果。我们也将展示BanyanDB与其他数据库的对比和优势，以及它未来的发展方向和计划。

嘉宾

高洪涛

Tetrate 创始工程师

2023-08-20

15:00 - 15:30

点击流数据分析的云原生解决方案和实践

为了更好地了解用户的使用情况，通常需要通过应用收集数据，再将相关数据存储下来，做为分析和产品优化之用。数据是企业和组织未来业务发展的关键资源，需要100%地掌握在自己手中。因此企业需要一个数据自主可控、同时成本可控的埋点数据分析系统。亚马逊的研发团队在构建这样的流数据分析系统中总结了最佳实践并以开源的方式为更多的组织和团队提供了与Apache Kafka深度集成的解决方案。在本次演讲中，我们将以该解决方案为基础，介绍构建生产级数据流水线的完整流程和经验。

嘉宾

郑予彬

亚马逊云科技资深开发者布道师

刘勇

亚马逊云科技解决方案架构师

2023-08-20

15:45 - 16:15

字节跳动云原生 YARN 实践

字节跳动内部离线业务具有庞大的规模，线上每天有数十万节点、数百万任务运行，每天使用的资源量达千万量级，内部由离线调度系统和在线调度系统分别负责离线业务和在线业务的调度管理。但随着业务规模发展，这一套系统暴露了一些短板：在离线属于两套系统，一些重大活动场景需要通过运维方式进行在离线资源转换，运维负担繁重，转换周期长；资源池不统一使得整体资源利用率不高，配额管控、机器运维等无法复用；大数据作业无法享受到云原生的各种好处，例如：可靠稳定的隔离能力、便捷的运维能力等。在离线系统亟待统一，而传统大数据引擎不是针对云原生设计难以直接云原生部署，各计算引擎和任务需要进行深度改造才能支持原先在 YARN 上的各种特性，改造成本巨大。基于此背景，字节跳动提出基于云原生的 YARN 解决方案 —— Serverless YARN，其 100% 兼容 Hadoop YARN 协议， Hadoop 生态下的大数据作业无需修改即可透明迁移到云原生系统上，在线资源和离线资源间可以高效灵活转换、分时复用，集群整体资源利用率得到显著提升。

嘉宾

邵凯阳

火山引擎云原生计算研发工程师

2023-08-20

16:15 - 16:45

ShardingSphere on Cloud：A developer's perspective

随着越来越多的业务开始走入云原生时代，ShardingSphere 也顺势推出了子项目 ShardingSphere on Cloud，提供云计算环境下对 ShardingSphere 的解决方案。从基础设施的角度来看，云代表了无限量的资源池。而开发者眼里，云的形态可能就是一堆可扩展的 API。本次分享将从开发者的视角来讲述 Database Plus 理念在云环境下的探索、云上 ShardingSphere 的形态以及云原生技术如何帮助 ShardingSphere。

嘉宾

苗立尧

Cloud Engineer, SphereEx

2023-08-20

13:30 - 16:15

API / 微服务

鸿运厅2

主持人

温铭

2023-08-20

13:30 - 14:00

如何构建大规模 API 中心

- 背景在数字时代，API 成为企业的支柱。许多组织发现，基于 API 构建的应用程序每年以 100% 以上的速度增长。然而，指数级增长给很多公司带来了新的挑战，特别是在分布式组织中，API 的管理变得相当复杂。为了应对这些挑战，许多公司正在使用或计划使用 API 管理平台。这些平台旨在提供快速、安全和自动化的API交付，不会给团队增加额外的工作量或引起系统性能瓶颈。 - 内容构成 - 背景说明（前面内容） - API 的重要性 - API 管理 - 快速、安全和自动化的 API 交付 - API 全生命周期 - 阐述对企业的必要性，以及增益价值

嘉宾

程小兰

深圳支流科技有限公司后端开发工程师

2023-08-20

14:00 - 14:30

Apache APISIX 助力企业 API 全生命周期管理

API 作为数字世界基石，众多企业在实践 APIFirst，伴随云原生、微服务架构已成为众多企业选择，API 数量越来越多，如何稳定、安全、高效的统一管理 API 对每家企业都非常重要。API7.ai 作为一家提供 API Management 解决方案公司，借助云原生 API网关 Apache APISIX 这样一款技术先进、生态丰富的产品，为用户提供现代化 API 全生命周期产品。

嘉宾

Yuansheng Wang

API7.ai(支流科技) CTO

2023-08-20

14:30 - 15:00

Apache ShenYu 微服务网关百亿流量的实践落地

1.概要和背景（什么是网关，网关的分类，公司各业务线网关的背景，网关选型和网关推动六难点） 2. 公司个性化插件和后台管理系统设计 3.网关插件实际使用场景案例和线上效果 4.问答

嘉宾

高向阳

北京转转精神科技有限公司资深研发工程师&Apache ShenYu Contributor

2023-08-20

15:00 - 15:30

An Introduction to the Kubernetes Gateway API with Apache APISIX

Why do you need another API to handle external traffic when you have the stable Kubernetes Ingress API and dozens of implementations? What problems of the Ingress API does the new Gateway API solve? Does this mean the end of the Ingress API? In this short talk, Navendu will answer these questions by exploring how Gateway APIs evolved and solved the shortcomings of the Ingress API with hands-on examples using Apache APISIX. Attendees will learn about the new Gateway API and how they can implement feature-rich, extensible, vendor-neutral gateways to their Kubernetes clusters with Apache APISIX.

嘉宾

Navendu Pottekkat

Apache APISIX Committer

2023-08-20

15:30 - 15:45

茶歇

2023-08-20

13:30 - 18:00

消息系统

鸿运厅1

2023-08-20

13:30 - 14:00

事件驱动引擎RocketMQ EventBridge的设计与实现

事件驱动架构（EDA）是一个历久弥新的设计理念，对于开发人员而言，使用一款上手轻松、能力丰富的EDA引擎将会使其EDA项目开发工作事半功倍。本讲就为大家介绍一款 EDA 开源引擎 RocketMQ EventBridge，其在协议上拥抱开源，拥有丰富的生态组件支持，而且也有云上大规模实践背书，可以帮助开发人员轻松构建EDA项目。本讲会基于协议标准、能力矩阵、架构设计等方面，详细介绍 RocketMQ EventBridge 的一系列产品特点和其设计实现，剖析产品思路。

嘉宾

陈永明

阿里云研发工程师

2023-08-20

14:00 - 14:45

RocketMQ 百万队列能力支持 -- RocksDB kv 存储

现有的 rocketmq 存储架构存在以下问题： 1.百万队列 topic 、subion、 consumerOffset 约需 200 - 300M，定时持久序列化和 CRC32 计算 cpu 压力较大，其次覆盖写磁盘 util 很高 2.consumeQueue 索引基于 mmap 实现，百万队列场景下大量小文件随机读写瓶颈显现、性能急剧下降为支持百万级数量队列，引入 rocksdb kv 存储： 1.元数据写入 rocksdb 的 wal 和内存 memtable，put 与 delete 操作更新内存，避免了实时持久化带来的性能问题 2.rocksdb 底层 lsm 树采用日志追加的方式合并了大量小文件随机读写，解决了百万队列场景下 consumeQueue 大量小文件随机读写的性能问题

嘉宾

赵福建

阿里巴巴高级开发工程师

2023-08-20

14:45 - 15:30

RocketMQ在小红书的特色实践

本演讲主要分享RocketMQ在小红书的特色应用场景和面临的挑战，以及小红书内部是如何落地RocketMQ来支撑在线业务的多活要求，最后会介绍下广泛应用在小红书内部的延迟队列引擎、泳道、压测、全链路追踪等多项特色能力。

嘉宾

李亚斌

小红书在线消息队列负责人

2023-08-20

15:30 - 15:45

茶歇

2023-08-20

15:45 - 16:30

小米 RocketMQ 的降本增效和容灾实践

演讲介绍：小米使用 RocketMQ 作为在线消息队列服务，随着业务规模逐渐扩大，一些问题也渐渐显露出，如集群成本高、抖动频繁和缺少机房容灾等，本文将介绍小米在这些方面的一些实践经验。提纲： - 发展历程及面临问题 RocketMQ 在小米落地的两年期间，业务日生产消息量规模迅速增长至千亿级别，覆盖了订单、通知、Iot 等诸多业务场景。同时，机器成本高、社区高版本功能缺失、容灾方案不够完善等问题也逐渐显现出来，亟待解决。 - 解决思路和落地实践 - 降本实践小米选型 RocketMQ DLedger 模式，基于 Raft 实现自动 Failover，但三副本冗余带来了昂贵的机器成本，本节将介绍小米如何通过单机多实例方案极大的降低了机器成本。 - 效能提升业务需求的发展和 RocketMQ 社区版本的迭代速度都非常快，本节介绍了小米是如何在二者之间进行权衡与取舍，并通过诸如 Batch 合并、POP 消费、任意延时消息、ZSTD 压缩升级、单机多实例等功能的落地来提升业务效能 - 多场景容灾本节将会详细介绍小米在 RocketMQ 容灾领域的思考和实践过程，并细致的分析 RocketMQ 3 种机房级灾备方案的利弊。本节内容曾整理为文章《RocketMQ 在小米的多场景灾备实践案例》，发表于 Apache RocketMQ 公众号。 - 总结与展望小米在 RocketMQ 的落地过程中，对成本、效能、容灾等问题有比较完整的思考和实践。未来希望能够在社区 5.0 版本的基础上，进行例如 Stream、Severless、分层存储等云原生方面能力的探索。

嘉宾

邓志文

小米软件研发工程师

2023-08-20

16:30 - 17:15

云原生消息流系统 Apache RocketMQ 在腾讯云的大规模生产实践

Apache RocketMQ是一个可靠、高吞吐量、分布式的消息队列服务。腾讯云作为中国领先的云计算服务商之一，也大规模的提供了Apache RocketMQ服务。同时，腾讯云也对Apache RocketMQ进行了一系列优化和定制，以更好地适应公有云复杂的业务需求。在这个过程中，腾讯云也积累了大量的经验和技术，包括如何优化Apache RocketMQ的性能、如何提高其可靠性、如何进行监控和调优等方面。这些经验对于其他企业和开发者也具有很大的参考价值，希望今天的分享对大家有所启发，谢谢大家！

嘉宾

李伟

腾讯科技（成都）有限公司资深后端开发工程师

2023-08-20

17:15 - 18:00

移动云MQTT-RocketMQ消息队列的海量数据流转实践

5G时代，万物互联，越来越多的企业期望通过已有的数据分析业务中台对物联网数据做进一步计算处理。目前，大量的企业的业务中台架构都通过引入消息队列RocketMQ来进行削峰、解耦和消息通知。那么能否通过复用RocketMQ完成数据从海量的物联网设备端流转到数据分析业务中台（即消息队列RocketMQ）呢？因此，我将从以下几个方面介绍一下MQTT-RocketMQ Connect架构，可以实现MQTT和RocketMQ消息队列之间的海量数据流转： 1、背景 2、MQTT-RocketMQ Connect架构设计 3、MQTT-RocketMQ Connect的容器化实践 4、MQTT-RocketMQ Connect在移动云上的海量数据流转实践 5、总结与展望

嘉宾

庄兴旺

中国移动云能力中心Iaas产品部rpc产品组助理研发工程师

大会组委会欢迎致辞

陆首群和David多位大咖为大会致辞

The ASF: Past and Future

Craig Russell

Apache 软件基金会董事

18年前，Craig Russell作为一个贡献者加入了Apache软件基金会，为开发DB JDO项目做出了贡献。2007年，他被选为成员。目前，他担任Apache软件基金会的助理秘书，并担任董事会成员。

Introduction to Apache Doris 2.0

马如悦

Apache Doris 项目创始人 & 飞轮科技 CEO

前百度杰出架构师，先后担任过百度分布式计算团队、大数据工程团队和 AI 产品工程团队的技术负责人。 2013 年领导设计和开发了实时数仓 Doris 并在以后一直担任其总负责人， 2023 年起担任飞轮科技 CEO。

人间清醒：开源的最深层次动机

卫剑钒

《大教堂与集市》中文译者，国际信息系统安全认证专家（CISSP），中国金融学会金融科技专委会委员

卫剑钒，开源圣经《大教堂与集市》中文版译者，国际信息系统安全认证专家（CISSP），中国金融学会金融科技专委会委员，长期从事开源技术、网络安全、区块链技术、金融科技等领域研究和实践，著有《安全协议分析与设计》、《大教堂与集市》（译）、《Web3：互联网的新世界》、《区块链在中国》等书。

一路前行，阿里云大数据从拥抱开源走向引领开源

王峰

阿里巴巴花名“莫问”，在阿里云任研究员职位，开源大数据平台负责人

自 2010 年开始从事开源大数据技术研发和管理工作，目前带领团队打造的开源大数据平台不仅服务阿里巴巴内部实时数据业务，同时也在阿里云上通过 E-MapReduce 和实时计算 Flink 版等产品为广大中小企业提供完美兼容开源生态体验的云原生大数据计算服务。

开源的未来：挑战与机遇

Craig Russell

Apache 软件基金会董事

Rich Bowen

Apache 软件基金会董事，AWS 开源战略师

Rich Bowen has been involved in open source since before we started calling it that. He's a member of the Apache Software Foundation, where he currently serves as a board member and VP Conferences. Rich is an Open Source Strategist at AWS.

Justin Mclean

Apache 软件基金会董事

Justin Mclean is a highly experienced professional with over 30 years in web application development, education, and community work, and is an active contributor to open source software. Justin is a renowned speaker at conferences worldwide and currently serves as the Community Manager at Datastrato. He mentors projects in the Apache Software Foundation and holds positions as VP of the ASF Incubator, and is an ASF board member.

姜宁

大会议题评审组成员 | Apache 软件基金会董事

字节跳动开源办公室首席布道师，前华为开源管理中心技术专家，Apache 软件基金2022,2023 年度董事，Apache软件基金会孵化器导师，前红帽软件首席软件工程师，Apache 本地北京社群（ALC Beijing）发起人，有十余年企业级开源中间件开发经验，有丰富的Java 开发和使用经验。

大花

Answer 社区经理

SegmentFault 思否旗下 Answer 社区经理，具备多年软件产品海外市场经验。

Apache ECharts 的图表服务端渲染方案

Ovilia

Apache ECharts PMC Chair

Ovilia has been working on Apache ECharts project since 2016 and is now PMC Chair of the project. She is also a passionate advocate for data visualization. Through her work, Ovilia strives to democratize access to information, ensuring that it is readily available and easily understandable for people from all walks of life.

日志存储分析的数仓化

肖康

SelectDB 技术副总裁

2009 年至 2012 年在百度从事 Hadoop 平台开发与建设。 2012 开始先后在 360、奇安信负责大数据平台，研发基于 MPP 架构的安全大数据引擎，构建全球最大的网络安全大数据。 2022 年联合创立 SelectDB，致力于研发新一代云原生实时数仓。

Apache Arrow DataFusion: 向量化查询引擎揭秘

刘昆

eBay大数据工程师，Apache Arrow Committer & PMC Member

毕业于清华大学软件学院；目前就职于eBay大数据开发团队，大数据工程师； Apache Arrow PMC，Apache IoTDB PMC，主要从事数据库、存储引擎、查询引擎等领域的工作。

Apache Impala 4.2 & 4.3 版本新特性一览

黄权隆

Impala PMC Member & Committer，Cloudera 研发工程师

Cloudera研发工程师，主要工作为Impala内核开发。在开源社区是Apache Impala PMC member & Committer，Apache ORC Committer

茶歇

Apache Doris 在衔远科技的应用实践

王永臣

北京衔远科技大数据开发工程师

衔远科技数据团队的负责人，热衷于开源社区贡献，不断探索新技术领域，当前正深入研究Doris与AIGC的融合，欲将两者的优势充分发挥。

字节跳动大数据 SQL 权限精细化管理实践

朱江

火山引擎 LAS 高级研发工程师

火山引擎LAS高级研发工程师

基于 Apache Calcite 的多引擎指标管理最佳实践

谢佳君

火山引擎 LAS 高级研发工程师，Calcite Committer

字节跳动高级研发工程师，曾参与2022年Apache Asia Con的演讲。热爱开源，经常参与社区工作，现在是Apache Calcite active committer和Linkedin Coral Contributor。

What's new in the recent and upcoming HBase releases

张铎

神策数据首席架构师，Apache HBase PMC Chair

清华大学计算机科学与技术系本硕，长期从事开源软件的开发与维护。2015 至今历任ApacheHBase 项目的 Committer、PMC 成员、主席。2020 年成为 Apache 软件基金会的 Member。2018 年，在 Apache 软件基金会全球近 7000 名 Committer 中，贡献数量排名第三。曾任小米开源委员会主席，负责小米整体开源工作的规划与推进。目前在神策数据担任首席架构师。

Deep dive into resource manageability in ozone storage

Sumit Agrawal

Senior Staff Engineer, Cloudera

Myself working in cloudera, contributing to Apache Ozone distributed storage and also a committer. I have 16 years experience in IT industry and worked over various domain including data storage, cloud application and middleware.

Spark SQL Shuffle Join Improvement at eBay

王玉明

eBay 软件工程师，Apache Spark PMC

eBay SQL on Hadoop 团队软件开发工程师，Apache Spark PMC Member and Committer，2022 SIGMOD Systems Award 获得者。从 Spark 1.5.0 开始参与 Apache Spark 的开发，并成为最活跃的代码贡献者之一。专注于SQL查询性能优化。

字节跳动千亿文件 HDFS 集群实践

熊睦

基础架构工程师

字节跳动大数据存储底座工程师，主要负责大数据存储 HDFS 元数据服务演进和上层计算生态支持。

茶歇

Apache Kyuubi & Celeborn(Incubating): 助力 Spark 拥抱云原生

潘成

网易数帆软件工程师，Apache Kyuubi PMC，Apache Celeborn PPMC

网易数帆软件工程师，Apache Kyuubi PMC 成员，Apache Celeborn (Incubating) PPMC 成员。主要从事企业级离线计算引擎开发、Apache Kyuubi 开源社区建设等工作。

Resilient Data: Exploring Replication and Recovery in Apache Ozone

Sadanand Shenoy

Software Engineer II , Cloudera

Sadanand Shenoy is a committer in the Apache Ozone project and has keen interest in distributed systems . Sadanand is currently working at Cloudera and has been actively contributing to the Apache Ozone project for the past 3 years . He has pursued B.E in Information Science and Engineering from MSRIT Bangalore.

Linkis 在理想汽车的应用实践

郗世豪

理想汽车高级大数据工程师

理想汽车高级大数据工程师，主持开发 Linkis 1.3.2 版本，Linkis Committer，入职公司5年，现在在公司主要负责 Linkis 和 Spark 的二次开发，致力于在公司内部落地和推广 Linkis 平台，通过和 Spark 等底层引擎的结合，努力探索更加高效、灵活的数据处理方案，最终提升用户效率。

OpenDAL 的开发者体验分享

丁皓（Xuanwo）

Databend 研发工程师

learn, work and think in an open-source way.

Apache Kvrocks 社区演进

王源

百度资深工程师

百度云数据库部资深工程师，百度云 Redis 和磁盘 KV 数据库 PegaDB 内核负责人 Apache Kvrocks PMC Member & Redis Group Member

社区和贡献者如何找到彼此？

庄表伟

开源社理事

庄表伟，开源社理事、执行长，天工开物开源基金会副秘书长。 1997年毕业至今，始终战斗在编程的“第一线”，一直致力于推广并服务开源，热爱社区，热衷参与各种社区的交流活动。曾任盛大创新院高级研究员、印客网技术总监、华为开源管理中心开源专家。

自研分布式数据库的开源之路

段少婷

OceanBase社区经理

OceanBase社区负责人，致力于前沿科技和技术的推广和布道，开源社区建设发展工作，先后就职于Sun、Adobe、百度、阿里云等世界500强公司负责大数据、AI、云计算、操作系统等开源技术社区的发展建设、人才培养和生态建设等工作。

茶歇

AI时代与智能组织：从Apache得到的启示

张雅琪（Alphatu）

ChaosAI 创始人

ChaosAI 创始人，北京奇点汇科技有限公司创始人，阿法兔研究笔记创始人

从0到“20000+”用户，Apache DolphinScheduler社区如何实现双向奔赴？

曾辉

白鲸开源高级社区经理

Apache DolphinScheduler Committer，白鲸开源高级社区经理，负责 Apache DolphinScheduler and SeaTunnel 社区的全球化运营工作，0-1搭建开源项目出海及落地策略，主导项目的生态建设，提升“开源项目”在全球的影响力及社区内部的建设，致力于传播开源文化。

Challenges and Solutions on building Realtime Data warehousing with Apache Flink , Apache Hive and Apache Iceberg

Yan Liu 刘岩

Cloudera Solution Eng

Apache Hive and Apache Flink Contributor, Cloudera Solution Engineering. Over 10 Years of Practical Experience in Big Data and my current focus is real-time data warehouse using Apache Flink, Apache Hive, and Apache Iceberg.

基于 Flink 构建实时数据湖的实践

王正

火山引擎云原生计算研发工程师

于 2021 年加入字节跳动，就职于基础架构开放平台团队，主要负责 Serverless Flink等方向研发。

OpenEuler and Bigtop with Ambari : Empower Data Lake in the real world

Yuqi Gu

Staff Software Engineer, Arm

Yuqi Gu is currently Chair and PMC member of Apache Bigtop. He is also the committer and PMC member of Apache Ambari. He works for Arm and is mainly focusing on performance optimization on Arm64.

Apache Linkis 在湖仓一体架构下的数据处理实践

王华磊

中国邮政储蓄银行副主任工程师

多年银行大数据领域数据架构经验，开源爱好者，Linkis社区贡献者。

茶歇

数据湖 Iceberg 在小米的实践与优化

肖杰宝

小米软件研发工程师

小米软件研发工程师，目前主要负责小米内部数据湖Iceberg内核及表优化服务的研发工作。

字节跳动基于 Parquet 格式的降本增效实践

徐庆

火山引擎LAS高级研发工程师

字节跳动火山引擎LAS高级研发工程师。多年从事于Hive Metastore, SparkSQL, Hudi等大数据相关组件的研发工作。

王恩策

火山引擎 LAS 高级研发工程师

火山引擎 LAS 高级研发工程师，负责字节跳动大数据分布式计算引擎的设计与研发，帮助公司在海量数据中挖掘出高价值信息

生成式AI的分布式缓存：优化云上的LLM数据管道

傅正佳

Alluxio 开源布道师

傅正佳，Alluxio 开源布道师。本科毕业于上海交通大学电子系，随后取得香港中文大学信息工程博士学位，毕业后加入新加坡高级数字科学中心（美国伊利诺伊大学在新加坡的研究所）从事科研工作，在计算机网络和分布式系统领域相关的顶级国际会议发表多篇论文。加入Alluxio前曾在新加坡科技公司Bigo Technology担任机器学习研发总监。

胡梦宇

知乎大数据基础架构开发工程师

胡梦宇，知乎大数据基础架构开发工程师，主要负责知乎内部大数据组件的二次开发与运维，目前主要工作内容集中在 HDFS，Alluxio，Flink。

字节跳动 Spark 支持万卡模型推理实践

刘畅

字节跳动基础架构工程师

于 2020 年加入字节跳动，就职于基础架构批式计算团队，主要负责 Spark 云原生方向工作，Spark On Kubernetes 等方向研发。

张永强

字节跳动机器学习系统工程师

于 2022 年加入字节跳动，就职于 AML 机器学习系统团队，参与构建大规模机器学习平台

为什么我们需要面向异构计算的编译器体系

王臣汉

OpenBayes 贝式计算创始人兼 CEO

曾就职于华特迪⼠尼互动媒体集团、AVOS Systems 等世界知名企业，中⽂语义理解基准 CLUE 基⾦会秘书⻓、天津⼤学⻉式计算联合研究中心副主任。

Flink ML 2.2.0 的新特性解析与应用

洪帆

阿里巴巴算法专家

洪帆博士毕业于北京大学。毕业后加入阿里巴巴机器学习团队，主要从事 Flink 相关的机器学习开发与改进，是 Flink ML Contributor。此前还参与了前一代 Flink 机器学习库 Alink 的研发。

张智鹏

阿里云智能算法专家

阿里巴巴算法专家，Apache Flink committer 张智鹏博士毕业于北京大学，研究方向为分布式机器学习。毕业后加入阿里云机器学习团队PAI，主要从事Flink ML的设计，开发和改进。

茶歇

Bringing LLM to Everywhere via Machine Learning Compilation

Siyuan Feng

Ph.D. Student, Shanghai Jiao Tong University

I'm a Ph.D. student in Zhiyuan Honors Program at Shanghai Jiao Tong University. Also, I'm a PMC member of Apache TVM, working closely with the community and developing new features, including TensorIR, Meta-Schedule, Auto-Tensorization, and Relax (next Relay). Recently, I am spending my time on MLC-LLM to deploy a large language model on every device.

字节跳动深度学习批流一体训练实践

毛洪玥

字节跳动基础架构工程师

于2022年加入字节跳动，主要负责大规模云原生批流一体AI模型训练引擎，支撑了包括抖音视频推荐、头条推荐、穿山甲广告、千川图文广告等业务。

Unifying Real-time and Batch ML Inference using BentoML and Apache Spark

Bo Jiang

Product Engineer, BentoML

Product Engineer at BentoML, previously Product Engineer at Douban. Working on platforms industrializing AI Applications.

Boost ML networks on specific HW platform with Apache TVM on the example of Qualcomm Adreno™ GPU

Egor Churaev

Sr. Software Engineer, Deelvin Solutions

Sr. Software Engineer with 10 years of experience, worked on several projects at Intel, in particular: OpenCL CPU compiler and Intel OpenVINO, PhD student at HSE University with topic related to emotion recognition with deep learning algorithms. Currently work on Apache TVM project. Commiter of Apache TVM.

Apache Flink 流批自适应 Shuffle

宋辛童

阿里云高级技术专家，阿里云 Flink Shuffle & SDK 团队负责人

Apache Flink PMC Member & Committer，阿里云高级技术专家，阿里云 Flink Shuffle & SDK 团队负责人。

谭玉新

阿里云高级开发工程师

就职于阿里云计算平台开源大数据部门，专注于 Apache Flink 开源项目。

基于Apache Calcite/Gremlin构建流式图处理系统

潘臻轩

蚂蚁集团资深技术专家

潘臻轩(泰初)，蚂蚁金服资深技术专家。2012年加入阿里集团数据平台，2016年加入蚂蚁集团数据技术部，经历了阿里和蚂蚁实时计算从0到1的演进，从17年底开始负责流式图系统和团队的构建，从0到1打造了蚂蚁的流式图系统。对实时计算和图计算以及上层的应用场景有深入的理解。

联通基于Apache StreamPark的大规模实时计算生产实践

穆纯进

联通数字科技有限公司大数据实时计算平台研发负责人

Apache StreamPark PMC、大数据实时计算平台研发负责人，负责万亿级Flink实时计算开发、运维以及平台建设

FlinkSQL的字段血缘及数据权限解决方案

白松

杭州数澜科技有限公司联合创始人，研发中心副总经理

数澜科技公司联合创始人、研发中心副总经理，拥有9年大数据平台研发经验，专注于大数据、实时计算、数据权限等领域的研究。负责公司核心产品数栖平台和数栖EMR的产品研发工作，目前数栖产品已成为国内外数百家公司建设数据中台的基础设施工具，例如中信集团、富士康、万科、宝马、浙江交投集团等。

茶歇

Streaming Apache Kudu within Apache Flink

Wei Chen

Staff Software Engineer of eBay

Wei is focusing on empowering the eBay's Notification Platform by leveraging the big data and streaming processing technologies. He is also a tech blog writer and actively contributing in open source community. Wei received his bachelor and master degrees from Shanghai Jiao Tong University.

Shaping the Future: Unveiling High-Concurrency Streaming Analytics with Apache Druid

Tijo Thomas

Lead Solutions Architect

TijoThomas +91 8971965432 tijothomas21@gmail.com Summary Lead with great passion for big data technology, having 18+ years of experience in the software industry ( engineering, professional service , product management). Helping customer in the field , negotiating with customer on the feature request and align them with the product roadmap Extensive experience across the stack in Managing, Architecting, Designing and Implementing Big data applications, frameworks and platforms. More than 4 year of experience as Solution Architect Experience in design and implementing a highly scalable SAAS platform for public Cloud. Hold two patents in the area of Big Data. Area of Expertise Expert level knowledge in Apache Big Data Platforms: Hive, Druid, NiFi , Kafka and Spark , Druid Internals. Expert level knowledge of Core Java and developing Java applications/platforms. Expert level knowledge in developing web applications using J2EE Intermediate level knowledge in developing microservice based applications Intermediate level knowledge of Scala functional programming. Intermediate level knowledge in applying Data mining and Machine learning algorithms. Skills Languages: Java/J2EE, Scala, Shell scripts. Apache Big Data technologies: Apache Druid , Hadoop (HDFS, Yarn, Hive), Spark (Spark SQL, Spark Core), Streaming (Spark Streaming, NiFi), Apache Atlas , Apache Ranger, Hbase, Phoenix, Oozie, Druid Methodologies: Agile, TDD , FDD , Extreme programming Java Technologies: Core Java Libraries, Java Web Services , Spring, JUnit, Ant, Maven Performance Engineering: JVM Garbage Collection Tuning, In-Memory, High Performance Data Structures and Algorithms, Parallel Processing, Multi-Threading, Distributed Systems, NIO. Work Experience Onboarding APAC Imply customers and their use case to Imply. Mentoring and Growing the team in the APAC region. Showcase new features to customers and onboard customers to the latest features. Conducting health checks and cluster reviews and providing recommendations. Handling escalated support cases . Developing automation tools related to various druid use cases. Review cluster utilization, Cluster sizing and analyze cluster metrics and provide improvement suggestions. Performance benchmarking & hardening. Technologies: Apache Druid, Pivot , Imply Manager , Imply Clarity Leading the architecture & design of Big Data implementation for one of the leading insurance companies in US/Canada. Architect for building onboarding tools for the source systems Understanding the application team requirement and conducting POC to onboard their application to Hadoop and related platforms covered under HDP distribution. Conducting POC, UAT with the platform team and official signoff from the App team System integration design and development. Cluster tuning for Hive, Spark workloads. Review cluster, analyze cluster metrics, and provide improvement suggestions. Technologies: Hive, Atlas , Ranger , Spark, Nifi, Hadoop(Yarn/HDFS), Kerberos, Airflow Leading the architecture & design of Huawei's Big Data Tools . Proposed an efficient way to test huawei hadoop releases , compare and contrast various performance and security metrics. Carried out Proof of Concept to demonstrate capability of Tools to Chief Technical officer for Big Data and Database. Ingest logs from Hadoop nodes and identify the characteristics of hadoop workload and optimization. Simulate the cluster behaviour as in customer clusters and provide provocative optimizations of hadoop cluster configurations to improve the workload efficiency. Used Dr.Elephant and smartsense to provide suggestions based on heuristics. Technologies: Spark, Hadoop , Elastic Search , Nifi , Logstash , Kibana ,BIRT. Leading the architecture & design of Huawei's Data pipeline . We have built the next-gen high performance Datapipeline engine using Apache Nifi that can integrate and orchestrate various bigdata component. - I proposed the idea of developing the next generation data pipeline for big data on Huawei Cloud. - Executed a Research Project to evaluate the technical feasibility of the proposal. - Designed an advanced on premises and distributed architecture to deploy in cloud - Designed and implemented key algorithms and data structures for achieving high performance data movement. - Travelled frequently to China R&D centers to propose and discuss key solutions. Technologies: Spark, Scala, Core Java, Maven, SBT. Leading a team of 10 members for Huawei’s Business Intelligence Platform in India. Technologies: Core Java, Swings, SWT, JavaScript, Dojo, JQuery, JSP, Servlets, Hibernate, Ant, Maven. - Lead the development of a large scale business intelligence platform with ETL, Analytics, Reporting and Dashboard Capabilities. - Implemented important business logic in key components. - Interacted with other Huawei product teams and collected their requirements and scenarios. - Designed new features and modules to handle customer requirements and scenarios. - Analyzed and finalized key technologies and open sources for key components. - Involved in-hands on coding of key modules. - Responsible for handling the deployment and support team in UAE, South Africa, Kenya, Canada, Isle of Man and Switzerland. - Lead the design and implementation of complete platform components using Java, Spring DM and OSGI with a sub-team size of 6 members. Designed, coded and implemented the key framework for the interest module. - Complete ownership of the design of all the sub modules. Assigned, reviewed and guided other members in design activities. - Also involved in-hands on coding, implementation and code review of the module. Technologies: Core Java, , Servlets, Spring DM, OSGI, iBatis, Maven. - Interacted with marketing and bidding teams to collect market requirements and design solutions for the same. - Worked on Access Control framework implementation for BT Transact Business Intelligence Report. - This involves the Framework API development for BI tools for Oracle Discoverer and Oracle 11i Application Server Technologies: Core Java, JSP. Joined as a fresher in the BT Transact and quickly took over E2E ownership of various modules. Re-designed the Test automation framework for order provisioning Gradually took ownership of the order provisioning engine module. Awards & Recognition Potential High Value Patent Award -2016 Unique Value Contribution Award - 2016 Patent Contribution Award – 2015 Open source Contribution Award -2015 Best Fighting Spirit Award - 2014 Quality Control Circle Contribution - 2013 Quality Control Circle Contribution - 2012 Quality Control Circle Contribution - 2011 Patents System and Method for Federated Access Control on Big Data – Filed in 2015 Method for distributing workload across cloud. - Filed in 2016 Education - B-Tech in Computer Science - 2001 – Kannur University, Kerala - Post Graduate Diploma in Information Technology -2006 – IIT Bombay

Apache Pulsar 3.0：首个LTS版本及其新特性

Zike Yang

Software Engineer of StreamNative

Zike Yang is a Software Engineer at StreamNative, Apache Pulsar Committer, Apache StreamPipes Commiter & PMC Member. His current work primarily focuses on developing Pulsar multi-language clients and improving Pulsar core features.

Apache Pulsar 限流功能在移动云云原生场景下的应用实践

王嘉凌

中国移动云能力中心软件开发工程师

中国移动云能力中心软件工程师，Apache Pulsar Contributor，负责移动云消息队列Pulsar和Kafka的研发

华为终端云在容器场景中对Apache Pulsar的优化实践

林琳

华为 SDE 专家

华为终端 SDE 专家，Apache Pulsar PMC 成员，拥有近10年中间件与基础架构设计经验，致力于打造稳定可靠的基础设施

茶歇

Kafka without Zookeeper

Luke Chen

Senior Software Engineer, RedHat

I'm a senior software engineer in RedHat working on products to run Apache Kafka on cloud. I'm also a committer and PMC member in Apache Kafka. I've been contributed in Apache Kafka for more than 3 years.

邓子明

字节跳动数据开发

国防科技大学，多年数据开发经验，Apache Kafka Committer

Deep Dive the replication protocol in Kafka

Luke Chen

Senior Software Engineer, RedHat

The Apache Way: Building Community and Longevity

Justin Mclean

Apache 软件基金会董事

开源贡献难吗？

李本超

字节跳动 Flink SQL 技术负责人

Apache Calcite PMC Member Apache Flink Committer 毕业于北京大学，目前就职于字节跳动流式计算团队， Flink SQL 技术负责人。

社区的力量

陈阳

开源社理事长

开源社理事长，微软云计算与人工智能首席产品经理 GNOME基金会2010董事总监 GNOME.Asia社区创始人 Mozilla核心贡献者，GSoC导师，2016年任中国开源软件推进联盟副秘书长，开放原子开源基金会导师 2014年发起成立开源社，也是中国开源年度报告，COSCon的发起者。 16+ IT & OSS 行业经验，曾供职SUN，Oracle，微软跨国IT公司核心研发技术领域: 开源技术和社区治理，公有云，行业AI解决方案，知识图谱，智能对话，数据集成 2019年获得美国人工智能专利一项， O'REILLY 《Beautiful Testing》联合撰稿人

数字金融时代的云原生技术应用与创新

陈广胜

微众银行技术专家，Apache 软件基金会成员，Apache EventMesh PMC Chair，ALC Shenzhen 联合发起人

微众银行技术专家，Apache软件基金会成员，Apache EventMesh PMC Chair，ALC Shenzhen联合发起人

社群长青：开源社群如何可持续发展

tison

大会议题评审组成员 | 格睿科技（Greptime）开发者关系总监

Apache Member and Incubator Mentor

面向数字基础设施的通信新基座——移动云消息队列矩阵

胡宗棠

中国移动云能力中心消息中间件领域技术专家，移动云消息队列团队负责人

中国移动云能力中心，消息中间件领域技术专家，移动云消息队列团队负责人。主讲人介绍：8年以上消息中间件内核开发和架构设计经历，从无到有参与移动云RocketMQ、MQTT、Kafka等多款主流消息中间件系列产品的内核架构和研发。作为技术嘉宾，曾多次参与Apache Conf Aisa2022/2023、Apache RocketMQ Summit/Meetup、云原生服务大会技术分享，开源项目实践经验丰富，担任Apache RocketMQ、SOFAJRaft、Nacos、openEuler message-middleware sig和openMessaging等开源社区的Maintainer/Committer。曾获2022年信通院《云原生技术标准专家》,多个开源社区的开源先锋等荣誉。

基于EventMesh构建超大规模云原生事件网格-EventGrid

薛炜明

微众银行中间件研发工程师

薛炜明，微众银行中间件平台开发工程师，Apache EventMesh项目PMC，专注于云原生、事件消息、微服务领域，热爱技术开源。曾多次参与相关大会分享，如Apache Con Asia 2021\2022、COSCon'22等。

王海军

华为云中间件团队技术专家

目前就职于华为云计算有限公司，华为云中间件团队技术专家，事件网格（EventGrid）服务技术负责人

Apache Royale Externs

Alina Kazi

Apache Royale Committer, The Apache Software Foundation

Contact alinakazi@apache.org alinakazi1990@gmail.com +92-333-7005671 www.linkedin.com/in/alee na- kazi-47428b100 (LinkedIn) Team Member Apache Royale Organization https://royale.apache.org/team/ Top Skills Apache Royale Flex Java C++ C# ASP.NET .Net Core MS SQL and Oracle GitHub Source tree Team Foundation Jira Confluence GWT Apache Royale www.royale.apache.org Committer / Apache Team Member July 2020 – Present Globally Providing training and consultancy services on Apache Royale Migration Projects as well as a new development in Royale. Working on multiple Flex to Royale migration projects with my team. Being the Committer at Apache Software Foundation (Montreal, Canada) from April 2018 – Present. I contribute to releases of Apache Royale. You can see more about Apache Royale at https://royale.apache.org/team Also providing paid commercial Support: https://royale.apache.org/royale-commercial-support/ Achievements: 1. First Asian / Pakistani / Female Apache Royale SDK Committer 2. Presented at Apache Conference (APACHECON2020). Can be viewed at Apache official YouTube Channel: https://www.youtube.com/watch?v=O5WJ6nRPX40 Islamabad, Pakistan Feb,2023 - Present Designed and Developed and Physiotherapy Clinic Software System includes biometric attendance, salary process, patient session and management of all other clinic activities. Tools Visual Studio Code Moonshine Eclipse Flash Builder Visual Studio 2010,2012,2019 SQL Developer Fiddler Bit Bucket GitHub Source tree Team Foundation Jira Self Employed Freelance Apache Royale Developer March, 2021 – Present MX-Spark and Jewel UI/UX Developer in Apache Royale. Additional features added to organization’s existing application & migrated existing Apps. Using external JavaScript libraries. Tree, Mobiscroll, Calendar and other libraries under one umbrella Apache Royale Roles: Task document preparation, Project configuration in Visual Studio Code, Maven configuration, Ant configuration, Royale SDK compilation, SDK deployment/distribution, Environment setup. I have several clients Micronix, Veriskope and Altron and many other companies worldwide. www.codeoscopic.com Madrid, Spain Software Developer / Apache Royale Developer July 2020 – March,2021 Jewel UI/UX Developer in Apache Royale. Roles: Task document preparation, Project configuration in Visual Studio Code, Maven configuration, Ant configuration, Royale SDK compilation, SDK deployment/distribution, Environment setup and software development of application. www.cavalier-group.com Cavalier Group of Companies Backend Developer (Team Lead) April 2020 - June 2020 Islamabad, Pakistan Dot Net Development, API’s Development, and DB procedure call. SRS Document Preparation DBiz Solutions July- 2017 – March-2020 Islamabad, Pakistan • Senior Consultant • Assistant Manager JAVA Development in eclipse, development of complex processes (feasibility), documents, setups and reports. Lead the Porting Project of moving Apache Flex Application (having more than 1000 .mxml and .as files) to Apache Royale Using ANT Changes in Flex code for migrating it to Royale and Apache Royale SDK (creation of Emulation Components in SDK to compile and run migrated Application) SIDAT HYDER Morshed Associates Team Lead (JAVA & FLEX DEVELOPMENT) July 2016 - June 2017 Islamabad, Pakistan Senior Software Developer (JAVA & FLEX DEVELOPMENT) July 2015 - June 2016 Islamabad, Pakistan Flex and Java Developer Pakistan Air Force Air HQ, Islamabad Software Developer (Project Vision – JF-17 Thunder) July 2013 - July 2014 (1 year 1 month) E-9, Islamabad Developed a Platform independent, multi-threaded socket (TCP/UDP) Library using C/C++. Worked on Boost Library, Real-time Applications Testing Developed Real-time Applications Education Quaid-e-Azam University, Islamabad Master's degree, Information Technology · (2011 - 2013) Percentage: 79.6%

统一 AD、Linux 和 Apache Openmeetings 的基于角色的访问控制机制

刘文涛

高级软件工程师

主讲人刘文涛先生在中国拥有超过10年的IT和教学经验。 8年前，当他担任梅溪湖城市可持续发展项目的助理总经理时，他创立了一家涉足云计算和移动应用开发领域的初创公司。他热衷于开源项目，例如 Apache Openmeetings、Apache Directory Server。他是微软初创公司资助者中心成员。平时，他在各个方面为开源社区做出了贡献，例如作为会议发言人分享他学习和采用开源技术的经验、翻译、口译等。

What's inside a Smartphone? Exploring the internals with Apache NuttX Real-Time Operating System

Lup Yuen Lee

IoT Techie and Educator, Apache NuttX PMC

Please see https://lupyuen.github.io/

茶歇

如何基于云原生技术帮助 Apache Kafka 实现弹性能力

韩旭

安托盟丘（AutoMQ）存储技术负责人

目前就职于安托盟丘（AutoMQ），主导 Serverless Kafka 的设计和开发。曾经是蚂蚁金服在线消息和离线数据传输链路负责人，在大规模消息集群的存储和流量高可用方面有丰富的经验。

Apache HugeGraph 图数据库在货拉拉的应用与调优

杨嘉奇

货拉拉大数据工程师

杨嘉奇货拉拉/业务风控部/大数据专家/Apache Hugegraph Commiter。现主要负责图数据库相关工作，为部门提供高效，稳定，易用，准确的图数据服务。从事大数据相关工作8年。

Apache Dubbo 静态化 GraalVM Native Image 解决方案与实践

华钟明

杭州有赞科技有限公司中间件技术专家

中间件技术专家, Apache Dubbo PMC，见证了Dubbo从Apache孵化到毕业的过程。Dapr Member、Apache Tomcat/Maven Contributor，GSoC/OSPP/GLCC Mentor，热爱分享，热衷开源。

Apache Dubbo 云原生可观测性的探索与实践

宋小生

平安壹钱包中间件资深工程师

Apache Dubbo Committer 负责中间件相关研发工作阿里云藏经阁《Apache Dubbo3 源码深入解读》作者

基于 Triple 协议实现Web、移动端、后端服务全面打通

陈有为

陌陌研发工程师

Apache Dubbo PMC, 陌陌研发工程师

精进云原生 - Dubbo Kubernetes 最佳实践

江河清

阿里云研发工程师

Apache Dubbo PMC，阿里云研发工程师，专注于服务框架，Apache Dubbo 核心维护团队成员。

茶歇

政采云基于dubbo的混合云跨网方案实践

王晓彬

政采云资深开发工程师

政采云资深开发工程师，前网易高级开发，负责公司基础服务及创新技术研究。开源领域，分布式事务、分布式数据库、rpc、分布式运行时等社区均有贡献。

OpenSergo & Dubbo 微服务治理最佳实践

何家欢（屿山）

阿里云 MSE 研发工程师

Sentinel Maintainer, 阿里云 MSE 研发工程师，熟悉微服务治理与稳定性领域。

工商银行分布式建设及转型实践

丁兴中

中国工商银行软件研发中心云计算实验室分布式微服务框架架构师

工商银行分布式微服务框架架构师

Seata：微服务架构下的一站式分布式事务解决方案

季敏（清铭）

阿里云分布式事务产品负责人，Seata 开源项目创始人，微服务开源治理负责人

季敏(清铭)，阿里云分布式事务产品负责人，Seata 开源项目创始人，微服务开源治理负责人。有超过10年研发架构经验，推动了集团内中间件的大规模落地、微服务PaaS商业化和开源。目前主要关注云计算中间件领域，致力于打造下一代微服务架构。

数据安全：Apache Ozone 如何保证数据的存储和访问安全

陈怡

Cloudera 首席存储工程师

陈怡，Apache Ozone 开源社区PMC 主席，长期专注于分布式存储领域。目前就职于Cloudera，担任首席存储工程师。曾就职于腾讯和Intel，担任大数据存储技术负责人。

字节跳动 MapReduce -> Spark 平滑迁移实践

魏中佳

字节跳动基础架构工程师

2018 年加入字节跳动，现任字节跳动基础架构大数据开发工程师，专注大数据分布式计算领域，主要负责 Spark 内核开发、字节自研 Shuffle Service 开发。

Apache Kudu 在神策的应用和实践

汪细勖

神策网络科技（北京）有限公司分布式软件开发工程师

2017年毕业于北京航空航天大学，长年致力于互联网大数据的基础架构建设，主要从事分布式存储计算系统的开发及应用工作。热爱开源，积极参与开源社区的工作，先后参与Apache Doris, Apache Pegasus和Apache Kudu的开源项目，并且是Apache Doris committer。目前供职于神策网络科技有限公司基础研发部存储组。

小米 HDFS 数据治理实践与演进

王成伟

小米高级软件研发工程师

小米高级软件开发工程师，HDFS Contributor，多年的 HDFS 优化与维护经验。在小米主要负责 HDFS 相关的优化与维护工作。

茶歇

Apache Celeborn(Incubating): 让 Spark 和 Flink 更快更稳更弹性

周克勇

阿里云 EMR Spark引擎负责人

阿里云EMR Spark引擎负责人，Apache Celeborn (Incubating)的初始作者，在Remote Shuffle Service，向量化引擎，优化器等方面有一定经验。

基于Apache Linkis快速高效构建数据应用工具

王和平

微众银行高级工程师

Apache Linkis PMC 现在就职于微众银行，主要负责Linkis、Spark、Trino、DataSphereStudio等项目的开发和运营工作

How increasing partition size in Apache Cassandra can reduce disk usage by over 30%

John Del Castillo

Technology Evangelist, NetApp

I’m a software engineer with over 15 years of experience developing enterprise software solutions across a variety of languages and technologies. For 6 years I worked at Instaclustr as a Lead Engineer and for the last year I've taken the mantle of Technology Evangelist, specializing in open-source technology. In this role I explore the landscape of open-source technologies, explore new solutions, document interesting use cases and create written and video content to help educate and encourage people to use open source for their business.

Apache ShenYu社区建设的道与术

肖宇

京东科技架构师

ASF Memeber Apache ShenYu VP/ PMC Chair

开发者内容体验解密之旅，追风踏浪

Yu Liu

Technical Writer, StreamNative

Yu Liu 是 Apache Pulsar PMC 成员和 Apache Trafodion committer。作为 StreamNative 的 Technical Writer，她一直致力于提升用户的内容体验，积极布道开源社区，参与开源和技术传播行业各类活动，曾在 ApacheCon Asia、COSCon、OpenInfra Days China、tcworld China、中国技术传播论坛等大会上发表关于信息架构、内容运营与策略、内容代码化等主题的演讲，并踊跃投身于 Our Code is Open 和 OSPP 等开源活动。

面对开源，你还只有用“爱”发电吗？

Rick

开源面对面布道师

程序员，业余开源布道者，开源面对面主持人。

开源之夏——致力点亮新生代开发者的星星之火

李梦

中科院软件所开源之夏品牌负责人

李梦，开源之夏品牌负责人，一枚开源路上学习和进步者，负责开源之夏活动运营第四年。

茶歇

开源之夏最佳实践

王嘉树

北京邮电大学学生

开源之夏2022结项学生，开源之夏首位校园大使，开源之夏北邮校园行组织者之一

Apache Doris 毕业一周年：全球最活跃开源数据库项目的共建之道

鲁志敬

Apache Doris 社区 Committer

鲁志敬，Apache Doris Committer，原百度高级产品经理，曾担任百度 Doris 团队产品和运营负责人，负责内核产品规划、项目商业化 toB 以及开源社区运营等工作。过去几年一直致力于推广 Apache Doris，社区首个非代码 Committer。

《开源 PolarDB-打造世界级云原生数据库开源社区》

周正中

阿里云数据库高级产品专家，阿里云PolarDB开源社区运营负责人

花名德歌，阿里云数据库高级产品专家，阿里云数据库PolarDB开源运营负责人。中国开源软件推进联盟PostgreSQL分会特聘资深领域专家；PG中国社区发起人及PostgreSQL象牙塔发起人之一；DBA社群联合发起人之一；获得10余项数据库相关专利。

云原生数据湖如何提速两倍以上

史少锋

首席架构师，Kyligence Inc

史少锋，Kyligence 首席架构师；Apache Kylin committer & PMC。曾就职于 eBay，IBM，作为核心成员，参与 Apache Kylin 项目的研发与开源全过程。对大数据和云计算行业发展趋势、产业生态、技术产品化有着长期深入的研究和丰富的实战经验。

Apache Paimon 流式数据湖：CDC 入湖与流读

李劲松

阿里巴巴高级技术专家，阿里云开源大数据表存储团队负责人

阿里云开源大数据表存储团队负责人，负责 Apache Paimon 的研发和产品，Founder of Apache Paimon，PMC member of Apache Flink，Committer of Apache Iceberg&Beam。先后从事分布式流计算、分布式批计算、湖存储，目前专注于流式湖仓一体的技术。

下一代超高性能大数据集成工具 - Apache SeaTunnel 在数据湖场景的应用

代立冬

白鲸开源联合创始人

白鲸开源联合创始人、 Apache SeaTunnel PMC & Apache DolphinScheduler PMC、Apache 孵化器导师

基于 Apache Iceberg, Apache Arrow 和 Apache Parquet 的创新 lakehouse 设计

吴刚

云器科技软件工程师

他目前是 Apache ORC 的 PMC，也是 Apache Arrow 和 Apache Parquet 的 committer。在此之前，他是阿里巴巴的高级技术专家，负责MaxCompute的存储系统，也曾在Uber负责Apache Spark平台。

付旭炜

云器科技软件工程师

云器科技软件工程师, 主要负责云器 lakehouse 存储系统的研发。

茶歇

工业互联网背景下的应用与时序数据管理解决方案

许浩

上海道客网络科技有限公司技术顾问

近6年云原生技术领域从业经验，对金融、制造等多个行业数字化转型有深刻理解，致力于通过云原生相关技术和理念，帮助各个产业加速数字化进程。

基于 IoTDB Pipe 玩转工业物联网端边云数据同步

苏宇荣

天谋科技内核研发工程师

面向IoT的消息队列核心设计

潘东元

阿里云消息研发工程师

潘东元，阿里云消息研发工程师。本硕毕业于东南大学，毕业后加入阿里云消息团队，参与了阿里云消息队列RabbitMQ、MQTT、Kafka的研发和商业化工作。目前主要聚焦于MQTT物联网消息领域。

释放物联网潜力：EMQX 与 Apache IoTDB 的结合

周子博

杭州映云科技有限公司 EMQ 社区布道师

EMQ 社区布道师，有着 7 年物联网解决方案研发设计经验，目前致力于在社区中分享传播 EMQ 在物联网领域的经验积累和最佳实践。

茶歇

智能厂务耗量分析

李博

中芯国际助理专家

从事Web后端开发与大数据开发工作。

RocketMQ-MQTT 在小米 IoT 场景的落地与实践

房成进

小米消息中间件研发工程师

2020 年加入小米，消息中间件研发工程师，聚焦小米自研消息队列和 RocketMQ-MQTT 消息网关的架构设计与研发工作

阿里云基于 Flink CDC 的实时数据集成实践

阮航

阿里云高级研发工程师

阿里云高级研发工程师, Flink CDC Maintainer & Apache Flink Contributor

自如基于 Apache StreamPark 的大规模 On Kubernetes 实时计算生产实践深度解析

陈卓宇

自如大数据平台研发工程师

apache streampark ppmc

Flink K8S Operator AutoScaling

陈政羽

Apache Flink中文社区志愿者（大数据开发工程师）

Apache Flink/Streampark Contributor，Apache Flink 中文社区志愿者，长期从事游戏行业数据开发，目前在游戏公司负责Flink公有多云数据解决方案，数据同步以及大数据作业管道平台从0到1的设计、建设工作

RSQLDB 基于消息队列的流数据库

倪泽

阿里云消息团队研发计算专家

阿里云，倪泽：Apache RocketMQ Committer，RocketMQ Streams maintainer，RSQLDB maintainer，云原生-消息团队研发计算专家

茶歇

State of Scala API in Apache Flink

alexey

Solution Architect of Ververica

I am a Solution Architect working for last the last 6 years on data solutions and products. At Ververica I am focusing on supporting clients to solve their challenges in adopting data stream processing with Apache Flink. Among my previous project and companies I developed different systems such as Data Lakes, Data Integration and Data Virtualization Layers. I have also spent many years on developing data services for investment banks including currency trading software. In my spare time, I also contribute to various open-source projects or start my own for fun. My hobbies are astronomy, playing music and gym.

小米 Flink 实时计算平台的建设实践

陈子豪

小米软件研发工程师

小米软件研发工程师，主要负责小米实时计算平台及 Flink 框架内核开发。

Developing Fast Applications With Open Source Software - Without The Fury

Paul Brebner

Open Source Technology Evangelist, NetApp

Paul is the Open Source Technology Evangelist at Instaclustr (now part of Spot by NetApp). For the past six years, he has been learning new scalable Big Data technologies, building realistic demonstration applications, and blogging and talking about a growing list of open-source technologies including Apache Cassandra, Apache Spark, Apache Kafka, Apache ZooKeeper, Redis, OpenSearch, PostgreSQL, Cadence, and many more. Since learning to program on a VAX 11/780, Paul has extensive R&D, teaching, and consulting experience in distributed systems, technology innovation, software architecture and engineering, performance engineering, grid and cloud computing, and data analytics and machine learning. Paul has also worked at Waikato University (New Zealand), University of New South Wales (UNSW, Sydney), Commonwealth Scientific and Industrial Research Organisation (CSIRO, Australia), University College London (UCL, UK), National ICT Australia (NICTA), Australian National University (ANU), and several tech start-ups (including as a Founder/CTO). Paul has an MSc (1st Class Hons, Waikato) in Machine Learning and a BSc (Computer Science and Philosophy, Waikato).

基于 Kubernetes 部署 Apache JMeter 进行大规模负载测试

殷翀元

EMQ 项目经理

殷翀元，EMQ XMeter 项目经理，负责性能测试平台 XMeter 产品，以及开源项目 mqtt-jmeter 的维护。曾于 ApacheCon Asia 2022 做题为《Apache JMeter 在 IoT 测试中的应用》的演讲。 EMQ 是一家开源物联网数据基础设施软件供应商，交付全球领先的开源云原生 MQTT 消息服务器和流处理数据库。EMQ 发起与运营的开源项目包括：开源物联网消息中间件项目 EMQ X，云原生分布式流处理数据库 HStreamDB，轻量级物联网边缘分析与流式处理开源软件 eKuiper，边缘工业协议网关软件 Neuron，跨平台 MQTT 客户端工具 MQTT X，MQTT JMeter 插件 mqtt-jmeter，等。

Apache Arrow Optimization on Arm

Yibo Cai

Principal Software Engineer, Arm

Yibo has been working in the IT industry for more than 20 years. He is principal software engineer from Arm, focusing on improving software ecosystem on Arm server. Including big data, storage, and database. Yibo has rich experience in software optimization, from libraries to complex workloads, from low level architecture specific optimization to high level algorithm improvement. Yibo is an active open source contributor. He is Apache Arrow PMC and SPDK maintainer for SPDK-CSI project.

Java profiling Internals and Its Applications

杨龙

Tool Development Engineer, Alibaba

Member of Alibaba Dragowell team. OpenJDK 8u JFR contributor. Member of Alibaba Cloud Continuous Performance Profiling Team, Java Fliht Recorder and async-profiler expert. He has many years of experience in the Java performance field. In the past year, participated in the development of Alibaba Cloud continuous profiling products.

茶歇

OPPO大数据Spark、Flink引擎诊断系统的设计与实践

庄泽波

OPPO 高级后端研发工程师

OPPO高级研发工程师，Compass开源项目Maintainer，专注云原生、可观测、大数据等领域。

优化 HDFS 性能:在 KUNPENG920 上实现硬件加速器和 ARM64 多核能力的均衡利用

Guodong Xu

Senior Tech Lead, Linaro Ltd.

2012-2023 Linaro Ltd. - Arm SVE/SVE2 optimization, senior tech lead - Kernel development tech lead 2008-2011 Flextronics Ltd, Software development lead 2002-2007 Motorola Mobile, Linux kernel device driver development

AI大模型来袭：开源治理和开发者关系的挑战和机遇

林旅强 Richard Lin

零一万物开源负责人

林旅强 (Richard Lin)，开源社联合创始人，前华为云AI开发者生态总监、华为开源专家，信通院云计算开源产业联盟 (OSCAR) 的专家，对开发者关系及开源生态有深厚的理解和丰富的实践经验。其在行业贡献涵盖了多个领域，包括将中国第一本专注于开发者关系的书籍《开发者关系：方法与实践》引进并亲自翻译，并于国内外诸多知名开发者大会担任演讲嘉宾，如O’Reilly OSCON、LinuxCon、CSDN开源技术峰会、COSCon中国开源年会及开放原子全球开源峰会等。林旅强在过去的15年里，在中国大陆及港台地区深度参与并推动了企业及社区在开发者关系及开源生态的发展，擅长运用以技术生态为基础的商业策略和企业战略，精通开发者生态运营、技术品牌影响力及开源治理。他曾从零到一搭建并完成开发者生态架构系统的落地部门运作，引领开发者依托平台生态进行应用构建。目前，他担任独立顾问及企业内训讲师，引导和帮助企业和开发者在开源生态中找到自身的发展路径。

Talking with management about open source

Rich Bowen

Apache 软件基金会董事，AWS 开源战略师

借助开源生态的力量，探索自我成长与职业发展的价值

潘娟 Trista

SphereEx 联合创始人 & CTO

SphereEx 联合创始人 & CTO，Apache Member & Incubator Mentor，Apache ShardingSphere PMC，AWS Data Hero，中国木兰开源社区导师，腾讯云 TVP。  曾负责京东数科数据库智能平台的设计与研发，现专注于分布式数据库 & 中间件生态及开源领域。被评为《2020 中国开源先锋人物》，2021 OSCAR 尖峰开源人物。CSDN 2021 年度 IT 领军人物，2022 年在 ICDE 发表论文 “Apache ShardingSphere：A Holistic and Pluggable Platform for Data Sharding”

闪电演讲

Navigating the ASF Incubator Process

Justin Mclean

Apache 软件基金会董事

Apache HugeGraph在图数据库开源领域的思考与实践

金子威

百度资深研发工程师

Apache HugeGraph PPMC, 开源社区当前发版负责人, 专注于分布式存储(文件系统/KV数据库) & 图存储/图计算方向, 主导社区性能优化与技术演进, 热爱开源 & 基础架构相关技术, 欢迎大家多多交流 (GitHub: imbajin)

StreamPark ─ 从个人项目到 Apache 孵化器

王华杰

Apache StreamPark 创始人

Apache StreamPark 创始人, 开源组织 Datavane 创始人，SelectDB 资深架构师

Apache OpenDAL(Incubating)：笨办法践行 Apache 之道

尚卓燃（PsiACE）

Databend 研发工程师实习生

Apache OpenDAL(Incubating) PPMC Member

茶歇

Tomcat 的技术内幕和在喜马拉雅的实践

彭荣新

喜马拉雅资深架构师

任职于喜马拉雅, 资深架构师, 10年以上的工作经验，将近8年的基础架构经验，一直从事中间件相关的架构设计和研发工作，2017年加入喜马拉雅，一直在聚集在稳定性保障的领域，主导设计和研发了API网关，负责同城多活项目落地，数据访问层中间件等稳定性保障的相关配套工具的设计和落地，在中间件落地有丰富的经验，爱好学习，乐于分享和交流。

GraalVM 静态编译在 Web 容器应用中的使用实践

饶子昊

阿里云智能研发工程师

阿里巴巴云计算, 阿里云智能研发工程师，Spring Cloud Alibaba 社区负责人，目前就职于阿里云原生应用平台团队，参与了MSE、EDAS、CSB、ARMS等多个云产品的开发，长期专注于微服务、分布式系统、云原生可观测性相关技术。

如何参与 Tomcat 社区

李晗

网易有道高级工程师

网易有道信息技术(北京)有限公司高级工程师，Apache Tomcat 提交者和 PMC Member

使用APM工具链快速定位Tomcat问题最佳实践

陈承

阿里云高级开发工程师

专注可观测领域多年。是阿里巴巴内部大规模分布式链路追踪系统EagleEye以及国内领先APM产品ARMS(阿里云应用实时监控服务)的核心开发人员，具有丰富的APM产品开发、使用经验以及问题排查经验。

茶歇

Dubbo-Go-Pixiu的前世今生

吕梦超

上海联蔚数字科技集团股份有限公司高级 JAVA 工程师

Apache Dubbo Committer，Java工程师，现居南京，毕业于洛阳理工学院。现致力于在Dubbo Go Pixiu社区构建Dubbo生态中通过Http直接调用dubbo集群以及dubbo mesh控制面的能力。

Securing Tomcat

Dennis Jacob

Senior Consultant at a Payments Technology Organization

I am currently working as a Senior Consultant in Middleware Engineering with a leading payment technology organization, with overall 19 years of IT experience. Apart from Middleware Engineering, my interests include application security and cloud native technologies. I am passionate about experimenting on the latest advancements in technology, and speaking to communities and local groups.

Secure by default web applications with Apache Sling

Robert Munteanu

Senior Computer Scientist of Adobe

Working as a Senior Computer Scientist in the AEM Core Cloud Foundation team at Adobe, Robert Munteanu is a software developer with a passion for open source. He is a member of the Apache Software Foundation and frequent contributor to many open source projects, notably Apache Sling and Apache Jackrabbit. Robert is a frequent conference speaker, having spoken at Devoxx, Belgium ApacheCon and EclipseCon, amongst others.

新一代数据集成平台Apache SeaTunnel

高俊

白鲸开源架构师

10年大数据方向研发经验，开源爱好者 Apache DolphinScheduler PMC Apache SeaTunnel PMC

DataOps 在联通数科的实施构建数据研发运营一体化能力

王兴杰

联通数字科技有限公司数据平台架构师

主要负责数据中台工具的集成，推动dataops的实施与应用。目前是Apache dolphinscheduler的committer

如何使用 Apache SeaTunnel 快速接入新数据源

田超

Apache SeaTunnel PMC 大数据开发工程师

Apache SeaTunnel PMC，开源爱好者，目前专注于数据集成领域

Apache DolphinScheduler与云对象存储的对接与整合

程鑫

阿里云研发工程师

任职于阿里云EMR数据开发团队，基础平台研发工程师，硕士毕业于清华大学，Apache DolphinScheduler Committer。

茶歇

Apache DolphinScheduler 指标体系分享

高楚枫

阿里云 EMR 数据开发团队工程师

Apache DolphinScheduler Contributor，阿里云EMR数据开发团队工程师

数据集成技术在小米的应用与实践

郑钧元

小米高级软件研发工程师

参与小米数据平台建设，有多年大数据开发经验，致力于分布式计算及数据集成技术领域建设。

Apache Impala 在神策数据仓库中的最新实践

张倩琼

大数据架构师

我是一位专注于分布式计算和存储系统研发的大数据架构师。我对分布式计算、数据存储和数据处理领域有深入的理解，并能够运用最佳实践来构建高效的大数据解决方案。在Hadoop、Impala、Flink、Kudu等Apache系统的优化方面，我积累了丰富的经验。我曾在腾讯基础架构部、百度大数据部工作，目前就职于Sensorsdata的基础研发部。

Federated Cross-platform SQL with Apache Wayang

Kaustubh Beedkar

Assistant Professor, Indian Institute of Technology Delhi

--Experience-- [April 2023 -- present] Assistant Professor, Indian Institute of Technology, Delhi [May 2023 -- present] Committer and PPMC Apache Wayang, The Apache Software Foundation [2022 -- present] Co-Founder, Databloom AI [June 2021 -- March 2023] Junior Fellow, The Berlin Institute for the Foundations of Learning and Data (BIFOLD) [June 2017 -- March 2023] Senior Researcher, Technical University of Berlin, Germany [Oct 2014 -- Dec 2016] Researcher, University of Mannheim, Germany [April 2012 -- Sept 2014] Researcher, Max-Planck-Institute for Informatics, Germany [Jul 2011 -- April 2012] Visiting Scholar, Max-Planck-Institute for Informatics, Germany --Education-- [2017] Ph.D. in Computer Science, University of Mannheim [2008] MS in Computer Science, Georgia Institute of Technology, USA [2007] B.Tech. in Information Technology, Amrita University, India

Apache Druid 开源十年后的 26.x 大版本

金嘉怡

Shopee 技术专家，Apache Druid Committer & PMC Member

Shopee 大数据技术专家，Apache 顶级项目 Druid 的 Committer 和 PMC，阿里云开源组织 Member，ApacheCon 技术峰会的讲师，极客时间的签约讲师，Imply 高级技术顾问，《宇宙湾》博客的博主，《Java Coding Problems》一书的译者（预计今年上市）

Kylin 5：现代化的大数据分析平台

俞霄翔

Kylin Committer & PMC , Kyligence 大数据研发工程师

Kylin Committer & PMC , Kyligence 大数据研发工程师。

茶歇

小米基于Apache Doris的OLAP实践

魏祚

小米数据库内核研发工程师，Apache Doris Committer & PMC Member

小米数据库内核研发工程师、Apache Doris PMC，在小米集团负责OLAP系统的研发、优化和运维工作。

中国移动基于 Apache HAWQ 的云原生分析型数据库

王小玉

中移动信息技术公司数据库内核架构师，分析型数据库产品负责人

王小玉，中移动信息技术公司数据库内核架构师，分析型数据库产品负责人。负责公司分析型数据库产品的研发和应用。有十数年的数据库内核研发经验，主要研发领域包括查询优化器、高性能计算、SQL on Hadoop等。

SkyWalking的Golang自动探针实践

刘晗

Engineer of Tetrate

Apache SkyWalking 项目的代码提交者和 PMC 成员。开源爱好者。目前就职于Tetrate，专注于做可观测性开发。

Resilient and secure applications with Apache APISIX and KEDA

Jintao Zhang

Cloud Native expert, API7.ai

Apache APISIX PMC, Kubernetes Ingress-NGINX maintainer, Microsoft MVP.

BanyanDB:一个高扩展性的分布式追踪数据库

高洪涛

Tetrate 创始工程师

美国servicemesh服务商tetrate创始工程师。原华为软件开发云技术专家，对云原生产品有丰富的设计，研发与实施经验。对分布式数据库，容器调度，微服务，ServicMesh等技术有深入的了解。目前为Apache ShardingSphere和Apache SkyWalking核心贡献者，参与该开源项目在软件开发云的商业化进程。前当当网系统架构师，开源达人，曾参与Elastic-Job等知名开源项目。对开源项目的管理，推广和社区运营有丰富的经验。积极参与技术分享，曾在多个技术大会中做过分享，包括DTCC，ArchSummit, Top100，Oracle嘉年华等。在多个媒体发表过文章，如InfoQ，OSChina等

点击流数据分析的云原生解决方案和实践

郑予彬

亚马逊云科技资深开发者布道师

郑予彬，软件工程硕士，20年ICT行业和数字化转型实践积累。现任亚马逊云科技资深开发者布道师，专注于AWS云原生、云安全技术领域。18年的架构师经验，专注为金融、教育、制造以及世界500强企业客户提供数据中心建设，软件定义数据中心等解决方案的咨询及技术落地。

刘勇

亚马逊云科技解决方案架构师

刘勇，亚马逊云科技解决方案架构师，毕业于北京邮电大学，计算机科学与技术专业硕士，15年IT从业经验，擅长数据密集型现代应用的架构设计与开发，对大数据，机器学习等技术有深入研究和实践经验。

字节跳动云原生 YARN 实践

邵凯阳

火山引擎云原生计算研发工程师

字节跳动基础架构工程师，在字节跳动基础架构负责离线调度相关工作，具有多年工程架构经验。

ShardingSphere on Cloud：A developer's perspective

苗立尧

Cloud Engineer, SphereEx

曾就职于日本 Netstars、蚂蚁金服和易宝支付。现任 SphereEx 云技术负责人，专注于为 ShardingSphere 构建云上解决方案。

如何构建大规模 API 中心

程小兰

深圳支流科技有限公司后端开发工程师

程小兰，女，硕士，毕业于杭州电子科技大学计算机学院；服务端开发工程师，曾就职于快手科技，负责电商相关to B业务开发，现就职于深圳支流科技，负责网关平台开发；生活高度自律，工作认真负责。

Apache APISIX 助力企业 API 全生命周期管理

Yuansheng Wang

API7.ai(支流科技) CTO

API7.ai co-founder & CTO, Apache APISIX PMC Member

Apache ShenYu 微服务网关百亿流量的实践落地

高向阳

北京转转精神科技有限公司资深研发工程师&Apache ShenYu Contributor

前闪送架构师，8年以上从业经验，中间件团队负责人，包括Dubbo服务治理，分布式消息平台，微服务网关平台，稳定性治理等。热爱架构，热爱分享，多次在行业大会进行主题分享。

An Introduction to the Kubernetes Gateway API with Apache APISIX

Navendu Pottekkat

Apache APISIX Committer

Navendu Pottekkat is a maintainer of Apache APISIX and related open source projects. He helps new contributors to open source by mentoring through the Google Summer of Code and Linux Foundation Mentorship Program. Navendu writes and talks about the cloud native ecosystem and his experience in contributing to, building, scaling, and maintaining open source projects.

茶歇

事件驱动引擎RocketMQ EventBridge的设计与实现

陈永明

阿里云研发工程师

阿里云研发工程师，致力于消息中间件如RocketMQ、EventBridge的探索与开发，主持和维护了阿里云EventBridge大量生态集成相关工作。

RocketMQ 百万队列能力支持 -- RocksDB kv 存储

赵福建

阿里巴巴高级开发工程师

2020年6月毕业于东南大学 2020年7月入职阿里巴巴

RocketMQ在小红书的特色实践

李亚斌

小红书在线消息队列负责人

茶歇

小米 RocketMQ 的降本增效和容灾实践

邓志文

小米软件研发工程师

Apache RocketMQ Committer，小米研发工程师，主要负责消息队列相关工作。

云原生消息流系统 Apache RocketMQ 在腾讯云的大规模生产实践

李伟

腾讯科技（成都）有限公司资深后端开发工程师

社区里大家叫小伟(tiger)，Apache RocketMQ北京社区联合发起人,RocketMQ社区Python项目负责人，RocketMQ项目Commiter，RocketMQ Exporter项目主要代码贡献者，Apache Doris Contributor，著有《RocketMQ分布式消息中间件：核心原理与最佳实践》。目前就职腾讯云消息队列团队，主要负责云上消息队列相关工作。分享一句话：技术无穷尽，真诚以待人，虚心以待学。

移动云MQTT-RocketMQ消息队列的海量数据流转实践

庄兴旺

中国移动云能力中心Iaas产品部rpc产品组助理研发工程师

中国移动云能力中心Iaas产品部rpc产品组助理研发工程师，主要负责移动云消息队列RocketMQ和MQTT的设计与研发工作

合作伙伴

主办单位