使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
RTE大会(原“RTC大会”)创立于2015年,是亚太首个、迄今为止规模最大的实时互联网技术盛会,覆盖200+行业场景、累计影响200w+开发者。2020 年,实时互联网大会名称从「RTC 大会」升级为「RTE 大会」,大会主题也从技术探讨逐步升级为以技术为内核、聚焦更广泛场景的行业峰会。
今年是RTE实时互联网大会十周年,推出辐射实时互联网全生态的论坛及周边活动共计20余场,覆盖大模型、AIGC、出海等时下最热门的话题讨论。参与大会,你还有机会获得由声网主编,机械工业出版社出版的《读懂实时互动》图书、《2024泛娱乐出海攻坚地图》以及RTE全场景AI图谱。
赵斌,声网创始人兼CEO。2014年创立声网,开创了全球实时互动云服务。2020年6月26日,声网母公司 Agora, Inc.成功登陆纳斯达克,股票代码 为“API”。声网服务的企业遍布社交、教育、IoT、金融、医疗等20余行业,200多种场景。在此之前,赵斌也曾参与两家美国纳斯达克上市公司的创立。1997年,作为创始工程师之一参与WebEx (网讯) 创业。2007年,作为CTO参与YY (欢聚时代)创业。
钟声,声网首席科学家、CTO。北京大学数学系学士和博士。曾任海信芯片总经理兼CTO、博通资深主任科学家、华亚微电子技术副总裁。拥有 100 余项技术发明专利。曾是 MPEG/JVT 与 INCITS 主要成员,并发表了 30 余篇论文,主要从事图像处理、视频编解码、计算机视觉、深度学习、芯片架构设计等方向的研发。
吴玮杰先生现任智谱AI副总裁,负责公司2B业务。在此之前,他曾担任字节跳动旗下飞书和Lark全球首席商业官,整体负责字节跳动企业SaaS应用的商业化工作。除此以外,吴玮杰先生也曾担任GE数字集团大中华区副总裁兼销售总经理、复星集团联席CGO、快乐BG联席首席投资官、Oracle公司等管理岗位。
吴玮杰先生持有ISCTE-IUL管理学博士学位,香港大学国际工商管理硕士学位以及复旦大学软件工程学士、硕士学位。
inSpaze是一款专为Apple Vision Pro量身定制的社交产品,旨在打破空间和语言的障碍,带来沉浸式的互动娱乐体验。它是挚文集团推出的基于Apple Vision Pro原生开发的沉浸式空间社交产品,于2024年2月与Apple Vision Pro同步上线。苹果CEO蒂姆·库克在访问挚文集团时,对inSpaze给予了高度评价,认为其在Apple Vision Pro空间算力之下的沉浸式社交体验令人印象深刻。
先后任职于搜狐视频、芒果TV,长期从事在线视频平台技术研发与应用,现任职于芒果融创科技有限公司(5G高新视频多场景应用国家广播电视总局重点实验室)主要从事超高清内容生产技术与空间互动内容生产技术研究。
张栋,复旦大学硕士生,导师为周雅倩副教授和邱锡鹏教授,研究领域为端到端语音对话与语音大模型,作为第一作者在 ICLR/ACL/EMNLP 等会议发表多篇文章,代表性科研成果为 SpeechGPT 系列工作。
吴毅敏,Unity中国平台合作业务总监,曾任职于AWS, IBM, EMC等公司,超过15年IT咨询顾问、架构师、项目经理及销售的融合角色工作经验,在实时3D引擎、云计算、数字孪生及元宇宙等领域有着丰富的经验和深刻的见解,目前在Unity中国负责平台合作业务,致力于拓展Unity实时3D平台在中国的合作伙伴生态。
关注出海3年半、4年记者经验 关心社交&泛娱乐、粮食、宠物和时尚
戴伟,博士毕业于香港科技大学,主要研究视频编解码的加速和优化。目前是声网视频编解码器负责人,2016年加入声网,主导开发并落地了声网SDK中的264和av1的编解码器。
声网直播产品负责人
声网泛娱乐行业产品经理,12年移动互联网产品和开发经验;曾任职爱奇艺、淘宝直播,对音视频行业有丰富的经验和洞察。
李嵩,声网音频算法工程师。德国汉诺威大学博士,主要从事空间音频,心理声学和耳机主动降噪的算法研究。参与过 HRTF 快速测量、虚拟声外化感提升、基于 VR 的空间音频、耳机主动降噪等项目。共发表了20余篇学术论文,拥有6项专利。2021 年加入声网,主要负责空间音频算法研究,包括双耳声实时渲染、增强立体感和沉浸感等。
声网 RTM 产品经理
曾创办码尚叮咚网络科技有限公司,为职教客户提供SCRM服务 多年在线教育从业经验,历任长投学堂技术中台负责人,海风教育学生端负责人。
多模态大模型的快速发展,推动了人与 AI 交互方式的变革。从文字到语音,也让 AGI 真正走进实时互动,促进实时互动的技术进化和场景爆发。在 RTE2024 主论坛上,我们将聚焦大模型与实时互动,探讨AI+RTE的技术实践与未来展望 ,汇聚顶尖行业大咖,共赴一场前沿技术、创新场景、精彩观点深度碰撞的科技盛宴。
AI产业当下在全球发展的如火如荼,LLM大语言模型作为AIGC的核心模块,其发展尤为引人关注。随着技术的进步,大语言模型的能力也不断进化,一方面,训练数据量与算力的提升,AI 的生成内容更精准、更智能;另一方面,大模型的交互方式,也从文本升级为音频、视频的多模态,可以支持人与AI的语音对话等,实时语音交互也将成为对话式多模态大模型的必经之路。本场AI论坛将深度探讨AIGC+RTE如何推动AI行业的变革。
“不出海就出局”已成为泛娱乐行业的共识。在一众泛娱乐赛道中,社交出海成为亮点式的存在。据相关数据,2024年,全球社交媒体活跃用户数量已突破50亿大关,相当于世界人口的62.3%,巨大的市场需求为社交出海产业带来了广阔的前景。在这场席卷全球的在线社交浪潮中,中国社交出海应用正掀起新的波澜。
过去一年里,大模型技术在持续进化,作为RTE云服务行业的引领者,声网也在不断精进技术,丰富RTE产品版图,探索AI与RTE相结合的无限可能。本次声网产品专场,不仅会带来RTE行业最前沿的产品及解决方案发布,也将分享声网对AI+RTE 技术实践及未来发展的更多思考。
在第四届 RTE 创新大赛决赛现场,你将听到实时互动赛道头部投资人最犀利的点评,感受数百位创业者的热情和专业,也能够收获很多前所未有的创新场景和点子的启发。
AI 无疑是今年最热话题之一,AI 与泛娱乐的天然耦合性让行业再次沸腾,涌现出诸如 AI+社交、AI+游戏、AI+短剧等一大批融合AI的应用,不仅快速收割了大批用户,也收获了资本认可。AI 驱动下的新一轮社交应用潮已悄然兴起,谁将成为下一个领航者?
近年来,AI 技术迅猛发展,应用场景不断拓展,更在教育领域展现出巨大潜力,尤其是以语言大模型为代表的新一代人工智能,凭借其高生成性、高自主性、高交互性,给传统的教育方式和教学方法带来冲击,从文本到音频、视频,伴随人与 AI 的交互方式的不断升级,将为在线教育场景带来哪些改变?
视频内容爆炸增长,AI 生成视频技术日新月异,海量数据对存储和传输提出巨大挑战。AV1、H.266、端到端图像编码等新一代编解码技术如何应对挑战?随着更多 AI 视觉理解和实时互动场景的涌现,弱网传输和端侧算法又该如何优化?让我们共同探讨视频产业智能化发展。
RTE 技术在新一轮语音 AI 的发展中扮演着重要角色,RTE 技术使语音 AI 能流畅响应用户的语音输入和更自然地模拟人类交流。从音频技术的最新进展到语音 AI 的场景落地,本论坛将探讨 RTE 技术如何推动语音系统向更高层次的实时互动发展。
这一轮多模态实时互动 AI 技术的革新中,RTC 技术提供了低延迟、高可靠性的通信能力,使人和 AI 能实时互动交流。在实时 AI 时代,厂商应如何构建面向实时互动场景的大模型?开发者如何寻找实时 AI 的落地场景?本论坛将揭示这一领域的技术发展趋势和应用前景。
随着AIGC在各行业的大爆发,AI、大模型正加速融入音箱、头显、智能家居、汽车、机器人等各类智能终端,重新定义一切智能硬件,开启新的硬件创新周期,本次论坛将围绕 AI+智能硬件,深度探讨多形态的创新场景应用和体验。
智能硬件在 AI 能力加持下迎来了新时期。语音 AI 的互动接近人类,小型可穿戴硬件可长时间陪伴并反馈,AI 能够实时地看见、理解和学习周遭环境,我们距离无处不在的计算和人机互动的未来越来越近。今天的论坛将深入探讨这些技术的进展和 RTE 在其中的重要角色。
所有大模型都在探寻规格和性能的最佳平衡。手机助理、虚拟陪练等 AI native app 的落地过程中,移动应用的基础设施、架构设计也面临新挑战。如何构建高可用、超低延迟的云边端协同架构?又该如何开发兼容多模型和多能力模块的开源框架?本专场也将探讨实时互动和最新架构、基础设施的关系和实践。