数字人与XR互动论坛
议题1:从 Avatar 到 AI Being, 数字人类人互动的演进之路
议题2:语音驱动表情合成技术前沿进展
议题3:快手 3D 数字人直播与互动解决方案
议题4:LLM 和生成式 AI 时代下的数字虚拟人技术变革
个人介绍:赵中州,阿里巴巴达摩院高级算法专家,哈工大本硕、帕维亚大学计算机硕士。十余年人机交互领域经验,阿里小蜜家族核心初创成员。目前负责达摩院数字人互动算法,带领团队先后打造了业界首个超过真人转化的电商虚拟主播、首个支持识别与合成双向交互的手语数字人等产品,目前关注数字人多模态交互、情感计算、认知推理等技术领域,以技术创新推动体验升级和业务规模化发展。
演讲题目:从Avatar到AI Being, 数字人类人互动的演进之路
演讲提纲:
数字人随着技术的持续创新与应用场景的丰富,逐渐从形象化身(Avatar)进化为具备智能与类人交互能力的数智人(AI Being),这背后需要解决实时交互、情感计算、人格模拟、个性表达等多种挑战,本次分享将围绕这些挑战带来相关的技术探索与实践,并展望在LLM加持下的数字人能力发展趋势。
内容大纲:
1、数字人技术发展、应用及挑战速览
2、实时双工交互,打破数字人互动的延迟屏障
3、情感与认知计算,构建数字人的类人大脑
4、统一人格表示,驱动数字人多模个性化表达
5、LLM加持下的数字人AGI之路
听众收益:
1.了解数字人发展现状及应用
2.了解全双工交互的技术原理及实践
3.了解情感与人格计算的技术原理及实践
4.了解LLM在数字人上的技术融合及演进趋势
个人介绍:网易伏羲虚拟人首席专家, 长期专注于虚拟人研究和应用工作。工作成果应用于网易在线游戏,在线教育产品,多地展厅和文旅景点数字化改造项目;发表学术论文50余篇(包括CCF A类顶级会议论文及期刊30余篇);连续三届获得图像视觉顶会(ICCV2021, CVPR2022-2023)人脸表情感知国际挑战赛(ABAW)双赛道冠军;首创135种表情划分标准。
演讲题目:语音驱动表情合成技术前沿进展
演讲提纲:随着人工智能技术的发展,虚拟人驱动技术已经成为学术界和产业界高度关注的领域,近年来也取得了快速进展。本次交流聚焦于语音生成表情技术,即利用说话语音作为输入生成说话人的面部视频,包括2D像素级视频合成和3D表情动画合成,涉及口型合成、眉眼合成和头部姿态运动等方面。该课题的意义在于基于深度学习技术自动合成视频内容,无需依赖于动捕设备捕捉面部动画和视频录制设备。
本次交流将尝试阐明以下几个问题:
1. 为什么听觉信号能够传达细腻的视觉表情?
2. 当前学术界和产业界在语音生成表情技术方面都取得了哪些进展和异同点?
3. 当前前沿技术的研究热点和难点。
听众收益:
1. 了解当前语音生成表情技术的前沿研究和应用现状;
2. 了解不同算法和技术的优缺点,以及在实际应用中的适用范围和局限性。
个人介绍:毕业于清华大学,在视频+人工智能和XR领域有超过10年的经验。曾在华为和腾讯负责创新技术研发工作,目前在快手领导团队开发3D数字人解决方案和虚拟世界互动平台。
演讲题目:快手 3D 数字人直播与互动解决方案
演讲提纲:
快手围绕3D数字人开播及互动落地,在直播、社交等领域进行了系列实践,背后来自3D数字人开播互动技术方案的强大支撑—— 快手虚拟演播解决方案KVSS(Kuaishou Virtual Studio Solution ), 为此快手建设了虚拟世界互动平台(Kuaishou Metaverse Interactive Platform,简称KMIP),基于 PAAS 技术基础支撑各种应用场景。在本次分享中,我们将介绍快手 KVSS解决方案的架构,并分享如何接入快手虚拟世界应用生态,与数亿用户一起共拓元宇宙应用市场
主要内容包括:
1. 快手 3D 数字人案例,解决方案综述
2. 快手 3D 数字人开播技术:建模、驱动等
3. 快手 3D 数字人互动技术:游戏化 & 开放平台
4. 总结与展望
听众收益:
1. 了解 3D 数字人的技术原理和如何直播
2. 了解 3D 数字人互动和游戏技术的关联拓展
3. 了解目前直播间互动游戏化的案例和未来元宇宙直播间的可能形态
个人介绍:何展,NVIDIA中国区Omniverse业务负责人,毕业于南开大学,曾就职于Autodesk,SAP,GE Digital等公司负责市场以及ToB战略咨询以及管理业务,目前就职于NVIDIA,负责中国区Omniverse 和RTX企业级产品线在中国区域的业务拓展工作,对AI、机器学习以及深度学习有资深的经历和见解,目前专注在推广数字孪生在工业行业的AI应用、AI数字虚拟人、数字资产创建、生成式AI等落地应用上。
演讲题目:LLM和生成式AI时代下的数字虚拟人技术变革
演讲提纲:
在大规模语言模型和生成式AI技术背景下,如何帮助数字虚拟人创作者提升生产力是所有人都关注的话题,哪些技术赋能行业数字虚拟人创建,同时计算机视觉、计算机图形学、物理引擎模拟、AI、XR以及云原生等技术如何相互融合,演讲中会给大家分享NVIDIA英伟达在这些方面的理解。