具身智能机器人:开放域多模态推理智能体
〇 分享简介 〇
具身智能的历史可以追溯到人工智能领域的早期阶段,随着技术的不断进步和发展,具身智能引起了越来越多的关注和研究。研究者们在感知、决策和行动的具身基础框架与端到端框架中,探索如何使机器能够像人一样感知周围环境、做出决策和执行行动。
在开放世界中,以视觉语言模型为基础的具身感知成为研究的热点,通过这种模型,机器能够更好地理解和处理复杂的视觉信息。与此同时,具身智能体与模糊需求下的机器人的任务规划也成为了研究的重点之一。更重要的是,具身操作大模型依然存在较大瓶颈,但涌现出新的技术路线和方法。我们将分享开放域推理智能体、人形机器人行走和操作控制、人形机器人核心部件三个方面的议题。
本次分享将在商业化层面,把具身智能机器人的商业化路径和垂直场景探索,轮臂机器人和高端仿人机器人的商业化落地场景,具身智能机器人落地的市场策略,高端仿生女性机器人公司的生态位置,清晰的呈现给对具身智能感兴趣的与会者。
〇 分享收益 〇
目标
1、了解开放世界中以视觉语言模型为基础的具身感知和感知记忆
2、了解多模态具身智能体与模糊需求下的长周期机器人任务规划
3、了解具身控制中模仿学习、深度强化学习的技术路线选择
4、了解生成式训练智能体与具身控制中如何提升泛化能力
5、了解具身智能和人形机器人的行业洞见和商业模式探索经验
成功要点
全面从开放域推理智能体、人形机器人行走和操作控制、人形机器人核心部件三个方面的议题,理解与了解具身智能机器人脑、体、肢的全栈技术链条。
启示
具身智能的硬实力为:机器视觉和多模态大模型,AI的躯体其实并非是最重要的,核心应该是发展AI大脑,打通人机交互方式,让AI能够主动感知物理世界,拟人化的思维路径才能做到人类期待的行为反馈。机器视觉和多模态大模型正是开启这个世界的两把钥匙。
〇 分享亮点 〇
1、具身智能和人形机器人的起源
1)具身智能的发展历史及浪潮之巅
2)人形机器人的起源到现世
3)智能涌现带来的启示
4)具身智能的最佳承载形态和终极形态
5)具身智能机器人的商业化路径
2、具身智能和人形机器人的硬核技术
1)具身智能体的三个泛化要求
2)开放域智能体的对齐要求
3)传统智能体和大模型智能体的区别
4)经典及领先的智能体框架
5)视觉语言模型与人形机器人深度结合
6)感知、决策和行动的具身基础框架与端到端框架
7)开放世界中以视觉语言模型为基础的具身感知和感知记忆
8)多模态具身智能体与模糊需求下的长周期机器人任务规划
9)具身控制中模仿学习、深度强化学习的技术路线选择
10)基础模型持续推动机器人在开放世界的泛化
11)人形机器人核心部件
3、具身智能和人形机器人的商业化前景
1)轮臂机器人和高端仿人机器人的商业化落地场景
2)具身智能机器人落地的市场策略
3)高端仿生女性机器人公司的生态位置
4)从碳基生命到硅基生命的展望
机器姬首席技术官,具身智能方向知名技术专家和科学家,机器人领域青年领导者之一,7 年知名机器人公司首席技术官经历,阿里巴巴机器学习算法研究经历。学术研究领域包括具身智能、机器人学习、移动机器人技术。苏黎世联邦理工学院计算机系全奖博士休学创业,曾担任苏黎世联邦理工学院计算机系研究助理,师从世界著名的机器学习教授,同时拥有工学硕士和工学学士学位,20+ 专利第一作者, 在国际顶级期刊和会议发表论文 6 篇。文生行动推理智能体 JI Agent 的原作者,ZROS 核心作者,国家奖学金获得者,清华大学启航奖获得者、最佳论文奖获得者,中国服务机器人及特种机器人产业联盟专家委员会委员。具身智能一百零八讲主讲人。