返回上一页 > 日程安排

小米 GUI Agent 的思考和实践 Agentic AI Summit 超级智能体系统架构峰会·北京站Agentic AI Summit 超级智能体系统架构峰会·北京站

时间: 01 月 17 日 13:30 - 14:15
内容介绍:

在人工智能与移动终端深度融合的浪潮中,如何让智能体真正“看懂”界面、“自主”操作,已成为人机交互领域的关键挑战。小米 GUI Agent,作为基于视觉语言模型的图形界面智能体,通过端到端的感知与决策能力,实现了对手机、汽车等多场景的跨平台精准交互,无需依赖传统结构化数据,极大拓展了智能助理的应用边界。


在2025年10月的 SuperCLUE 测评中,小米 GUI Agent 以90.01分的优异成绩斩获金牌,在13款国内外竞品中位列第一,标志着手机交互正从语音助手时代迈入 GUI 智能体驱动的新阶段。


本次演讲将系统介绍我们在 GUI Agent 方面的技术思考、核心模型架构、强化学习优化策略,以及在手机与汽车座舱等场景中的规模化落地实践,并展望其未来的演进方向与应用前景。


演讲提纲:

1、GUI Agent 概述:从自动化工具到感知决策智能体

2、核心技术架构:视觉语言模型与强化学习的深度融合

3、系统能力评测与实际场景表现

4、落地实践:从手机到跨设备场景的规模化部署

5、未来展望:GUI Agent 的技术演进与生态构建


听众收益:

- GUI Agent 的基础认知

- GUI Agent 小米的前沿研究

- GUI Agent 小米的落地实践经验

日程嘉宾
Agentic AI Summit 超级智能体系统架构峰会·北京站
刘伟
小米 大模型智能体负责人

北京大学心理与认知科学学院硕士行业导师,北邮101拔尖班企业导师,CCF YOSCEF总部学术委员,CCF大模型论坛执委,微软小冰初创成员。研究方向:人机对话、大语言模型和AI Agent。有超过10年的人机对话从业经历,主导和深度参与了微软小冰、小爱同学等业界具有影响力的人机对话产品的研发,主导了小米MiLM系列基座模型训练。曾获23年小米百万美金技术大奖,24年CCF计算机应用创新技术一等奖,24年数博会优秀科技成果奖等,在国际顶级学术会议和杂志发表论文30余篇。