使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
历经 2023 年的「百模大战」,AI 正在各行业领域沉淀、落地。科技巨头们的比拼焦点正在从把模型越做越大,转向端侧大模型的研发与应用,并成为行业日益关注的焦点。
如果把云端的大模型类比成无所不能的智能,那么端侧的大模型更像是一种无所不在的智能。对于企业来说,如何抓住端侧大模型的热潮,深入挖掘其在各行业的应用潜力,将其与自身业务紧密结合,催生新的增长动力,这不仅是一个战略机遇,也是企业管理者需要深思熟虑的问题。将目光投向实际生产,想要把大模型装进算力有限的终端设备,总会存在一些绕不开的技术难点,如何在有限的计算资源下保持模型性能?如何在电池续航能力有限的情况下降低模型运行的能耗?如何设计蒸馏、剪枝算法为 AI 模型降本增效?
这时,举办一场详细拆解端侧大模型技术与应用实践活动就显得尤为迫切,基于此,由机器之心联合世界人工智能大会组委会办公室精心策划的「端侧 AI 大模型开发与应用实践」技术论坛,将于 10 月 26 日在上海举办。
核心议题:
端侧模型的压缩与量化技术
端侧推理引擎的架构和工作原理
大模型在手机端侧部署落地探索
面向端侧部署的多模态大模型技术
端侧芯片的能效优化:实现更长续航与更低功耗
端侧设备中模型部署实战
.........
端侧 AI 解读与发展趋势
通用人工智能下的智能终端
面向端侧部署的多模态大模型技术
端侧 AI 应用“芯”机遇,NPU 加速终端算力升级
端侧模型的压缩与量化技术:实现高效推理的途径
午休
端侧 AI 模型在车载场景的应用与发展趋势
端侧 AI 在智能终端设备的部署与应用
大模型在手机端侧部署落地探索
智能穿戴设备的创新应用与场景实践
休息与实操准备
技术实操—端侧设备中模型部署实战
端侧 AI 解读与发展趋势
长期从事稀疏计算电路与系统研究,发表论文80余篇,谷歌学术施引千余次。他带领团队提出FlightLLM是全球首个FPGA大模型推理IP,相比GPU能效提升6倍。曾获DATE’24、ASP-DAC’19 最佳论文奖,和多次会议最佳论文提名,个人曾获2022 WAIC云帆奖等荣誉。
通用人工智能下的智能终端
目前带领团队负责研究智能终端,视频理解与生成等相关研究领域。在CVPR,ICCV,ECCV,PAMI等顶级期刊会议发表数十篇论文,谷歌学术引用数超过10000。组织发布了 3D 数据集项目 OpenXDLab,包括 RenderMe-360、DNA-Rendering和 OmniObject 3D(CVPR2023 最佳论文候选)。作为作者之一获得中国图像图形学学会技术发明一等奖。负责技术产品包括端侧大模型SenseChat-Lite,手机人脸识别SenseID,手机智能抓拍BestMoment,增强现实平台SenseMARS,智能车舱SenseCabin等。
面向端侧部署的多模态大模型技术
面壁智能副总裁,端侧大模型项目负责人,主导负责面壁CPM-C千亿大模型,面壁MiniCPM系列端侧大模型项目研发。特别是面壁“小钢炮”MiniCPM系列端侧模型,包含基座模型MiniCPM和多模态模型MiniCPM-V,凭借以小博大、高效低成本的特性享誉全球。
端侧 AI 应用“芯”机遇,NPU 加速终端算力升级
负责“周易” NPU IP产品,致力于对接并满足多样化端侧硬件设备的不同AI计算需求。他深耕AI领域,拥有丰富的架构设计经验,涵盖了从AI高性能计算到AI高能效比设计等多个重要领域,曾带领团队多次实现了成功流片到顺利量产的目标,显著提升了AI大芯片的能效比。
自加入安谋科技以来,鲍敏祺先生负责NPU IP产品的定义与市场推广,并推动这些前沿技术的实际应用与落地。
端侧模型的压缩与量化技术:实现高效推理的途径
曾任华为编译器与编程语言实验室架构师,主攻并行计算、异构编程和编译系统,拥有多年面向国产芯片的编译产品构建和落地经验。
午休
端侧 AI 模型在车载场景的应用与发展趋势
端侧 AI 在智能终端设备的部署与应用
大模型在手机端侧部署落地探索
2019年博士毕业于华中科技大学,专注于深度学习模型推理性能优化。在OPPO开发了针对Transformer结构模型的高性能端侧推理引擎Transformer-Lite,实现Transformer模型端侧GPU推理性能业界高度领先,支持了智能消除等算法端侧部署。
智能穿戴设备的创新应用与场景实践
休息与实操准备
技术实操—端侧设备中模型部署实战
技术研讨:端侧 AI 的最新技术知识、研究成果及未来发展趋势,为实操提供理论支持;
案例驱动学习:让参与者了解端侧 AI 在不同场景下的应用和解决方案;
手把手实操教程:技术专家现场带领实操,让参会者能够亲自实践端侧 AI 模型部署技术;
互动式现场:设置 Q&A 答疑环节,帮助参会者解决在操作过程中遇到的问题。
专家们准备了丰富的实际用例,从芯片、软件栈到手机、智能终端,分享端侧大模型在各行各业中的「实战经验」。
了解技术发展的方向趋势,探索新的业务模式和应用场景,推动产品和服务的创新,满足市场和客户的新需求。
不仅能系统学到最新的关键技术,还将在理论中进行实操,在实践中巩固学习成果。
这不仅能够帮助企业培养和储备相关领域的专业人才,更能扩展软件工程师们的技能集,从而能够处理更广泛的项目,在产品设计和服务创新上取得先机!
无论你是什么职业背景,只要你对人工智能及端侧 AI 感兴趣,本次论坛都是为你量身打造的。
职场人士
无论你是研发工程师、项目经理、产品经理或者技术开发者,掌握端侧 AI 的相关技术知识和应用能力,提升你的技术水平,将帮助你在职场上更具有竞争力。
企业家
无论是手机、智能穿戴、智能座舱、智能家居或者智能终端行业,都在逐步部署端侧 AI。通过这场论坛,你将更好地了解端侧 AI 如何赋能企业,帮助贵公司在转型过程中做出更具前瞻性的决策。
研究员/学生
无论你是想拓展新的研究领域,还是想提前为职场生涯累积技术知识,深入了解端侧 AI 的技术发展趋势及应用,这将是你未来人生路上的加分项。
长期从事稀疏计算电路与系统研究,发表论文80余篇,谷歌学术施引千余次。他带领团队提出FlightLLM是全球首个FPGA大模型推理IP,相比GPU能效提升6倍。曾获DATE’24、ASP-DAC’19 最佳论文奖,和多次会议最佳论文提名,个人曾获2022 WAIC云帆奖等荣誉。
2019年博士毕业于华中科技大学,专注于深度学习模型推理性能优化。在OPPO开发了针对Transformer结构模型的高性能端侧推理引擎Transformer-Lite,实现Transformer模型端侧GPU推理性能业界高度领先,支持了智能消除等算法端侧部署。
面壁智能副总裁,端侧大模型项目负责人,主导负责面壁CPM-C千亿大模型,面壁MiniCPM系列端侧大模型项目研发。特别是面壁“小钢炮”MiniCPM系列端侧模型,包含基座模型MiniCPM和多模态模型MiniCPM-V,凭借以小博大、高效低成本的特性享誉全球。
负责“周易” NPU IP产品,致力于对接并满足多样化端侧硬件设备的不同AI计算需求。他深耕AI领域,拥有丰富的架构设计经验,涵盖了从AI高性能计算到AI高能效比设计等多个重要领域,曾带领团队多次实现了成功流片到顺利量产的目标,显著提升了AI大芯片的能效比。
自加入安谋科技以来,鲍敏祺先生负责NPU IP产品的定义与市场推广,并推动这些前沿技术的实际应用与落地。
目前带领团队负责研究智能终端,视频理解与生成等相关研究领域。在CVPR,ICCV,ECCV,PAMI等顶级期刊会议发表数十篇论文,谷歌学术引用数超过10000。组织发布了 3D 数据集项目 OpenXDLab,包括 RenderMe-360、DNA-Rendering和 OmniObject 3D(CVPR2023 最佳论文候选)。作为作者之一获得中国图像图形学学会技术发明一等奖。负责技术产品包括端侧大模型SenseChat-Lite,手机人脸识别SenseID,手机智能抓拍BestMoment,增强现实平台SenseMARS,智能车舱SenseCabin等。
曾任华为编译器与编程语言实验室架构师,主攻并行计算、异构编程和编译系统,拥有多年面向国产芯片的编译产品构建和落地经验。
咨询本次论坛更多信息,如团购、发票、内容等相关问题,欢迎添加机器之心小助手(ID:13661489516)或通过邮件(panminmin@jiqizhixin.com)进行咨询。
活动现场还将设置抽奖环节,获奖者将会获得《大模型应用开发:动手做 AI Agent》。