活动首页 > 嘉宾介绍
DA数智大会2025 · 上海站
梁家卿 博士
复旦大学 青年副研究员

复旦大学大数据学院青年副研究员,主要研究方向为基于知识图谱与大模型的认知智能。在国际顶级学术会议与期刊(包括TKDE,AAAI,IJCAI,ICDE等)发表论文50多篇。在应用落地方面,作为技术负责人研发并公开发布了多个知识图谱与大模型应用平台如CuteGPT、Emo-CuteGPT、CN-DBpedia、ProbasePlus、CN-Probase、“不倒翁”智能问答等,相关产品API被工业界与学术界多家单位已调用累计17亿次以上,并形成了16个专利。有成功训练百亿参数量级别模型的经验和在大规模集群上训练千亿参数量级别模型的经验。先后在国际性的“知识库构建”比赛中荣获第二名;在中国计算机学会和中国中文信息学会的主办的语言与智能技术竞赛“信息抽取”比赛中荣获第一名。主持研发的情感增强大模型 CuteGPT 在上海卓辰信息科技有限公司(帮助其情报信息知识抽取准确率达到 90%以上)、上海双地信息系统有限公司(帮助其开发了内容管理产品“小孔商业智能AI助理”)、上海光唯文化传媒有限公司(应用于其客户在新产品研发业务,新产品销售额超过千万元)等单位实现了落地应用。并且曾获ACM-ICPC区域赛金牌、TopCoder Open全球前150名、吴文俊人工智能科学技术奖科技进步奖三等奖、上海市优秀博士毕业生、上海市计算机学会优秀博士论文、华为云最佳论文复现奖、复旦大学超级博士后、上海市超级博士后、中国博士后科学基金面上资助、国家自然科学基金青年基金资助。

嘉宾日程:

面向领域的大模型思维能力

#数据集建设与合成数据

近年来,大模型在通用智能领域取得了显著进展,但面向特定领域的思维能力仍面临挑战。以o1和r1类模型为代表,其强大的推理能力为领域应用提供了新思路。然而,复杂指令下的多约束遵循、领域思维的精准模仿、强化学习试错与工具利用,以及混合工具支持的复杂思维过程,仍是大模型应用中的核心痛点。需要聚焦于这些瓶颈,探索如何提升大模型在领域任务中的表现。例如,在复杂指令场景中,模型需准确理解并满足多重约束,而非简单生成答案;在领域思维模仿中,要求模型深度捕捉行业逻辑与专家经验;通过强化学习试错,结合外部工具,提升解决动态问题的能力;最终,在混合工具的复杂思维过程中,实现多步骤推理与资源整合。o1 类模型在这些方面的潜力令人期待,但也暴露出通用性与专业性间的权衡。我们旨在通过优化训练范式与工具集成,推动大模型更好地服务于领域应用,释放其在复杂场景中的思维潜能。

议题大纲:

1.  领域特定思维能力的内涵与挑战分析

2.  大模型复杂指令理解与多约束遵循的技术路径

3.  领域思维精准模仿的方法与实践

4.  强化学习试错与外部工具协同机制

5.  混合工具支持下的多步骤推理与资源整合策略

6.  通用性与专业性之间的权衡及优化方向

听众收益:

1.  深入理解最新目标导向的强化学习赋能下的大模型在特定领域应用中的关键技术挑战与解决思路

2.  掌握复杂指令理解、多约束遵循、领域思维模仿、强化学习与工具协同的最新进展与实践经验

3.  学习大模型落地在相关领域的研究与产品研发实践

04 月 25 日 14:00 - 14:45