2025中国软件研发创新科技峰会

返回上一页 > 日程安排

大模型后训练在智能运维Agent 上的应用

时间： 09 月 14 日 15:40 - 16:30

内容介绍：

〇分享简介〇

现代IT系统复杂度飙升，运维团队不仅深陷于海量数据带来的“认知债”，更面临着通用大模型缺乏企业内部知识、无法有效执行具体运维任务的现实鸿沟。

面对此困境，我们的答案并非在“外挂知识(RAG)”与“模型训练(微调)”间摇摆，而是打造混合架构，兼取两者之长。企业更核心的贡献是提出了一套体系化的 Agent后训练方法论，通过监督微调(SFT)为其注入专业技能，再以专家偏好对齐(如DPO)塑造其思维，最终确保大模型在AI Ops场景中行之有效。

本次分享将系统阐述后训练为核心技术，通过后训练大幅度提高运维Agent的效率和执行成功率，将一个通用大模型，锻造成一个真正能理解并解决企业具体运维难题的“内部Ops专家”。

〇分享收益〇

目标：

1、帮助企业洞悉大模型后训练打造私有领域的Agent数字员工

2、了解大模型后训练的在AI Ops中的常应用见场景实践

成功要点:

1、混合架构是基石：成功的关键是打造RAG与后训练协同工作的混合架构，让Agent既有专家的思考能力，又有实时的知识储备。

2、分层训练是核心：必须像培养专家一样，通过SFT、Agent RL等分层训练，系统性地提升Agent从“会说”到“会做”的综合能力。

3、高质量数据是命脉：后训练的成败直接取决于高质量、贴近场景的数据，“一份好的故障报告远胜万行随意日志”是我们的核心准则。

启示：

大模型在AI Ops领域的应用正从“对话式工具”向“自主决策智能体”深度演进。后训练正是驱动这一演进的关键引擎，它实现了知识的规模化传承，通过将资深专家的宝贵经验固化到模型内部，最终为企业打造出不知疲倦、永不离职的“数字员工”，从根本上重塑企业的运维生产力。

〇分享亮点〇

1、为什么Agent需要后训练微调

2、 RAG和后训练微调的区别和抉择

3、后训练微调的基础理论

4、后训练微调在Agent领域的应用路线

5、趣丸科技AI Ops Agent后训练的落地

6、 AI Ops Agent的最终目标

7、 QA

日程嘉宾

趣丸科技 AI应用开发工程师，主导趣丸科技面向智能运维(AIOps)场景的高效AI Agent探索与开发。核心工作是覆盖从模型后训练、RAG优化、Agent设计的AI应用全链路开发。

曾在技术比赛中，获得第二届开放原子大赛 (Teco-RAG)个人冠军、2025开放原子大模型科研工具创新赛团队亚军 (队长)、2024上海交大跨境电商AI全球挑战赛团队亚军 (队长)；也活跃在开源贡献中: dify, langchain, esay-dataset 等项目Contributor。