返回上一页 > 日程安排

大模型后训练在智能运维Agent 上的应用

时间: 09 月 14 日 15:40 - 16:30
内容介绍:

〇 分享简介 〇

现代IT系统复杂度飙升,运维团队不仅深陷于海量数据带来的“认知债”,更面临着通用大模型缺乏企业内部知识、无法有效执行具体运维任务的现实鸿沟。

面对此困境,我们的答案并非在“外挂知识(RAG)”与“模型训练(微调)”间摇摆,而是打造混合架构,兼取两者之长。企业更核心的贡献是提出了一套体系化的 Agent后训练方法论,通过监督微调(SFT)为其注入专业技能,再以专家偏好对齐(如DPO)塑造其思维,最终确保大模型在AI Ops场景中行之有效。

本次分享将系统阐述后训练为核心技术,通过后训练大幅度提高运维Agent的效率和执行成功率,将一个通用大模型,锻造成一个真正能理解并解决企业具体运维难题的“内部Ops专家”。

〇 分享收益 〇

目标:

1、帮助企业洞悉大模型后训练打造私有领域的Agent数字员工

2、了解大模型后训练的在AI Ops中的常应用见场景实践

成功要点:

1、混合架构是基石:成功的关键是打造RAG与后训练协同工作的混合架构,让Agent既有专家的思考能力,又有实时的知识储备。

2、分层训练是核心:必须像培养专家一样,通过SFT、Agent RL等分层训练,系统性地提升Agent从“会说”到“会做”的综合能力。

3、高质量数据是命脉:后训练的成败直接取决于高质量、贴近场景的数据,“一份好的故障报告远胜万行随意日志”是我们的核心准则。

启示:

大模型在AI Ops领域的应用正从“对话式工具”向“自主决策智能体”深度演进。后训练正是驱动这一演进的关键引擎,它实现了知识的规模化传承,通过将资深专家的宝贵经验固化到模型内部,最终为企业打造出不知疲倦、永不离职的“数字员工”,从根本上重塑企业的运维生产力。

〇 分享亮点 〇

1、 为什么Agent需要后训练微调

2、 RAG和后训练微调的区别和抉择

3、 后训练微调的基础理论

4、 后训练微调在Agent领域的应用路线

5、 趣丸科技AI Ops Agent后训练的落地

6、 AI Ops Agent的最终目标

7、 QA

日程嘉宾
2025中国软件研发创新科技峰会
莫岳恒
趣丸科技 AI应用开发工程师

趣丸科技 AI应用开发工程师 ,主导趣丸科技面向智能运维(AIOps)场景的高效AI Agent探索与开发。核心工作是覆盖从模型后训练、RAG优化、Agent设计的AI应用全链路开发。

曾在技术比赛中,获得第二届开放原子大赛 (Teco-RAG)个人冠军、2025开放原子大模型科研工具创新赛团队亚军 (队长)、2024上海交大跨境电商AI全球挑战赛团队亚军 (队长);也活跃在开源贡献中: dify, langchain, esay-dataset 等项目Contributor。