趣丸科技 AI应用开发工程师 ,主导趣丸科技面向智能运维(AIOps)场景的高效AI Agent探索与开发。核心工作是覆盖从模型后训练、RAG优化、Agent设计的AI应用全链路开发。
曾在技术比赛中,获得第二届开放原子大赛 (Teco-RAG)个人冠军、2025开放原子大模型科研工具创新赛团队亚军 (队长)、2024上海交大跨境电商AI全球挑战赛团队亚军 (队长);也活跃在开源贡献中: dify, langchain, esay-dataset 等项目Contributor。
大模型后训练在智能运维Agent 上的应用
〇 分享简介 〇
现代IT系统复杂度飙升,运维团队不仅深陷于海量数据带来的“认知债”,更面临着通用大模型缺乏企业内部知识、无法有效执行具体运维任务的现实鸿沟。
面对此困境,我们的答案并非在“外挂知识(RAG)”与“模型训练(微调)”间摇摆,而是打造混合架构,兼取两者之长。企业更核心的贡献是提出了一套体系化的 Agent后训练方法论,通过监督微调(SFT)为其注入专业技能,再以专家偏好对齐(如DPO)塑造其思维,最终确保大模型在AI Ops场景中行之有效。
本次分享将系统阐述后训练为核心技术,通过后训练大幅度提高运维Agent的效率和执行成功率,将一个通用大模型,锻造成一个真正能理解并解决企业具体运维难题的“内部Ops专家”。
〇 分享收益 〇
目标:
1、帮助企业洞悉大模型后训练打造私有领域的Agent数字员工
2、了解大模型后训练的在AI Ops中的常应用见场景实践
成功要点:
1、混合架构是基石:成功的关键是打造RAG与后训练协同工作的混合架构,让Agent既有专家的思考能力,又有实时的知识储备。
2、分层训练是核心:必须像培养专家一样,通过SFT、Agent RL等分层训练,系统性地提升Agent从“会说”到“会做”的综合能力。
3、高质量数据是命脉:后训练的成败直接取决于高质量、贴近场景的数据,“一份好的故障报告远胜万行随意日志”是我们的核心准则。
启示:
大模型在AI Ops领域的应用正从“对话式工具”向“自主决策智能体”深度演进。后训练正是驱动这一演进的关键引擎,它实现了知识的规模化传承,通过将资深专家的宝贵经验固化到模型内部,最终为企业打造出不知疲倦、永不离职的“数字员工”,从根本上重塑企业的运维生产力。
〇 分享亮点 〇
1、 为什么Agent需要后训练微调
2、 RAG和后训练微调的区别和抉择
3、 后训练微调的基础理论
4、 后训练微调在Agent领域的应用路线
5、 趣丸科技AI Ops Agent后训练的落地
6、 AI Ops Agent的最终目标
7、 QA
