Agents 重构金融 FICC 策略全生命周期管理平台
我们的 FICC 业务 2025 年日均成交 1100 亿人民币,日均订单 30 万笔、98% 由策略下单。在这种规模下,"AI 该在哪里、不该在哪里" 比 "AI 能做什么" 重要得多。
去年我们用"玻璃箱 + 无侵入"跑通了第一代,今年遇到的新问题是:模型变强之后,那些精心设计的多层编排脚手架(LangGraph、CrewAI、n8n)反而开始拖更强模型的后腿。"让 Agent 跑起来"已经不够,得回答"让 Agent 越用越强"。
这次分享讲我们的答案:双区架构 + 玻璃箱 v2——研发分析区让 Agent 自由进化、交易核心链路保持确定性、用回测和上线流程做桥、旁路 AI 给实时辅助。在这个边界上,我们用开源 Hermes 替掉 n8n、按 Karpathy 的 Autoresearch 范式让 Agent 在回测里自己进化、用一套金融原生 Generative UI 让一句自然语言变成一份图文并茂的分析报告。
这不是又一个"在金融用了 AI"的故事,是 Agentic AI 在金融真正能上线、能进化、能落地的形态。
演讲提纲:
一、为什么要做第二代
第一代解决的是"AI 在金融能不能用",今年我们要解决的是"AI 在金融能不能越用越强"。这一节快速过一遍业务规模、第一代的底座(玻璃箱+无侵入),讲清楚 v2 要回答的三个新问题——为什么编排要变薄、为什么 Agent 要会自进化、为什么 AI 的产出可以图文并茂。
二、双区架构:AI 该在哪里、不该在哪里
AI 在金融机构落地的核心不是模型选型,是边界划分:研发分析区让 AI 自由进化、交易核心链路保持确定性、用回测+上线流程做唯一的桥、用旁路 AI 提供实时辅助(小泰询报价、盘中风险归因、盘后自动复盘)。
这一节也会回答一个看似矛盾的问题:玻璃箱要求"全程可控",模型变强又要求"少管它"——怎么调和?答案是玻璃箱 v2:管边界,不管步骤。
三、三板斧:轻编排、自进化、生成式 UI
从 n8n 换到开源 Hermes——为什么节点图式编排反而让强模型变笨(这点最近的 In-Context Prompting 论文有实证),以及我们"开源优先 + 严格审计 + 分支管理"的工程哲学:把精力花在业务上,不在重复造轮子上。
Autoresearch 在金融的工程现实——Karpathy 提的"可验证指标驱动 Agent 自进化",在金融比在任何行业都更可行,因为回测就是天然的 ground truth。会讲我们怎么定指标、进化什么、不进化什么(划重点:不动模型权重),以及怎么用影子运行 + 人工采纳兜底。现场演示同一个回测任务,新版 Agent 比旧版强了多少。
金融原生 Generative UI——通用 Generative UI 给的是通用图表,金融分析要的是 K 线、收益率曲线、回撤、归因瀑布、IC 热力图。一套领域专用组件库 + Agent 自主编排,让一句自然语言变成一份图文并茂的专业分析报告。
四、几条工程心得
走完这一程,想留给同行五句话——划边界比选模型重要;玻璃箱 v2 管边界不管步骤;可验证指标是自进化的命根子;开源 + 审计比全自研更成熟;进化只在 prompt、skill、路由这一层,不动模型权重。
落地痛点:
指标设计比想象中难。工程层指标容易拿,业务层指标(如样本外 Sharpe)受数据集、口径、时间窗影响极大,没有标准化的可验证数据集,自进化的"提升"很容易就是过拟合的假象。
人工采纳是隐形税。要兜住自进化的失控风险必须有 Owner 把关,但 Owner 的时间成本反过来又会吃掉 Autoresearch 的效率红利。这个平衡点不好找。
开源治理远比想象中重。开源优先省下了造轮子的成本,但每一个开源依赖都要走 fork、审计、合规、跟踪上游——这对团队的工程纪律要求远高于纯自研。
双区架构的边界容易松。任何一次"为了快速上线"而松动边界的尝试,都可能成为日后系统性风险的源头。这件事必须靠工程刚性手段守护,不能只靠流程约定。
生成式 UI 里的领域真实性。LLM 在通用 Generative UI 里很炫,但在金融里,涨跌色、年化口径、报告骨架都不能让它即兴发挥——怎么让组件层守住金融惯例、又不限制 Agent 的创造力,是一个需要长期打磨的事。
前沿亮点:
双区架构——明确划出 AI 在金融机构的边界。这套形态可被其他高合规行业(医疗、法律、监管型行业)借鉴。
玻璃箱 v2——从"管每一步"演进到"管边界、放自主",呼应 In-Context Prompting 论文的结论,是模型变强之后必然要走的一步。
开源 Hermes 替掉 n8n/langchain——配合"开源优先 + 严格审计 + 分支管理",给大型机构提供了"既要社区红利又要合规"的工程范式,而不是简单陷入"全自研"的工程债。
金融可上线的 Autoresearch——把 Karpathy 的范式落地到生产环境,明确划出"只动 prompt、skill、路由,不动模型权重"的工程边界,可上线、可回退、可审计。
金融原生 Generative UI——让一句自然语言变成一份图文并茂的专业分析报告,组件层守住领域惯例,Agent 在约束内自主组合。
听众收益点:
一套在严肃行业落地 Agentic AI 的工程范式(双区架构 + 玻璃箱 v2),不只在金融适用。
模型变强之后架构该怎么走——不是"更复杂",是"更轻、更自主、边界更清晰"。
一份金融级的自进化实践方案——可上线、可回退、可审计。
一种"开源 + 审计"的工程哲学,给大型机构推动 AI 现代化一条参照路径。
20 年金融科技一线,做过三套电子交易平台。
2019 年,作为项目经理与核心开发,交付平安证券"领航 (FLEET) 固收外汇电子做市交易系统",获深圳市金融创新奖一等奖。
2022 年,作为交易平台架构负责人,参与交付华泰证券"大象 FICC 多资产做市与风控平台",获人民银行金融科技发展奖一等奖。
现负责华泰"AI+AURORA 策略管理平台"——把 AI Agents 嵌进多资产策略的全生命周期。