返回上一页 > 专题演讲嘉宾(排名不分先后)
Agentic AI Summit 超级智能体系统架构峰会·深圳站
陈治平
华泰证券 固定收益部 策略管理团队负责人

20 年金融科技一线,做过三套电子交易平台。

2019 年,作为项目经理与核心开发,交付平安证券"领航 (FLEET) 固收外汇电子做市交易系统",获深圳市金融创新奖一等奖。

2022 年,作为交易平台架构负责人,参与交付华泰证券"大象 FICC 多资产做市与风控平台",获人民银行金融科技发展奖一等奖。

现负责华泰"AI+AURORA 策略管理平台"——把 AI Agents 嵌进多资产策略的全生命周期。

嘉宾日程:

Agents 重构金融 FICC 策略全生命周期管理平台

#金融场景Agent实践(出品人:知鸟CTO 沈菁)

我们的 FICC 业务 2025 年日均成交 1100 亿人民币,日均订单 30 万笔、98% 由策略下单。在这种规模下,"AI 该在哪里、不该在哪里" 比 "AI 能做什么" 重要得多。


去年我们用"玻璃箱 + 无侵入"跑通了第一代,今年遇到的新问题是:模型变强之后,那些精心设计的多层编排脚手架(LangGraph、CrewAI、n8n)反而开始拖更强模型的后腿。"让 Agent 跑起来"已经不够,得回答"让 Agent 越用越强"。


这次分享讲我们的答案:双区架构 + 玻璃箱 v2——研发分析区让 Agent 自由进化、交易核心链路保持确定性、用回测和上线流程做桥、旁路 AI 给实时辅助。在这个边界上,我们用开源 Hermes 替掉 n8n、按 Karpathy 的 Autoresearch 范式让 Agent 在回测里自己进化、用一套金融原生 Generative UI 让一句自然语言变成一份图文并茂的分析报告。


这不是又一个"在金融用了 AI"的故事,是 Agentic AI 在金融真正能上线、能进化、能落地的形态。


演讲提纲:

一、为什么要做第二代

第一代解决的是"AI 在金融能不能用",今年我们要解决的是"AI 在金融能不能越用越强"。这一节快速过一遍业务规模、第一代的底座(玻璃箱+无侵入),讲清楚 v2 要回答的三个新问题——为什么编排要变薄、为什么 Agent 要会自进化、为什么 AI 的产出可以图文并茂。

二、双区架构:AI 该在哪里、不该在哪里

AI 在金融机构落地的核心不是模型选型,是边界划分:研发分析区让 AI 自由进化、交易核心链路保持确定性、用回测+上线流程做唯一的桥、用旁路 AI 提供实时辅助(小泰询报价、盘中风险归因、盘后自动复盘)。

这一节也会回答一个看似矛盾的问题:玻璃箱要求"全程可控",模型变强又要求"少管它"——怎么调和?答案是玻璃箱 v2:管边界,不管步骤。

三、三板斧:轻编排、自进化、生成式 UI

从 n8n 换到开源 Hermes——为什么节点图式编排反而让强模型变笨(这点最近的 In-Context Prompting 论文有实证),以及我们"开源优先 + 严格审计 + 分支管理"的工程哲学:把精力花在业务上,不在重复造轮子上。

Autoresearch 在金融的工程现实——Karpathy 提的"可验证指标驱动 Agent 自进化",在金融比在任何行业都更可行,因为回测就是天然的 ground truth。会讲我们怎么定指标、进化什么、不进化什么(划重点:不动模型权重),以及怎么用影子运行 + 人工采纳兜底。现场演示同一个回测任务,新版 Agent 比旧版强了多少。

金融原生 Generative UI——通用 Generative UI 给的是通用图表,金融分析要的是 K 线、收益率曲线、回撤、归因瀑布、IC 热力图。一套领域专用组件库 + Agent 自主编排,让一句自然语言变成一份图文并茂的专业分析报告。

四、几条工程心得

走完这一程,想留给同行五句话——划边界比选模型重要;玻璃箱 v2 管边界不管步骤;可验证指标是自进化的命根子;开源 + 审计比全自研更成熟;进化只在 prompt、skill、路由这一层,不动模型权重。


落地痛点:

指标设计比想象中难。工程层指标容易拿,业务层指标(如样本外 Sharpe)受数据集、口径、时间窗影响极大,没有标准化的可验证数据集,自进化的"提升"很容易就是过拟合的假象。

人工采纳是隐形税。要兜住自进化的失控风险必须有 Owner 把关,但 Owner 的时间成本反过来又会吃掉 Autoresearch 的效率红利。这个平衡点不好找。

开源治理远比想象中重。开源优先省下了造轮子的成本,但每一个开源依赖都要走 fork、审计、合规、跟踪上游——这对团队的工程纪律要求远高于纯自研。

双区架构的边界容易松。任何一次"为了快速上线"而松动边界的尝试,都可能成为日后系统性风险的源头。这件事必须靠工程刚性手段守护,不能只靠流程约定。

生成式 UI 里的领域真实性。LLM 在通用 Generative UI 里很炫,但在金融里,涨跌色、年化口径、报告骨架都不能让它即兴发挥——怎么让组件层守住金融惯例、又不限制 Agent 的创造力,是一个需要长期打磨的事。


前沿亮点:

双区架构——明确划出 AI 在金融机构的边界。这套形态可被其他高合规行业(医疗、法律、监管型行业)借鉴。

玻璃箱 v2——从"管每一步"演进到"管边界、放自主",呼应 In-Context Prompting 论文的结论,是模型变强之后必然要走的一步。

开源 Hermes 替掉 n8n/langchain——配合"开源优先 + 严格审计 + 分支管理",给大型机构提供了"既要社区红利又要合规"的工程范式,而不是简单陷入"全自研"的工程债。

金融可上线的 Autoresearch——把 Karpathy 的范式落地到生产环境,明确划出"只动 prompt、skill、路由,不动模型权重"的工程边界,可上线、可回退、可审计。

金融原生 Generative UI——让一句自然语言变成一份图文并茂的专业分析报告,组件层守住领域惯例,Agent 在约束内自主组合。


听众收益点:

一套在严肃行业落地 Agentic AI 的工程范式(双区架构 + 玻璃箱 v2),不只在金融适用。

模型变强之后架构该怎么走——不是"更复杂",是"更轻、更自主、边界更清晰"。

一份金融级的自进化实践方案——可上线、可回退、可审计。

一种"开源 + 审计"的工程哲学,给大型机构推动 AI 现代化一条参照路径。

07 月 24 日 16:55 - 17:40