一直以来,开源框架 TEN Framework 致力于帮助开发者高效搭建语音 AI Agent,降低从想法到应用的门槛,为诸多人与 AI 间实时互动的应用场景奠定基础。
TEN Framework 在持续迭代更新功能,提供更具针对性和实用性的解决方案,帮助开发者打造能投入实际生产的 Voice Agent。无论是语音转录、实时翻译、虚拟数字人,让语音 AI 不止于 Demo,而是走向真实应用场景!
为了让大家更深入地体验和掌握 TEN Framework 在实际应用中的强大能力,在这次工作坊中,我们将带你动手实践:从基础能力到应用落地,基于 TEN Framework 一步步做出完整的 Voice Agent usecase。无论你是刚入门语音交互,还是希望探索更实用的 AI 应用场景,都能在这里收获灵感与技巧,探索语音 AI 在实际应用中的无限可能!
现场会设置双重挑战,无论你是想了解 Voice Agent 框架还是深度开发,这里都有适合你的内容。来自 TEN Framework 团队的技术导师会在现场为大家答疑,同时完成挑战的伙伴都能拿走我们的开发者周边!即刻报名!
时间:2025 年 11 月 1 日(周六)14:00-17:00
地点:北京朝阳悠唐皇冠假日酒店 · 多瑙厅
01 <现场指北针>
13:30-14:00签到
14:10-15:00 技术大咖主题分享
主题分享 1
TEN 开源框架及 usecase 快速上手
嘉宾:Elliot Chen,TEN 框架布道师及主创之一,推特 13K 博主,专注于提升 TEN 框架的易用性和布道对话式 AI
主题分享 2
TEN VAD & Turn Detection 带来更似真人的对话体验
嘉宾:Ziyi,TEN VAD 核心开发者;Darcula,TEN Turn Detection 作者
- TEN Framework 是一个主流对话式 AI 开源框架,用于构建具备低延迟、多模态的 Voice AI Agent。TEN Framework 支持多模态与端到端模型,满足语音、文本和图像的输入与输出,目前已集成主流 STT、LLM、TTS、RTC、RAG 等多种模型及组件,同时适配 Dify、Coze 主流编排工具,内置优化后的实时通信能力,提供低延时、可打断的交互体验,快速让你的 AI bot 能听能说。
- TEN VAD 是低延迟,低功耗,高准确率的语音活动检测 AI 模型,能够准确检测音频帧中是否存在人声。作为对话式 AI 的核心原子能力,TEN VAD显著提升语音处理速度,并具有远低于其他 VAD 模型的 RTF,模型轻量。
- TEN Turn Detection 是一款具备情境感知能力的智能对话轮次管理模型。它解决了人机对话中的关键挑战:准确判断用户何时结束发言,从而让 AI 适时地倾听或回应,实现自然流畅的对话交替。