度小满金融技术委员会执行主席、数据智能应用部总经理,度小满AI Lab负责人,硕士毕业于清华大学计算机系,曾就职于百度、阿里巴巴,从事自然语言处理、搜索、推荐、大数据架构等相关方向的研发工作。
2018年年初加入度小满金融,组建数据智能部和AI Lab团队,从0到1构建度小满金融的智能引擎核心算法,深耕计算机视觉、自然语言处理、图模型、机器学习、因果推断等技术领域,多篇文章被EMNLP、ACL、CIKM等国际会议收录,“智能化征信解读中台”工程荣获吴文俊人工智能科技进步奖。相关技术广泛应用于度小满营销、经营、风控、反欺诈全流程业务场景,为上千万客户提供稳定、安全的金融服务。
专注于人工智能在金融场景中的应用落地工作,基于度小满模型即服务(MaaS)的模式探积极探索生成式大语言模型的应用转化。于2023年初带领团队发布千亿参数规模的中文大语言模型“轩辕”。2023年9月, “轩辕-70B”大语言模型在C-Eval和CMMLU两大权威榜单上位列所有开源模型榜首,已开源6B/13B/70B/176B全参数的模型体系,著有<<大语言模型:原理与工程实践>>
基于llama3的领域模型落地实践
〇 分享简介 〇
开源大模型打破了技术壁垒,使得各行各业能够轻松获取并应用先进的AI技术,有效降低了技术研发成本,加速了大模型科技的普及。开源模型促进了跨界合作,比如金融机构得以与科技公司、研究机构等携手,共同探索适用于金融领域的定制化模型,推动服务创新。
基于我们的成熟的实践经验,开源大模型是企业数字化转型的重要驱动力之一。特别对于金融行业,通过引入开源模型,金融机构可以加速构建数字化、智能化的金融服务体系,提升金融服务的便捷性和普惠性。这有助于金融机构更好地满足用户需求,提升企业市场竞争力。
本次分享“基于LLaMA3的领域模型落地实践点”为主题,深入探讨LLaMA3大型语言模型在特定领域的落地应用策略,同时分析开源大模型的发展趋势,并揭示企业在场景化应用大模型过程中面临的挑战与解决方案。
〇 分享收益 〇
目标:
1、通过开源大模型发展历程,以及企业场景相关特点,分享相应领域大模型的选择方案
2、详细分享基于llama3的优化及适配方案
3、详细分享基于大模型整体工程实践方案(RAG,Agent等等)
4、以金融行业为例,分享如何赋能行业与应用
成功要点:
基于llama3进行的二次预训练,并通过场景相关的SFT,强化对齐等技术,达到Sota的中文效果,同时配合RAG和Agent等相关技术,落地于企业相关应用。
启示:
从成本,私有化,以及效果等角度综合考虑,基于开源大模型的领域适配是企业应用大模型的最优方案
〇 分享亮点 〇
1、开源崛起:大模型普惠时代来临
2、领域模型构建:融合开源优势,打造行业智能引擎
3、领域模型落地:从Llama3到行业解决方案
4、领域模型价值创造:赋能、创新与变革金融行业
5、度小满轩辕大模型:跨越认知,走向AGI
