使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
江苏人工智能大会由江苏省人工智能学会(JSAI)于 2018 年创办,每年一届,历经七载沉淀,已成长为江苏省人工智能领域规格最高、规模最大、影响力最深远的行业盛会。为抢抓人工智能与数字经济融合发展的战略机遇,全面展现江苏在人工智能领域的学术研究突破与科技创新成果,加速汇聚全球顶尖创新资源、高端人才与产业要素,推动产学研用深度融合,助力江苏人工智能科技进步与产业高质量发展,奋力打造全国人工智能产业发展新高地,第八届江苏人工智能大会(JSAI2025) 定于12 月 26 日 —27日在南京紫金山庄紫金会议中心隆重举办。诚邀学会全体会员、各相关企事业单位、广大科技工作者踊跃报名参会,齐聚金陵,共赴这场人工智能领域的年度盛宴,共话前沿趋势,共商发展大计,共创美好未来!
大会日程持续更新中......
常州信息职业技术学院工程中心主任
主持人开场 ,领导致辞
平台发布
现场发布“AI陪伴机器人产业赋能平台”及全栈式软硬件解决方案
产品联合发布/签约
与合作方就首批智能陪伴产品现场签约并联合发布(红山动物园、六朝博物馆、南京市中国电信、玄武湖景区)
嘉宾分享
智能陪伴机器人主题进行现场分享
欢迎致辞
主旨报告
刘斌,中国科学院工业人工智能研究所
2025年度江苏省工业软件优秀产品和应用解决方案颁奖
AI大模型赋能数字化建设
徐诺凡,南京国睿信维软件有限公司
CAD技术赋能打造新质生产力
王永红,苏州浩辰软件有限公司
AI赋能船舶仿真试验
李锋,中国船舶集团有限公司第七〇二研究所
人工智能背景下的嵌入式实时操作系统发展探索
李拓,南京翼辉信息技术有限公司
AI服务客户案例
杨爱玲,江苏金恒信息科技股份有限公司
活动开场、主办单位致辞
AI+:企业内的CBT和市场中的OPC
市重点培育企业人工智能创新产品发布
1.南京鸢尾蓝网络科技有限公司
2.南京和度软件科技有限公司
金融产品推介
1.南京紫金投资集团“紫金伴行计划”
2.紫金农商银行定制化产品
3.中信银行南京分行科技金融服务方案
市创新投资集团产业基金集群介绍及重点合作项目签约
围绕金融赋能人工智能产业发展,特别聚焦培育壮大AI产业OPC 模式,开展交流对话
标委会工作会议
AI for Science时代科研新范式的探索和思考
AI for Science时代科研范式变革趋势
AI引领科研范式变革的探索
推进AI引领科研范式变革的路径与思考
全链条人工智能驱动新型铁电材料研发
国家科技部、工信部、发改委相继发出AI赋能科研和行业的指南文件,苏州国家实验室积极布局探索在国家战略性材料研究中引入全链条AI驱动技术,包括AI材料计算、AI工艺优化、AI材料生长设备、AI材料垂域大模型、AI材料专家智能体、AI标准化数据库、AI材料研发平台等探索示范内容。本报告将介绍国家实验室在信息材料第一个高技术重大项目新型铁电材料研究项目中,在上述几个方面探索全链条AI驱动的现状,和国际AI驱动材料研究的对比,以及和国家头部企业合作推进的进展情况。希望和全国头部单位一起,共同推进国家AI驱动科学研究和产业化。
标准研讨会
第二届智能交通专委会换届选举会
公路交通安全隐患防治新技术、新实践
传统公路安全隐患监测技术存在局限性,如:检测距离普遍小于150米,极易受到恶劣气象、树木等外界干扰,测量度高受限严重,设备成本较高,需要进一步提高检测精度、降低投资。华路易云牵头组织“十四五”国家重点研发计划项目 “智能传感器”重点专项,打破国外垄断,研制国产芯片的4D成像毫米波雷达,在距离、方位、速度基础上 ,增加 俯仰角(成像)信息,提高了智驾安全性与可靠性。4D成像毫米波雷达感知器关键技术及产业化。报告内容包括:公路重大安全隐患检测新技术系统架构、新技术新产品的适用领域等内容。
AI赋能空地一体智能交通高质量发展
城市地面交通拥堵常态化、安全事故、效率低下;低空交通空域管理部门多、飞行器种类多,协同困难、安全标准不统一。核心痛点:低空及地面交通系统孤立运行,缺乏协同。通过打造“空地一体智能交通管理系统”,构建一个涵盖地面与低空多层次、多维度的立体化交通体系,实现各类交通方式之间信息实时共享、资源高效调配、运行无缝衔接,从而提升整体交通运行效率、增强交通系统韧性。
交通气象发展中的科技创新
从“交通气象的需求与发展、智能化技术在交通气象中的创新与应用、未来发展趋势”三个方面,讲解交通气象发展的历史脉络、全球和中国以及江苏交通气象的现状和实际需求;同时结合自身经验,从实践角度出发,通过十来个典型技术创新和应用场景实例,介绍近年来新技术尤其是人工智能技术在交通气象发展中的应用与创新情况;最后,结合多年工作经验和自身思考,提出未来交通气象新技术新场景的发展趋势。
空中交通管理智能化运行技术与实践
空中交通日益繁忙,面临安全与效率方面的挑战,尤其是低空经济的发展,对空中交通管理的智能化提出迫切需求。智能化技术、大模型技术等赋能空中交通管理体系,是保障航空产业健康发展的重要支撑。报告着重分析智能化技术以及大模型赋能空中交通管理的技术需求、能力需求与关键技术难点。并介绍空中交通管理系统全国重点实验室、莱斯信息在空管大模型技术与系统方面的实践经验与基础,以及未来展望。
人工智能在公路领域的应用
从AI+交通运输的前言背景、示范应用及未来发展趋势三个专题展开探讨,并建议逐步细化AI场景,深化数据挖掘及知识体系构建,统筹布局、分步实施,为行业数智化转型提供实践参考。
领导致辞
Visual Generation: Diffusion Models and Controllable Human Video Generation
本报告主要介绍两个方面的工作。一个是,通过中间监督来提升扩散模型的训练效率,与REPA相关,不依赖外部模型,可用性更强。另一个是,可控人像视频生成,包括第一个小时级的以及第一个基于视频生成预训练模型的语音驱动的人像视频生成。
图像恢复:从像素恢复到特征增强
得益于深度网络强大的学习能力,现有图像恢复技术在图像恢复性能及实时性方面取得巨大进展,但仍面临着实际应用泛化性不足、计算复杂度高等难题。围绕图像恢复实际应用面临的难题,提出面向实际应用场景的轻量化图像视频恢复方法,参数化图像模糊核先验学习,生成式先验图像超分辨重建方法。针对图像退化导致图像识别等下游任务性能急剧下降的问题,提出基于信息熵的图像特征增强和对抗训练的低质量图像识别方法。
视频多模态人工智能与应用实践
视频多模态人工智能已成为推动智能感知与决策系统发展的重要基础,是人工智能赋能多领域数字化转型的关键支撑技术。本报告聚焦多模态视频理解与分析的前沿进展,系统梳理视频内容智能分析技术在观测视角层面的演进脉络与方法范式。报告将首先探讨第三视角视频分析在长视频理解与弱监督学习条件下面临的核心挑战,介绍视频内容检索与事件定位等关键技术;其次聚焦以人为中心的第一视角视频理解,阐述其在刻画复杂操作流程和程序性语义推理方面的研究进展;接着报告将结合多模态大模型的发展趋势,分析第一视角视频智能分析中由预训练先验与推理偏置引发的新问题,并概述相应的解决思路;最后报告进一步展望多模态视频智能分析在智能制造、城市治理等产业领域中的应用实践与发展潜力,探讨相关技术向实际系统落地过程中所面临的机遇与挑战。
InternVideo:通用视频理解大模型体系
视频理解已经成为人工智能领域现阶段核心难题,面临着数据维度高、信息容量大、场景变化多等诸多技术挑战,如何构建通用视频理解大模型已经成为一项极具挑战的任务。本报告将介绍通用书生视频大模型体系InternVideo的发展历程:2022年发布首个通用视频理解基础模型InternVideo1.0,构建了可泛化的视频基础表征能力,全面覆盖视频识别、开放感知、时空解析三大核心领域;2024年发布多模态视频理解大模型InternVideo2.0,在InternVideo1.0 基础上新增了多模态视频理解与对话能力,在识别检索、开放问答、高阶推理等复杂视频理解任务取得了国际领先性能;2025年发布全新升级版本InternVideo2.5,在复杂视频理解的时间跨度与细粒度取得了双维度提升,具备万帧长视频中精准“大海捞针”能力。本报告还将介绍围绕通用视频理解构建的系列评测基准:短视频理解评测基准MVBench,流视频理解评测基准OVBench,长视频线索推断评测基准CGBench,叙事视频推理评测基准VRBench。最后将展望视频大模型发展趋势。
脑网络拓扑深度挖掘方法研究
脑网络智能分析是解码脑功能机制、辅助脑疾病诊断的关键技术,但其发展受时空拓扑动态性、多模态数据异质性及多中心隐私保护等挑战制约。针对时空拓扑挖掘难题,提出基于最优传输的动态拓扑描述方法,捕捉脑网络随时间演化的关键特征及脑区交互模式。针对多模态融合挑战,构建跨模态特征对齐与自适应融合框架,有效整合不同模态脑影像数据的互补信息,提升脑疾病诊断的表现。针对多中心分析的隐私保护需求,设计基于联邦学习的分布式脑网络分析方法,在保障患者隐私安全的前提下,融合多中心数据提升模型的泛化能力。相关方法为脑网络智能分析的实际应用转化提供关键技术支撑。
圆桌交流
领导致辞
基于多模态表征的图像和视频世界模型生成
当今,图像和视频生成是人工智能领域的热点和难点问题,尤其是背后隐含的交互式世界模型建模方式。本报告主要围绕数据驱动的人工智能学习方法,进行多模态高效生成、理解和表达等多维度视角进行了深入剖析。系统地回顾了多模态特征表达和学习领域的不同发展阶段,介绍了近年来我们利用特征学习进行视觉语义分析和理解生成所做的一系列代表性的研究工作及其实际应用。特别关注这些技术在构建视频生成驱动的可实时交互世界模拟器中的应用潜力。世界模拟器旨在通过生成符合物理规律的动态视频序列,模拟真实世界的演化过程,为决策、仿真和内容创作提供基础,这对生成模型的 高效性、可控性、时序一致性与物理合理性 提出了核心要求。报告的最后将和大家一起探讨一下涉及多模态视觉生成和理解所面临的一些开放性问题和难题。
教育智能体的构建与应用探索
近年来,以大模型为代表的生成式人工智能持续突破,通过融合智能体等方式极大拓展了机器的能力边界,知识生产和传授的主体从人类专家(如教师)主导转向人机协同模式,也带来了教育教学范式的新变化。本报告将围绕智能教育、智慧学习的实际需求,简要介绍本团队在教育智能体构建方面的初步探索,着重汇报相关工作在学习资源理解、学习行为模拟,学位论文辅助、中小学人工智能教育等场景的实践情况。
垂域大模型优化方法与应用
本报告主要围绕大模型如何构建可用、易用和通用的垂直领域大模型展开讨论,从通用的多种数据模态,包括图像、文本、语音等,探索单模态LLM技术,并在不同子任务下深入分析与挖掘单模态的特性与多模态间的关联性,基于此构建多模态综合模型。在上述研究基础上,通过对参数高效微调、知识迁移微调以及中文场景适配的研究,为垂域大模型构建提供多方面的模型优化策略。最后,针对不同垂域的知识,设计通用的垂域优化技术,包括构建垂域指令集并获取结构化知识、在垂域模型中设计单模态Agent以及基于MoE将多模态综合模型打造成垂域模型的多模态基座。通过分层次分阶段完成上述任务,介绍大模型在多个场景下,实现领域内赋能的应用示范。
信道图谱赋能的低空通信
低空通信网络作为低空经济发展的重要基础设施,是新一代信息通信网络的重要发展方向。信道图谱技术能够有效挖掘信道信息、通信环境和空间位置的内在联系,进一步提升低空通信信道信息获取的灵活性和准确性。得益于信道图谱固有的图形结构特征,以计算机视觉为代表的人工智能算法有望提升低空通信性能。本报告将针对低空信道图谱构建分辨率低、复杂度高等挑战,以人工智能为算法基础,介绍信道图谱赋能的低空通信传输方法,为AI+低空通信提供新的技术途径和解决方案。
从工具到同伴,AI技术跃迁与教育范式升级
AI时代,未来以来,人工智能技术实现从能听会说到能理解会思考的技术阶跃,全球大模型在快慢思考的模式下天花板不断被打开,国产自主可控人工智能技术快速发展,驱动教育范式和人才培养模式的升级。本报告介绍全球人工智能技术前沿进展与教育行业应用,教育范式升级的思考与探索,由科大讯飞高教事业部专家主讲汇报。
开幕式
领导致辞:陈松灿,江苏省人工智能学会理事长
领导致辞:冯少东,省科协党组成员、副主席、一级巡视员
启动仪式:全球校园人工智能算法精英大赛启动仪式(拟邀:周志华院士、陈松灿理事长、省委网信办、省科协、省发改、省教育、省科技、省工信厅等相关部门领导共同上台启动)
考虑算力影响的学习理论框架
茶歇
增强具身智能的迁移性与成长性
具身智能是连接物质世界与精神世界的桥梁和工程路径,已经成为探索智能和智能应用的重要手段。同时,在具身智能研究中存在实体种类繁多、任务高度相关等困难,因此往往呈现出依赖性、专用化的特征,制约了这一领域的发展。如何具备跨实体的迁移性和跨任务的成长性是突破上述桎梏的关键。围绕上述问题进行探索,我们提出通过分层的任务分解以及语言和具身实体适配等实现迁移性、通过持续学习增强成长性等思想。报告中给出了我们近期一些相关工作对这些想法可行性的探索及其结果。在此基础上,梳理了未来值得关注的问题和发展方向。
多媒体自主智能
跨媒体智能是新一代人工智能的重要组成部分,多媒体表征是跨媒体智能分析的共性基础。传统学习范式基于同分布假设,虽然在众多领域都取得了成功,但难以适应动态开放环境下多媒体数据分布动态变化带来的巨大挑战。本报告首先针对动态开放环境下数据-模型-任务的关联复杂性以及机器-环境的交互复杂性两个重大难题,提出自主机器学习理论框架与方法体系,构建自主优化与自主演化理论模型。进一步,介绍多媒体自主智能,包括多媒体数据自选择、模型自适应、任务自切换的自主优化,以及多媒体表征模型架构的自主演化等最新进展。最后,探讨多媒体具身智能学术前沿,介绍自主具身智能及相关研究工作,并指出未来研究方向。
特征解耦驱动的跨模态视觉生成
当前,跨模态视觉生成方法普遍面临特征耦合的共性挑战,导致生成过程可控性弱、内容精准度低。特征解耦将原始数据中混杂的特征分解为相关性低且具有明确语义的潜在特征,为实现精准可控的视觉生成提供了有效途径。本报告重点介绍针对跨模态生成过程构建的“语义对齐解耦-语义增补解耦-时空表征解耦”方法体系。首先,将跨模态输入中的耦合语义拆解至不同粒度的语义子空间,实现对象、属性、关系等多层次独立解耦生成;其次,在潜在表征空间中引入外部知识,增强表征解耦能力;最后,通过时-空表征解耦,实现运动过程与空间结构的独立控制与连贯生成。该体系为细节可控、高效灵活的跨模态视觉生成提供了系统化支撑。
迈向通用的人工智能:自主智能体的关键技术与挑战
2025年OpenAI o1和DeepSeek R1标志着大模型技术实现了从单词接龙的模仿式学习到强化学习的探索式学习的跃迁,使人工智能从学习固定数据的静态模型迈入开放动态环境的自主智能体。正如人类社会发展呈现出的个体专业化和合作规模化的鲜明趋势,我们认为人工智能也将迎来智能体专业化和规模化发展,以及多智能体智能涌现的发展态势,本报告将阐述大模型驱动的自主智能体发展的关键技术、趋势与挑战,展望即将迎来的以人机协同群体智能为标志的人工智能第二次涌现的愿景。
播放人工智能产业宣传视频,专业主持人开场
致辞环节
(1)南京市政府代市长李忠军致欢迎辞;
(2)工信部科技司杜广达副司长致辞;
(3)江苏省政府分管领导致辞。
发布环节
(1)江苏省关于“人工智能+”的行动方案
(2)江苏省关于加快人工智能终端产业发展的实施意见
(3)江苏省人工智能赋能新型工业化2026年工作清单
(4)南京市加快推进人工智能+软件产业发展实施方案
(5)江苏省新增大模型备案发布(10个)
(6)江苏省人工智能创新产品、人工智能应用解决方案、人工智能应用场景标杆项目等
启动环节
(1)南京人工智能应用中试基地(制造领域冶金方向)启动仪式
(2)中国信通院江苏人工智能创新平台启动仪式
(3)国家慢病多模态高质量数据集建设项目
(4)南京市支持OPC社区发展平台联盟启动
主旨报告
(1)中国科学院院士、南京大学副校长周志华,演讲主题:关于人工智能OPC的思考
(2)中国工程院院士、中国科学院工业人工智能研究所所长于海斌,演讲主题:人工智能全面赋能制造业发展
地市成果
(1)启动仪式
中国人工智能产业发展联盟与软件谷、河西中央科创区共同启动南京人工智能生态协同发展计划
重点园区园企合作揭牌
(2)南京人工智能生态街区、主要载体建设成果发布
(3)南京城市可信数据空间正式启动
专题演讲
(1)中国信通院人工智能所所长魏凯,演讲主题:人工智能产业发展研究报告2025(5分钟)
(2)阿里云智能集团战略发展副总裁明星,演讲主题:从“一个人”到“一个生态”——阿里巴巴为南京OPC社区注入AI创业新势能(10分钟)
(3)浩鲸云计算科技股份有限公司CTO肖正沧,演讲主题:鲸智百应:AI驱动的组织进化(10分钟)
(4)玄武大模型工厂首席运营官李强,演讲主题:大模型时代的AI产业生态(10分钟)
颁奖环节
(1)全球校园人工智能算法精英大赛产业赛道颁奖:
“工业人工智能”赛道颁奖(中科院工业人工智能研究所)
“人工智能+新材料”赛道颁奖(苏州实验室)
(2)2025全球青年智能体应用场景创新创业挑战赛总决赛颁奖
领导致辞
人机共生时代的AI认识安全
随着大语言模型与AI智能体技术的爆发式发展,人机共生的社会形态正在加速到来。在这一新兴范式中,AI系统不仅作为工具存在,更成为信息处理、知识生成与决策支持的核心环节,甚至在某些场景下已成为“第一信源”与“最近端决策点”。当人类认知过程与AI系统深度交织,我们面临前所未有的认知安全挑战:AI系统如何避免被恶意操控?人类如何保持认知自主性?如何构建健康的人机认知生态?本报告将探讨人机共生背景下的认知安全新范式,分析AI智能体的认知脆弱性与威胁模式,并思考技术、制度与伦理层面的应对策略,以期为这一新兴研究领域提供系统性思考框架。
从“心”思考普适场景中情感计算的问题、对策及应用
在人工智能与各领域融合的浪潮中,情感价值与陪伴经济迎来了新的发展机遇,众多心理健康应用、疗愈助手和智能陪伴机器人等都在引入情感计算技术,提升其情感分析能力与情感合成能力,优化人机交互体验。对于这种普适场景中的情感应用,传统情感计算模式在普适心理场景下暴露出局限性,面临着量大问题,就是真实场景的数据进不了实验室,而实验室的高精度模型出不了实验室。报告重新审视了情感计算中的相关问题,例如情感本身的特点,包括其在语言、语言、视觉等多模态通道上的不确定性、普适场景中情感计算的个性化和鲁棒性等等。在此基础上,提出了普适场景的情感分析的框架,并介绍了团队的几个探索性的工作。希望能够提升人工智能在情感理解、共情与心理干预方面的性能,推动情感计算技术在心理健康、智能交互等领域引发新的变革。
高质量基础时空数据+顺丰物流大模型,赋能城市数智化转型
在当今智能化浪潮中,如何真正让前沿技术落地,赋能千行百业?我们常面临三大核心拷问:第一,数据作为新生产要素,如何通过产学研政协同,构建既高质量又安全合规的驱动引擎?第二,垂直领域的大模型,如何跨越技术泛化性,深度理解行业知识与复杂时空规律?第三,单个智能应用如何演进为协同工作的“智能体集群”,系统化重塑业务场景?
本报告基于我们与顺丰科技集团等行业领军企业、苏州科技大学等地方高校的长期合作,以“昆山实践”为例,探索出“高质量数据集建设+垂域大模型+多智能体赋能”的协同创新模式。我们汇聚政企多源数据,通过系统性治理与标注,打造城市级时空高质量数据集;以此为基础,训练出深度理解物流、城市治理等知识的“丰知”垂域大模型;最终,我们构建了覆盖物流调度、应急指挥、产业优化等超50个场景的近千项智能服务,形成了多智能体协同赋能的应用生态。这一模式已结出硕果:在产业侧,为昆山大闸蟹、咖啡豆等特色产业降低物流成本20%;在政府端,显著提升了民生诉求响应与应急指挥的精度与效率。我们的实践证明,通过构建“政产学研用”协同的数据开发与价值闭环,能够切实推动数据要素价值释放,为产业降本增效、政府效能提升与城市现代化治理提供可复制、可推广的新范式。
从知识检索到认知增强:图、推理、记忆与决策
知识检索增强技术(RAG)已成为大语言模型优化的重要路径,通过引入外部知识源,显著缓解了模型的幻觉问题与知识更新滞后等挑战。当前,在大语言模型持续演进——包括更强大的基座模型、复杂推理能力的提升(如DeepSeek-R1),以及RAG技术本身的迭代(如GraphRAG、Agentic RAG等)的推动下,再结合知识图谱增强(KAG)及本体增强(OAG)的领域语义适配能力与记忆系统(MemOS)的认知级资源管理,RAG系统正逐步从基础问答向逻辑推理、多轮连贯对话和复杂决策支持等更高阶场景演进。
在这一融合进程中,RAG实现了多维度升级:从模糊匹配转向逻辑驱动的精准检索,从信息堆砌发展为逻辑自洽的答案生成,从单一问答任务扩展至系统性决策支持,并正在从被动的知识工具转变为具备持续学习和语境适应能力的认知伙伴。本报告将系统回顾2024年RAG关键技术动态,包括GraphRAG在多跳推理上的突破、KAG在垂直领域的深度适配、OAG在复杂场景的可解释决策以及MemOS在记忆调度机制中的创新,同时评估以往提出的技术挑战与路线图的实现情况。
报告还将聚焦于“是否仍需要RAG,以及需要怎样的RAG”这一核心问题,重点从RAG与图结构及KAG的深度融合、推理能力的层次化提升、与MemOS的协同记忆管理,以及在决策支持中的实际应用四个维度展开分析,为技术管理者与创业者系统梳理Agentic RAG结合KAG与MemOS的潜能与落地价值,助力把握下一代检索增强技术的主流趋势与发展先机。
从语言推理到多模态推理
该报告将分别介绍大语言模型推理算法的优化、推理能力的评测以及从语言到多模态的推理能力构建。在大语言模型推理中,GRPO及其变体DAPO等强化学习算法成为主流,目前这些算法都是基于完整序列计算优势函数,往往忽略序列中Token的贡献差异,本报告将介绍一种基于细粒度Token级优势计算的强化学习算法,显著提升大语言模型的推理能力。在大语言模型推理能力评测中,任务多集中于数学代码等领域,我们将介绍一个系统评估大语言模型长链反思推理能力的基准LR2Bench,该基准发现推理大模型仍存在很大的提升空间,也展示出对多模态推理的需求。最后,该报告将介绍一种多模态大模型推理能力的高效构建方法。
从规则到智能:强化学习Agent在知识服务场景的应用
随着AI Agent系统从单体模型走向多智能体协作,强化学习(RL)逐渐成为实现「自治决策、动态优化、持续学习」的核心机制。过去一年中,慢点团队在多个区域市场与行业场景中验证了这一体系,从Prompt工程阶段到具备自主策略演化的Agent架构,已在多个知识服务业务场景实现可量化ROI增长。
总结交流
领导致辞
面向无人驾驶的视觉感知与重建
随着人工智能领域的快速发展,无人驾驶感知技术取得了长足的发展,但依然无法满足复杂开放环境下无人系统安全运行的实际需求,从而导致无人驾驶汽车事故时有发生。该报告针对无人驾驶的视觉感知与生成任务,从视频去雾、3D占用估计和3D建图与定位三个方面,介绍了课题组近期的工作进展。
多模态 GUI 智能体中的推理能力
随着智能体在真实设备上的操作能力不断增强,多模态 GUI 智能体已经成为连接大模型与实际应用场景的重要技术方向,其潜力在于让 AI 能够像人类一样理解界面、执行任务、完成跨应用复杂操作。本次报告将介绍这一领域的任务背景与技术发展。我们将结合AppAgent 系列工作展开讨论,进一步阐述多模态 GUI 智能体如何通过探索驱动的学习机制获得更强的推理能。报告将介绍理解用户界面、空间关系与交互模式的最新方法,并重点阐述智能体如何通过系统化的探索与推理,学习在复杂数字环境中自主导航与操作。
面向科学计算的Graph大模型
本报告主要介绍了⾯向AI for Science的图计算平台, ⾸先, 我们采⽤了软硬件协同加速技术, 使软件和硬件紧密合作, 通过优化算法和硬件设备之间的协同⼯作, 实现更⾼的性能和效率。此外, 我们的平台还⽀持多种GNN框架以及Graph⼤模型, 并具备图神经⽹络架构搜索能⼒ , 以优化图神经⽹络模型的性能和泛化能⼒。最后, 我们提供⾯向科学计算的⼀站式的图开发解决⽅案, 包括 数据处理 、算法优化 、模型训练与部署等环节, 为研发⼈员提供便利和⾼效的⼯具和平台, 并在计算制 药, 临床诊断, 地震预测 、⾼能物理等科学领域取得了⼀定成果。
合影
基于云边协同架构的数据智能技术赋能新型工业化
在“AI+”战略背景下,工业企业数智化升级普遍面临数据质量不高、模型容错率低、业务场景融合难等技术挑战,该汇报介绍了一套基于云边协同架构的工业AI高质量应用方法论,涵盖高质量数据集建设思路、大小模型协同机制、场景融合策略等内容,并通过剖析生产运行寻优、设备智能运维等典型场景案例,分享AI模型实现工艺参数动态优化与闭环控制的实践经验。
组合式创意视觉生成
组合式创造性是人类智能的重要体现之一,其核心是将多个看似无关的事物之间建立联系,形成新颖的、惊奇的、价值的融合事物。大多数现有视觉生成式方法主要是模拟数据分布,缺乏组合式创造性的探索。因此,如何设计具有组合式创造性的视觉生成式方法就成为一个研究难点。结合生成扩散的基础模型,介绍本团队近年来在组合式创意视觉生成方向上的一些探索研究,并探讨一些未来研究趋势。
三维结构理解与智能建模
高效高精度的三维理解与建模是构建物理实体数字化表达、以及解决三维空间计算与仿真推演问题的关键。目前三维建模面临几何空间表征能力有限、缺乏结构理解能力的难题,特别是无法对多源异构数据之间的结构关系和约束进行有效表示。针对几何与结构联动性不足、复杂异构数据理解难和大尺度场景建模难的挑战,本报告从高效三维结构化表征、结构表征驱动的三维理解、结构表征引导的智能建模三个层面介绍结构化表征驱动的三维智能建模的研究进展,技术成果应用于工业产品三维建模仿真、三维数字孪生构建、工业机器人三维感知理解等多项任务。
专委会领导致辞
Agentic Coding 带来的机遇与挑战
当AI越来越擅长写代码,开发人员会面临怎样的机遇与挑战,当前我们与之协作最好的范式又会是什么?
大模型赋能人形机器人产品升级
介绍企业案例,如何将大模型技术与具身机器人结合的工作情况和思考,以及校企合作的探索。
校企真协同,产教真融合—高质量校企合作的探索与实践
立足校企双向奔赴,分享深度融合经验,通过携手解决客户需求,共创高质量合作
人工智能赋能新型工业化探索实践
中兴滨江工厂打造五自智能体在工业领域全场景实践,探索人工智能赋能新型工业化实践,以全局智能重塑价值,成就客户和生态共赢
合影留恋
围绕AI+产教对话交流:产教共育人工智能高技能人才
领导致辞
机器学习的“变”与“不变”
在深度学习快速迭代的浪潮中,前沿研究聚焦于从“变”的角度构建机器学习方法,如增加数据/标记规模、设计创新网络架构、构建多样学习模式等。然而,从机器学习的基础研究视角,我们可发现机器学习的各个环节中存在更为本质的”不变性“规律与内涵,如数据高维标记空间的低维特征模式、网络基础模块的不变/等变性结构本质、学习模式设计的内在统一性规律等。把握这些不变性内涵,有利于我们更深刻理解提升机器学习泛化性、鲁棒性、可解释性机理的理论方法途径,更合理利用这些基础原理设计更加简洁合理的学习模式,构建更加具有深刻内涵的机理-数据双驱动、知识-网络相融合的有效机器学习方法。基于此,本报告将介绍针对高维标记空间低维不变性隐空间提炼的“标记分布建模”理论与方法、针对网络基础卷积模块旋转-尺度-仿射等变性结构刻画的“参数化卷积”理论与方法、针对机器学习方法超参设置不变性规律提炼的“模拟学习方法论”理论与方法,从而尝试探讨对机器学习方法如何从“变”中提炼其“不变”内涵的方法论思想,为机器学习的基础研究与工程应用提供一种可参考的视角。
通用类脑大模型
当前大模型主要基于Transformer架构,在Scaling law驱动下越来越大,然而Transformer具有二次方计算复杂度,Scaling law驱动难以为继;我们需要思考如何基于脑启发设计新一代大模型的基础模型和计算架构,找到一条可持续推动当前AI系统到下一个阶段的通用人工智能道路。本报告借鉴大脑信息处理机制,聚焦树突脉冲神经网络,结合报告人的科研进展,阐述构建新一代通用类脑脉冲大模型基础架构的主要科学问题,探索一条基于新架构构建低功耗人工智能的新路径,实现脑科学与人工智能的双向赋能(Brain for AI 和AI for Brain)。
合影
图神经网络泛化分析
图神经网络在社交网络分析、分子预测、推荐系统等多个领域获得广泛关注,但针对理论仍相对滞后。本报告聚焦图神经网络泛化性这一核心科学问题,系统剖析分布内和分布外场景下的泛化误差分析,全面探讨图结构特性、数据分布等关键因素与泛化性能的关联规律。
AI 学术大师是如何炼成的
科学研究作为推动人类社会进步的核心驱动力,其效率提升对科技发展具有重要意义。人工智能技术在加速科学发现方面的探索,已成为实现通用人工智能的关键试金石。着眼于此,我们提出了通用科研智能体SciMaster,旨在通过构建"搜、读、算、做、写"的完整科研闭环,显著提升科研工作效率。SciMaster依托多智能体协同框架X-Masters,在人类最后考试(HLE)评估中首次突破30分,展现了卓越的综合学术能力。本报告将重点阐述SciMaster在文献检索、科研计算及学术写作等核心环节的技术实现与应用效果,为AI辅助科研提供新的解决方案。
从帧到世界:面向世界模型的长视频生成
世界模型是能够理解和建模现实世界动态的生成式 AI 模型。视频生成作为其关键技术支撑,不仅考验模型对空间一致性的保持能力,也对其长程依赖建模能力提出了挑战。本报告将探讨面向世界模型的视频生成应具备哪些核心特性,并以 Macro-from-Micro Planning(MMPL)方法为例,展示如何将帧级视频建模推进至契合世界模型的新范式。我们提出的这种视频生成新架构,能够有效缓解自回归长视频生成中普遍存在的时域漂移与串行推理瓶颈问题,为发展面向世界模型的视频生成技术提供新的研究思路。
江苏移动算力平台与模型平台能力与实践
总结交流
领导致辞
遥感影像的感知与解译
遥感解译是对遥感影像进行识别、分类和解释的信息处理过程,是实现地表信息提取、资源环境监测、灾害应急响应等应用的关键环节。长期以来,解译技术经历了从人工判读到机器解译的演进。机器解译通过模拟人脑的认知机制,对遥感信息的智能化提取。然而,人脑和机器在信息处理方式上存在本质差异,人脑擅长抽象的推理认知,而机器擅长数据统计的记录计算。因此,本报告围绕遥感解译的智能感知体系,汇报跨域遥感场景解译技术和高信噪比高光谱成像技术,发现遥跨域遥感图像解译模式,探索地物高灵敏度探测机理,提高遥感感知解译能力。
多模态遥感智能基础模型:数据、方法与应用
对地观测已进入大数据时代,遥感基础模型以其泛化能力得到越来越多的关注。报告针对基础模型用于遥感实践面临的问题挑战,系统阐述了如何构建高质量的样本数据集、如何结合成像物理优化网络模型、如何提升大规模解译任务的时效性等三方面的技术进展。进一步,介绍了绍基础模型在国民经济多个领域的应用效益。
大模型驱动的多模态遥感信息智能处理
近年来,大模型技术的进展推动了遥感信息处理从深度学习时代进入大模型时代。遥感大模型具备数据可通用、任务可通用、知识可通用等特点,能够有效提取遥感信息中的通用特征表示,对数据模态、模型框架、下游任务、先验知识、用户需求等进行有机整合和决策控制。本报告从可见光遥感图像大模型、多任务遥感图像大模型、多模态遥感信息大模型和生成式遥感图像大模型等方面,介绍研究团队近年来在多模态遥感大模型方面的研究进展,最后讨论研究工作展望。
合影
三维遥感场景感知与生成研究进展
基于多无人机和卫星的多视角图像对复杂场景进行三维渲染与分析,在实景三维构建、低空智能感知等方面有重要研究与应用价值。本次报告中,讲者将围绕三维遥感场景视角稀疏、场景尺度大的特点,介绍课题组近期在该方向的研究工作,包括稀疏视角和大范围3D遥感场景的BEV感知、Occupancy感知、高保真渲染与生成等。最后,将对该方向的潜在应用和未来方向进行讨论。
人工智能气象大模型
近年来,科学智能(Scientific AI)领域备受关注。2023年,美国哈佛大学联合多家单位在《Nature》上发表题为《Scientific Discovery in the Age of Artificial Intelligence》的论文,指出人工智能技术大大加速了科学研究,可以获得传统方法无法发现的科学洞见。然而,如何实现科学规律与人工智能的深度融合,仍然处于研究探索的早期阶段。本报告将介绍大数据系统软件国家工程研究中心与中国气象局天气预报大模型团队在人工智能气象大模型领域的代表性工作,包括极端降水临近预报大模型NowcastNet、人工智能临近预报系统“风雷”和全球中短期天气预报系统“风清”,进而探讨科学机器学习这一新学习范式的典型进展。
总结交流
张道强主任致辞
超图基础模型在医学影像中的应用研究
随着人工智能技术的飞速发展,面相医学影像的基础模型不断被研究提出,并在各种影像分析任务重取得了优异的性能,已经成为学术和工业界的热点。超图是常规使用的图的泛化,能更为有效的表达复杂关系,目前在医学影像领域也有着广泛的应用,但面向超图的基础模型研究还较少。本报告介绍超图基础模型,及其在医学影像领域中的两个应用。
脑机接口与人工智能应用
脑科学与人工智能机器人技术的交叉融合是人工智能学科未来发展的大势所趋,势必引发新一代科技革命和产业革命,从而深刻影响人类的生产生活方式。围绕未来都市的出行、服务、安保等生活场景,段峰教授将介绍脑控汽车、垂直起降飞行器、智能假肢、助老康复机器人、脑控动物等脑机接口典型研究成果。
基于深度学习的心血管影像处理算法研究
近年来,深度学习技术在医学图像分析领域进展迅速。但是,由于心血管影像模态多、维度高、标注难等特点,使得依靠大量精细标注监督学习范式在心血管图像计算中面临巨大挑战。为此,我们提出了多种融合先验知识的深度学习血管影像AI模型,在提高任务精度的同时降低了模型训练对精细标注数据的依赖,同时更好地服务临床诊疗需求。
智能诊疗技术---推进临床决策及医疗诊断报告
随着医学数据规模的不断增长以及临床流程的持续复杂化,医疗人工智能正逐渐成为提升诊疗效率与质量的重要力量。从疾病早筛到个体化治疗,AI 正在改变医疗服务的运行方式,也为临床决策提供了前所未有的支持。本次报告从“感知—诊断—治疗”的整体流程切入,介绍智能技术如何参与到临床实践的不同阶段。我们将首先讨论智能感知技术如何帮助医生获取更精准、更丰富的医学信息;随后展示智能诊断模型在疾病识别、风险预测和辅助决策中的关键作用;最后延伸到智能治疗,包括个性化治疗方案推荐及术后康复等环节。 通过这样的三位一体视角,本次分享希望呈现智能诊疗技术在诊前、诊中、诊后的协同价值,并探讨其对未来医疗体系的推动作用及发展潜力。
具身手术机器人初探
手术机器人等高端医疗装备核心技术的突破与全面智能化转型升级是面向世界科技前沿、面向国家重大需求、面向人民生命健康的重大国家战略任务,为打破欧美高端数字医疗装备的技术垄断提供决定性保障和有力支撑。现有手术机器人缺乏有效的多模态手术目标协同感知系统且对医生操作要求较高,严重制约了其在国防安全、疫情灾情等国家重大突发事件应急响应中的推广和应用。具身智能通过构建“感知-认知-行动”的闭环交互机制,使手术机器人能够像人类医生一样理解手术环境、适应复杂场景并做出智能决策,这是实现其自主能力跃升的关键路径。针对上述具有挑战性的问题,本讲座深入介绍了手术机器人从术前、术中到术后的多模态感知的基本原理和关键方法,并展示了我们团队在具身智能驱动的手术机器人自主操作等方面取得的一些初步进展,为减少我国医疗事故提供重要保障。
张道强主任总结
主持人开场 ,领导致辞
平台发布
产品联合发布/签约
嘉宾分享
欢迎致辞
主旨报告
2025年度江苏省工业软件优秀产品和应用解决方案颁奖
AI大模型赋能数字化建设
CAD技术赋能打造新质生产力
AI赋能船舶仿真试验
人工智能背景下的嵌入式实时操作系统发展探索
AI服务客户案例
活动开场、主办单位致辞
AI+:企业内的CBT和市场中的OPC
市重点培育企业人工智能创新产品发布
金融产品推介
市创新投资集团产业基金集群介绍及重点合作项目签约
围绕金融赋能人工智能产业发展,特别聚焦培育壮大AI产业OPC 模式,开展交流对话
标委会工作会议
AI for Science时代科研新范式的探索和思考
全链条人工智能驱动新型铁电材料研发
标准研讨会
第二届智能交通专委会换届选举会
公路交通安全隐患防治新技术、新实践
AI赋能空地一体智能交通高质量发展
交通气象发展中的科技创新
空中交通管理智能化运行技术与实践
人工智能在公路领域的应用
领导致辞
Visual Generation: Diffusion Models and Controllable Human Video Generation
图像恢复:从像素恢复到特征增强
视频多模态人工智能与应用实践
InternVideo:通用视频理解大模型体系
脑网络拓扑深度挖掘方法研究
圆桌交流
领导致辞
基于多模态表征的图像和视频世界模型生成
教育智能体的构建与应用探索
垂域大模型优化方法与应用
信道图谱赋能的低空通信
从工具到同伴,AI技术跃迁与教育范式升级
开幕式
考虑算力影响的学习理论框架
茶歇
增强具身智能的迁移性与成长性
多媒体自主智能
特征解耦驱动的跨模态视觉生成
迈向通用的人工智能:自主智能体的关键技术与挑战
播放人工智能产业宣传视频,专业主持人开场
致辞环节
发布环节
启动环节
主旨报告
地市成果
专题演讲
颁奖环节
领导致辞
人机共生时代的AI认识安全
从“心”思考普适场景中情感计算的问题、对策及应用
高质量基础时空数据+顺丰物流大模型,赋能城市数智化转型
从知识检索到认知增强:图、推理、记忆与决策
从语言推理到多模态推理
从规则到智能:强化学习Agent在知识服务场景的应用
总结交流
领导致辞
面向无人驾驶的视觉感知与重建
多模态 GUI 智能体中的推理能力
面向科学计算的Graph大模型
合影
基于云边协同架构的数据智能技术赋能新型工业化
组合式创意视觉生成
三维结构理解与智能建模
专委会领导致辞
Agentic Coding 带来的机遇与挑战
大模型赋能人形机器人产品升级
校企真协同,产教真融合—高质量校企合作的探索与实践
人工智能赋能新型工业化探索实践
合影留恋
围绕AI+产教对话交流:产教共育人工智能高技能人才
领导致辞
机器学习的“变”与“不变”
通用类脑大模型
合影
图神经网络泛化分析
AI 学术大师是如何炼成的
从帧到世界:面向世界模型的长视频生成
江苏移动算力平台与模型平台能力与实践
总结交流
领导致辞
遥感影像的感知与解译
多模态遥感智能基础模型:数据、方法与应用
大模型驱动的多模态遥感信息智能处理
合影
三维遥感场景感知与生成研究进展
人工智能气象大模型
总结交流
张道强主任致辞
超图基础模型在医学影像中的应用研究
脑机接口与人工智能应用
基于深度学习的心血管影像处理算法研究
智能诊疗技术---推进临床决策及医疗诊断报告
具身手术机器人初探
张道强主任总结
会员享受8折购票优惠,优惠码会发送至JSAI会员群。个人和单位注册参会将优先推荐申报2026年度江苏省学会各类人才举荐与评选评优活动。
在线注册缴费:大会官网点击“立即报名”填写参会信息,完成在线注册缴费。
线下转账汇款:(转账或汇款请附言“JSAI2025+姓名或单位简称”)
收款单位:江苏省人工智能学会
收款账号:320006678018010081595
开户银行:交通银行南京仙林支行
*线下支付开票请将回执截图及开票信息发送至:top@jsai.org.cn。
发票开具:电子发票将发送至注册时填写的邮件。
每张通票可兑换JSAI大会定制轻薄羽绒服一件
兑换时间:27日早上签到时领取
(在校学生免费票无该礼品)
一、南京站至紫金山庄紫金会议中心(3号门进)
(一)乘坐出租车交通信息
南京站出发,行驶至紫金山庄紫金会议中心(江苏省南京市栖霞区环陵路18号中山陵园风景区)。
全程约11公里,用时20分钟,车费约20元。
(二)乘坐公交车交通信息
南京站出发,行驶至紫金山庄紫金会议中心(江苏省南京市栖霞区环陵路18号中山陵园风景区)。
南京站出站步行约160米在“南京站北广场东”站台乘坐141路公交(西花岗方向,首班车06:00末班车22:00),共4站至“黄马”站下车,步行328米至紫金山庄紫金会议中心,全程用时42分钟,票价为2元。
二、南京南站至紫金山庄紫金会议中心(3号门进)
(一)乘坐出租车交通信息
南京南站出发,行驶至紫金山庄紫金会议中心(江苏省南京市栖霞区环陵路18号中山陵园风景区)。
全程约17公里,用时25分钟,车费约25元。
(二)乘坐公交车交通信息
南京南站出发,行驶至紫金山庄紫金会议中心(江苏省南京市栖霞区环陵路18号中山陵园风景区)。
南京南站出站步行约25米在“南京南站”地铁站台乘坐3号线(林场方向,首班车05:40末班车23:10),共11站至“南京林业大学·新庄(1号口)”下车,出站后步行314米至“新庄广场东”站乘坐309/141公交车(天旺路方向,首班车06:30末班车22:10),共8站至“黄马”站下车,步行328米至紫金山庄紫金会议中心,全程用时65分钟,票价共为6元。
三、南京禄口机场至紫金山庄紫金会议中心(3号门进)
(一)乘坐出租车交通信息
南京禄口机场出发,行驶至紫金山庄紫金会议中心(江苏省南京市栖霞区环陵路18号中山陵园风景区)。
全程约48公里,用时44分钟,车费约65元左右。
(二)乘坐公交车交通信息
南京禄口机场出发,行驶至紫金山庄紫金会议中心(江苏省南京市栖霞区环陵路18号中山陵园风景区)。
南京禄口机场出站步行约103米在“空港新城江宁(2号口)”地铁站台乘坐S1号线(南京南站方向,首班车05:57末班车22:40),共8站至“南京南站”下车,站内换乘3号线(林场方向,首班车05:40末班车23:10),共8站至“大行宫”站下车,站内换乘2号线(经天路方向,首班车06:00末班车23:00),共7站至“马群(4号口)”站下车打车3.2公里至紫金山庄紫金会议中心,全程用时1小时47分分钟,票价共为30元左右。
第八届江苏人工智能大会(JSAI2025)将于2025年12月26-27日在南京紫金山庄会议中心召开,现公开诚招赞助单位,欢迎有意向的合作伙伴可以与组委会洽谈,双方协商后,大会组委会将制订出有针对性的合作内容与权益。以下为赞助合作伙伴赞助权益说明。
联系人:刘潇,18550600828(微信同号)