推动AI从工程实践迈向科学体系:人工智能科学基础研讨会召开
AI技术浪潮持续涌动,应用创新层出不穷,但其理论根基与科学本源仍需深度挖掘。4月22日,上海交通大学人工智能学院在徐汇校区举办了"Science of AI:人工智能科学基础学术研讨会"。
本次论坛聚焦"人工智能的科学基础"议题。AI领域虽硕果累累,但理论根基不牢致使学科发展屡现波动。当前急需引导AI研究从工程实践转向科学体系,推动技术路线从经验试错迈向原理驱动,期望在未来五到十年内构建起稳固的理论基石,促进AI实现质的飞跃。
鄂维南院士(上海交大AI学院首席顾问)、汤超院士(西湖大学讲席教授、国自然交叉科学部主任)、胡事民院士(清华计算机系)、上海交大副校长蒋兴浩,以及董彬(北大博雅特聘教授、中关村学院常务副院长)、张燕咏(中科大AI与数据科学学院执行院长)、杨洋(浙大计算机学院AI系系主任)、王延峰(上海交大AI学院执行院长)、魏凡杰(上海未来产业基金总经理)等学界精英与科研机构专家汇聚一堂,围绕AI数理基础、理论架构与人才培育等关键课题,深入探讨智能科学的底层规律,合力构建AI可持续发展的理论根基。
蒋兴浩强调,AI发展需兼顾应用落地与价值创造,更须强化理论体系、巩固学科根本。值此建校130周年暨AI学院成立两周年之际,深度研讨AI科学基础,既是服务国家战略、锻造新质生产力的时代使命,也是突破技术壁垒的关键所在。
主旨演讲环节,胡事民院士分享了《大模型评测体系与自主生态建设》报告。他指出,国内大模型研发势头良好,开源生态已具国际竞争力,但跨模态推理仍是薄弱环节。其团队开发的"计图"框架凭借高效运行与出色的国产芯片适配能力,依托元算子技术实现快速迁移,显著增强国产芯片在大模型推理场景的表现。在评测方面,团队建立了跨学科评估标准,揭示出模型在多模态融合、几何推理的尺度效应及"惰性输出"等方面的缺陷。为此,团队开放了多模态数据集与80亿参数模型,为本土大模型演进提供数据与技术支持。
北大智能学院信息科学中心王立威教授发表《大模型时代的机器学习理论》演讲。他提出,当前大模型理论研究聚焦于样本效能、任务泛化、知识获取与挖掘三大主轴。关于思维链提示(CoT)如何强化模型推理能力:Transformer架构在无思维链辅助时,难以一次性求解数学运算与逻辑推导等复杂任务;而引入思维链后,模型得以分步推演、逐词生成解答,即使参数量不变,仍可攻克P完全类难题。该理论阐明了思维链的内在机制,为优化大模型推理性能提供了理论支撑。
主题报告阶段,上海交大AI学院严骏驰教授介绍了团队研发的JTok大模型优化模块。面对模型参数膨胀引发的算力与显存消耗激增,该模块如同为词元配置"智能调控器",借助查表与逐元素调制技术,在不扩充主干参数、不改变计算路径密度的条件下增强模型容量。该模块可逐层挂载于Transformer架构,支持静态与动态双模式,达成"轻量级扩展",近乎零额外成本即可实现性能稳步提升,探索出大模型高效扩缩新路径。
上海交大AI学院谢伟迪副教授展示了OmniStream 4D流式视觉基础模型,打破了视觉领域"一任务一模型"的孤立格局。该模型融合语义理解、三维空间定位与时序动态三大维度,运用因果时序注意力机制与三维旋转位置编码,基于2亿帧多模态数据完成预训练,展现"通才实力"——在图像理解、视频时序分析方面对标顶级模型,在三维几何重建、空间推理等任务中实现业界领先,成功实现从"专才"到"通才"的跃迁。
上海算法创新研究院杨泓康研究员探讨了大模型"深度思考"与"主动感知"的前沿课题。他汲取第一性原理的"本质洞察"理念,构建"主动提升"理论框架,将复杂数据分布转化为可建模的隐式序列分布,并将"慢思考"界定为主动感知的特例。该理论为设计具备深度思考能力的AI提供了系统化架构,厘清了双重核心维度,可推演出最优模型配置,为培育高阶认知AI筑牢理论基石。
上海交大AI学院助理教授夏纫秋介绍了高可信AI研究进展,聚焦于自主探索型形式化数学推理。为破解大模型数学推理的逻辑不透明与"幻象生成"难题,团队采用形式化验证方法确保推导过程可检验,通过创新的等价性评估体系与分层推理架构,实现高可靠端到端问题求解。此外,团队开发了演绎推理智能体,验证其独立推演新定理的潜能,为高可信AI构建数理基础,开创了从"定理验证"到"自主科学发现"的新模式。
"AI时代人才培育"圆桌环节研讨了AI研究从"手工作坊"向"工程化"演进的路径、产学研及国家实验室联合培养机制,以及如何统筹科研、教学与创新创业。当下,风投机构正加速布局基础前沿领域,高校须打破传统框架,激励学生大胆探索、容许试错,培育冒险品格,强化交叉学科素养,革新课程与论文评估体系以顺应时代变革,切实解决实际问题,锻造核心价值理念。
"AI科学基础"圆桌论坛围绕模型参数分布统计、智能与意识涌现机理、物理智能构建及大模型可解释性等议题展开讨论,指出需在方法论层面构建全新理论范式,甚至可能触发物理学底层理论的革新。在实践路径上应融合严谨的科学训练,运用可控实验设计、现象观察、假设提出与验证的实证研究路径,循序渐进地建立智能认知的新科学体系。
会议尾声,鄂维南院士总结道,AI理论层面已取得重大进展,只是这些成果尚未广为人知;而换个角度看,这恰是明确研究方向、凝聚研究力量的难得契机。但归根结底,这一事业的推进终究要倚重青年一代,需要年轻人主动担当、勇立潮头。