张钹院士:中国人工智能奠基者的思想图谱
您所关注的AI深度解析,第一时间为您呈现
张钹院士是中国AI领域的开创者与奠基人,他凭借杰出的学术造诣,不仅推动了中国人工智能从零起步、从追随到比肩的跨越式发展,更构建了一套深刻而完整的思想架构,为AI的未来演进提供了理性的审视与前瞻的视野。自1978年决然踏入这片当时仍属荒芜的疆域,直至今日已届九旬高龄仍耕耘于学术与思辨的前沿阵地,其思想始终紧扣时代脉搏,深入剖析着人工智能的本体、局限与潜能。
一、先行者轨迹:中国AI的拓荒历程
张钹院士的学术历程,堪称一部微缩的中国人工智能发展史。这位1935年出生于福建福清的学者,1958年自清华大学自动控制系毕业后便留校执教。1978年,恰逢清华大学学科调整之机,他依托扎实的英语功底广泛研读国际前沿文献,精准洞察到人工智能这一新兴领域的巨大前景,并力主将其确立为全新研究方向,由此拉开了中国人工智能拓荒序幕。
他的奠基性工作铸就了中国AI研究的根基:1983年,携手其弟张铃教授,成为首批在国际人工智能顶级会议(IJCAI)发文的中国学者,首次向全球展现中国智慧;1984年,二人同获ICL欧洲人工智能奖,实现中国学者在该领域国际大奖零的突破;1985年,他主导创建国内首个智能机器人实验室;1987年,培育出中国首批AI方向博士,为领域发展注入高端人才活水;1990年,联合同仁建立全国首个AI国家重点实验室——"智能技术与系统"国家重点实验室。这些里程碑事件,不仅确立了中国AI研究体系的雏形,更塑造了自主创新、勇攀高峰的学术品格。
二、人工智能演进三阶段理论
在纷繁复杂的AI发展脉络中,张钹院士提炼出清晰的三阶段分析框架,这一范式已成为理解人工智能演进逻辑与内在瓶颈的重要工具。
第一代人工智能(知识驱动型) 以符号主义为内核,通过规则与逻辑推演模拟人类思维。其优势在于具备可解释性,但致命短板在于知识获取异常艰难,应用范畴狭窄,极度依赖专家系统的手工搭建,难以实现规模化拓展。
第二代人工智能(数据驱动型) 以深度学习为标志,依托海量数据训练神经网络,在图像识别、语音处理等方面取得革命性突破。然而,张钹院士深刻揭示了其固有缺陷:系统脆弱、缺乏安全性、可信度低、难以管控、可靠性差且不易迁移。他曾以经典"对抗样本"为例——仅在图像上添加肉眼不可见的细微扰动,系统便会以极高置信度将"熊猫"误判为"长臂猿",或将"停止"路标识别为限速标识——这生动而严峻地暴露了纯数据驱动范式的内在脆弱性。
第三代人工智能 则是张钹院士提出的前瞻性构想。他指出,前两代AI均困于特定领域问题,存在根本性制约。第三代AI的核心在于融合知识驱动与数据驱动,系统性整合知识、数据、算法与算力四大要素,并将知识置于首位,因"知识方为人类智慧之源"。这一代AI旨在构建可解释且稳健的理论基础,发展安全、可信、可控、可靠、可扩展的技术体系,从根本上突破前两代范式的天花板。
三、对现有AI技术的理性批判与深度思考
面对以ChatGPT、Sora为代表的大模型浪潮,张钹院士始终秉持科学家特有的冷静与审慎。他一方面充分肯定大模型在语言生成、人机交互与迁移学习方面的三大能力跃升,尤其是其处理开放域问题的突破,使机器初步掌握驾驭人类语言的本领;另一方面,他更尖锐地指出大模型无法规避的"幻觉"缺陷——模型会持续生成表面合理实则错误或无意义的输出,且这一缺陷具有内生性、不可控性与必然性。
在他看来,当前主流AI本质上仍是"机器智能",而非真正的"人类智能"。他清晰划分两条路径:行为主义学派追求机器行为与人类相仿;内在主义学派则主张模拟人脑运作机制,即类脑计算。现有成功的大模型属于前者,仅在行为层面与人类智能相似,内在机理截然不同,这也正是其缺乏可解释性的深层原因。这一论断,为技术热潮注入了不可或缺的哲学清醒。
四、通往通用人工智能的四阶路径
对于AI的终极目标——通用人工智能(AGI),张钹院士并未停留于空洞设想,而是提出了清晰务实的演进路径。他认为,从现有大语言模型迈向AGG,至少需跨越四个关键阶段:
第一阶段,实现人机对齐,使AI系统理解并契合人类的价值观、思维模式与行为范式,通过人类反馈持续迭代优化。
第二阶段,发展多模态生成,使AI不仅能生成文本,还能创作图像、音频、视频与代码,实现文生图、图生文、文生视频等跨模态理解与创造。
第三阶段,实现与数字世界交互,体现为AI智能体(AI Agent)的演进,在"思考"之外加入"感知"与"行动"环节,形成自主执行与学习的闭环。
第四阶段,实现与物理世界交互,发展具身智能,将智能系统与实体装置结合,在现实环境中感知、决策与行动,推动通用硬件的协同进化。
张钹院士特别强调,完成这四阶段并不等于实现AGI,而是通往该目标的必要阶梯。真正的AGI必须建立在坚实的理论基石之上,而当前AI领域最匮乏的,恰恰是统一的理论框架。这一认知,将其务实精神与理论追求融为一体。
五、AI安全可信与可解释性的技术哲学
在张钹院士的思想体系中,安全性与可信性绝非附加议题,而是AI能否获得社会广泛接纳的先决条件。他直指第二代深度学习算法的先天不足:不可解释、不安全、不可控、易受攻击,且因依赖海量数据而难以迁移。他同样以实例警示:攻击者仅需佩戴特定图案的眼镜便可欺瞒人脸识别系统;在语音中植入微弱噪声,就能让识别系统作出完全错误的判断。
在他看来,破解困局的根本在于发展可解释的AI理论。若无法构建可解释且稳健的理论,AI技术便永远无法真正令人信服——这正是他提出第三代AI理念的深层动因:通过融合知识驱动与数据驱动,从技术层面筑牢安全防线。
尤其在医疗等高风险领域,他的立场尤为审慎。现有大语言模型缺乏真正的推理与因果理解能力,其"黑箱"特性与不可解释性令人高度警惕。更关键的是,AI尚不能"自我担责"。因此,对大模型给出的任何诊疗建议,都必须由人类医生最终把关。在AI时代,医生的角色将升华为决策者、沟通者与边界守护者,这一洞见为智能时代的专业伦理提供了清晰坐标。
六、产业发展的务实预判与战略建言
对于AI产业化,张钹院士始终持有清醒务实的判断。他指出,当前AI产业因缺乏统一理论体系,发展仍高度依赖特定领域的模型与算法,这直接限制了市场规模与产业演进速度。
面对"百模大战"的产业热潮,他冷静预判:未来仅少数企业将专注通用大模型研发,多数企业将向三个方向分化——一是深耕垂直领域大模型,切入金融、医疗、能源等专业场景;二是提供通用或开源模型作为基础设施;三是将大模型与其他技术工具深度融合,开发创新应用。这一判断,为喧嚣市场提供了理性导航。
他特别强调,中国在发展第三代AI方面与世界处于同一起跑线,这为我们掌握发展主动权、作出原创性重大贡献提供了难得历史机遇。为此,他大力倡导建立产学研紧密结合的创新"造血机制",将科学研究、技术创新与产业发展融为有机整体,构建可持续的创新生态。
七、数学工具与理论创新的方法论贡献
张钹院士学术思想的深层,始终流淌着浓厚的数学基因。早在二十世纪八十年代,他便敏锐意识到,当时多数AI研究恰恰缺乏数学工具,而这正意味着"大量未解问题存在数学求解的可能"。他与张铃教授合作,将概率统计与拓扑理论这两把"利器"引入AI,提出了基于统计推断的启发式搜索、基于拓扑降维的运动规划等方法,为智能系统的严谨性奠定了数学基础。
他们最具代表性的理论贡献是问题求解的商空间理论,该理论已成为粒计算的重要分支。它在商空间数学模型基础上,提出了多粒度空间之间的转换、融合与推理方法,以及问题分层求解的计算复杂性分析与降维策略。这一创新不仅为机器人运动规划等实际问题提供了强大工具,更为AI理论建构开辟了新路径。它有力证明:缺乏深刻的数学思维,便无法建立真正坚实的AI理论。
张钹院士的AI思想体系,兼具历史纵深、未来前瞻、批判锋芒与建设温度。从中国AI拓荒者到世界AI思想的重要贡献者,他的思想轨迹折射出中国科技工作者从追赶到引领的宏伟征程。
在AI技术日新月异的当下,他反复警示:真正的创新不在于盲目追逐热点,而在于深入本质、夯实根基。他的第三代AI理念,不仅是对技术路线的规划,更是一场关于AI发展哲学的深刻思辨——在追求智能的同时,必须坚守安全、可信、可控的底线;在拥抱数据驱动的同时,绝不能遗忘知识这一人类智慧的终极源泉。
文章精选:
1.强化学习之父、图灵奖得主 Sutton 隔空回应 图灵奖得主Hinton:目前的 AI "理解不足,调参有余"