AI 大模型能超越人类智慧吗？

发布时间：2026-06-07 00:55阅读：20

本期访谈邀请到人工智能领域的先驱者、早在上世纪 80 年代末便发明卷积神经网络的顶尖专家杨立昆 Yann LeCun。若您时间有限，建议先点赞收藏并关注。

大语言模型的发展正触及瓶颈；硅谷巨头们鼓吹的“仅靠扩大模型规模即可实现通用人工智能（AGI）”，很大程度上是为了获取持续投资而构建的虚假叙事。

一、大模型为何显得愈发聪慧？

大众常觉得大模型近期突飞猛进。回想早期，若将复杂的财务报表交予它，或让其起草商业计划书，它常产生严重幻觉，输出结果不堪入目。但如今，情况显著改善，表现已相当出色。

这种业务能力的跃升，并非源于模型自身演化出类人的“理解力”，而是开发者“对症下药”的结果。当厂商发现大量用户试图用 AI 进行商业预测时，便会收集特定数据对系统进行微调，以适配此类场景。

更为关键的是，当下所用大模型已非孤立的文本生成器，而是“外挂”了各类工具的综合系统。例如，若被问及 1832 年法国的 GDP，它会查询专业数据库，而非依赖神经网络“死记硬背”。面对数据推演或回归分析任务，它也能直接调用专门的计算系统。

可以说，终端呈现的惊艳效果，背后是一套极其复杂的调度机制。在肉眼不可见的系统深处，不仅有大语言模型，还有针对特定场景的“子模型”，外加负责分配任务的“调度员”来决定请哪位专家出马。底层还进行了大量优化，以避免处理简单问题时调用成本高昂的超大模型。这是工程学与产品化的巨大成功，但绝不等同于真正的认知飞跃。

二、大模型缺失了哪块核心拼图？

为透彻解释大模型的局限，杨立昆提出了一个精妙的脑科学类比。

若将大语言模型对应至人类大脑，它仅相当于三个特定区域的集合：一是位于耳后的韦尼克区，负责理解口语；二是左耳前方的布洛卡区，负责将思想转化为语言输出；三是大脑深处的海马体，负责存储事实与建立联想记忆。

这三者的结合，赋予机器令人惊叹的语言表达、文本解析及记忆检索能力——这正是现阶段 AI 最擅长的部分。然而，人类心智的精髓，即支撑我们在复杂世界中生存、规划与决策的核心，实则位于前额叶皮层，那里才是真正思考与推理的所在地。从大脑整体分工看，后部负责感知，中部负责行动，前部负责思考。

目前的语言模型，恰恰缺失了“感知 - 行动 - 思考”这一完整的认知闭环。当然，这并不意味着 AI 架构必须一比一复刻人脑。正如人类为飞上天空发明飞机，飞机并无羽毛，也无需像鸟类般拍打翅膀，但无论是飞机还是鸟类，都遵循空气动力学的基本法则。

同理，当下的自动驾驶汽车、医学图像分析系统，大量采用了受哺乳动物视觉皮层启发的卷积神经网络。AI 的下一步进化，仍需从生物学汲取灵感，掌握智能底层的运行原理，而非仅仅将单纯的“记忆库”和“词汇发生器”堆砌得愈发庞大。

三、AGI 的真实时间表与资本叙事

既然大模型存在此类结构性短板，我们离通用人工智能（AGI）还有多远？这种超级系统真的会降临吗？

长远来看，超级机器的智力不仅会突破个体极限，甚至可能超越全人类的智慧总和，这是必然趋势，但关键变量在于时间线。与 Dario Amodei 或黄仁勋等行业领袖描绘的短期激进愿景不同，AGI 不会在明年或近几年内迅速落地。更核心的判断是：引领我们走向真正 AGI 的，注定非当前的 LLM 路线。

当前硅谷弥漫一种主流论调，认为只要不断增加大模型参数量、投入更多数据、进行更精细微调，就能自然跨越至人类水平的智能。在真正深耕基础研究的 AI 学者看来，此观点完全站不住脚。此处指非工业界每日致力于改进微调技巧的工程师，而是探索智能本质的科学家——他们深知大语言模型的边界，也清楚这条路正逼近饱和。

既然如此，为何大模型的故事仍在被大肆宣扬？答案在于资本的运作逻辑。众多科技巨头与初创企业，要么陷入盲目路径依赖，要么借用这套宏大叙事，说服金主继续提供高昂算力资金。这是一场依靠未来预期维持的昂贵游戏。

四、商业启示与下一代 AI 的投资方向

当底层技术的滤镜被摘下，商业世界需重新审视未来的投资与应用版图。

行业内敏锐的投资者与企业已意识到，大语言模型的性能红利正见顶。要在 AI 领域取得下一轮颠覆性进展，必然需要底层架构创新，以彻底突破现有技术瓶颈。这也正是为何市场上开始涌现对抗主流叙事的“少数派”，如杨立昆所在的实验室及相关企业，凭借打破常规的研发路径，成功筹集到 10 亿美元巨额资金。

好的，以上就是今日的分享。我是 Laurent，感谢与我共度这段时光，用点滴学习与思考让前路更加踏实且充满希望。下期见！

← 上一篇：中美AI争霸全景：赛道、标准与全球变局下一篇：美方拟入股AI巨头引关注 →