标签

AI 大模型能超越人类智慧吗?

发布时间:2026-06-07 00:55来源:微信阅读:2

本期访谈邀请到人工智能领域的先驱者、早在上世纪 80 年代末便发明卷积神经网络的顶尖专家杨立昆 Yann LeCun。若您时间有限,建议先点赞收藏并关注。

大语言模型的发展正触及瓶颈;硅谷巨头们鼓吹的“仅靠扩大模型规模即可实现通用人工智能(AGI)”,很大程度上是为了获取持续投资而构建的虚假叙事。

一、大模型为何显得愈发聪慧?

大众常觉得大模型近期突飞猛进。回想早期,若将复杂的财务报表交予它,或让其起草商业计划书,它常产生严重幻觉,输出结果不堪入目。但如今,情况显著改善,表现已相当出色。

这种业务能力的跃升,并非源于模型自身演化出类人的“理解力”,而是开发者“对症下药”的结果。当厂商发现大量用户试图用 AI 进行商业预测时,便会收集特定数据对系统进行微调,以适配此类场景。

更为关键的是,当下所用大模型已非孤立的文本生成器,而是“外挂”了各类工具的综合系统。例如,若被问及 1832 年法国的 GDP,它会查询专业数据库,而非依赖神经网络“死记硬背”。面对数据推演或回归分析任务,它也能直接调用专门的计算系统。

可以说,终端呈现的惊艳效果,背后是一套极其复杂的调度机制。在肉眼不可见的系统深处,不仅有大语言模型,还有针对特定场景的“子模型”,外加负责分配任务的“调度员”来决定请哪位专家出马。底层还进行了大量优化,以避免处理简单问题时调用成本高昂的超大模型。这是工程学与产品化的巨大成功,但绝不等同于真正的认知飞跃。

二、大模型缺失了哪块核心拼图?

为透彻解释大模型的局限,杨立昆提出了一个精妙的脑科学类比。

若将大语言模型对应至人类大脑,它仅相当于三个特定区域的集合:一是位于耳后的韦尼克区,负责理解口语;二是左耳前方的布洛卡区,负责将思想转化为语言输出;三是大脑深处的海马体,负责存储事实与建立联想记忆。

这三者的结合,赋予机器令人惊叹的语言表达、文本解析及记忆检索能力——这正是现阶段 AI 最擅长的部分。然而,人类心智的精髓,即支撑我们在复杂世界中生存、规划与决策的核心,实则位于前额叶皮层,那里才是真正思考与推理的所在地。从大脑整体分工看,后部负责感知,中部负责行动,前部负责思考。

目前的语言模型,恰恰缺失了“感知 - 行动 - 思考”这一完整的认知闭环。当然,这并不意味着 AI 架构必须一比一复刻人脑。正如人类为飞上天空发明飞机,飞机并无羽毛,也无需像鸟类般拍打翅膀,但无论是飞机还是鸟类,都遵循空气动力学的基本法则。

同理,当下的自动驾驶汽车、医学图像分析系统,大量采用了受哺乳动物视觉皮层启发的卷积神经网络。AI 的下一步进化,仍需从生物学汲取灵感,掌握智能底层的运行原理,而非仅仅将单纯的“记忆库”和“词汇发生器”堆砌得愈发庞大。

三、AGI 的真实时间表与资本叙事

既然大模型存在此类结构性短板,我们离通用人工智能(AGI)还有多远?这种超级系统真的会降临吗?

长远来看,超级机器的智力不仅会突破个体极限,甚至可能超越全人类的智慧总和,这是必然趋势,但关键变量在于时间线。与 Dario Amodei 或黄仁勋等行业领袖描绘的短期激进愿景不同,AGI 不会在明年或近几年内迅速落地。更核心的判断是:引领我们走向真正 AGI 的,注定非当前的 LLM 路线。

当前硅谷弥漫一种主流论调,认为只要不断增加大模型参数量、投入更多数据、进行更精细微调,就能自然跨越至人类水平的智能。在真正深耕基础研究的 AI 学者看来,此观点完全站不住脚。此处指非工业界每日致力于改进微调技巧的工程师,而是探索智能本质的科学家——他们深知大语言模型的边界,也清楚这条路正逼近饱和。

既然如此,为何大模型的故事仍在被大肆宣扬?答案在于资本的运作逻辑。众多科技巨头与初创企业,要么陷入盲目路径依赖,要么借用这套宏大叙事,说服金主继续提供高昂算力资金。这是一场依靠未来预期维持的昂贵游戏。

四、商业启示与下一代 AI 的投资方向

当底层技术的滤镜被摘下,商业世界需重新审视未来的投资与应用版图。

行业内敏锐的投资者与企业已意识到,大语言模型的性能红利正见顶。要在 AI 领域取得下一轮颠覆性进展,必然需要底层架构创新,以彻底突破现有技术瓶颈。这也正是为何市场上开始涌现对抗主流叙事的“少数派”,如杨立昆所在的实验室及相关企业,凭借打破常规的研发路径,成功筹集到 10 亿美元巨额资金。

好的,以上就是今日的分享。我是 Laurent,感谢与我共度这段时光,用点滴学习与思考让前路更加踏实且充满希望。下期见!