标签

凯哥解读 AI:李飞飞致力打破语言对智能的束缚

发布时间:2026-05-24 09:13来源:微信阅读:5

欢迎诸位关注“凯哥讲故事系列”微信公众号

本文附带完整 PPT 资料,如有需求

请添加凯哥微信,将此文转发至朋友圈并截图发送给作者,即可获取 PPT 全本

AI 人物志·No.04 李飞飞:誓将 AI 从语言的牢笼中解放

她曾言,AI 虽在字句间阅尽万卷书,却未曾真正凝视过一眼真实的世界。

2007 年,在斯坦福校园的一间斗室实验室内,一位名叫李飞飞的年轻华裔教授,着手让学生做件在外行看来颇为可笑之事——从互联网上一张张抓取图片,并雇人手工为其标注标签。

这项工程最终历时两年半,汇聚了一千四百余万张图像,划分成两万多个品类。这个数据集日后拥有了一个响亮的名字:ImageNet。

七年过后,几乎每一本关于深度学习的教科书开篇,都会提及 ImageNet。它与神经网络算法以及名为 GPU 的小型硬件,被世人合称为现代人工智能的三大基石。其中两项属技术范畴,另一项则是数据。而这关键的数据基石,正是她在实验室中一点一滴构建而成的。

李飞飞近日撰写了一篇长文,题目简洁有力——《从文字到世界》。

她在文中阐述了一个略显拗口的观点:当前 AI 领域最喧嚣的进展,皆聚焦于语言层面。大型语言模型虽已读完人类近乎所有的文字记录,能编写代码、撰写论文、创作情书甚至起草诉状,但它从未真正“看见”过这个世界。

她做出了一个极为强硬的判断:

此言出自她口,并引用了其实验室及其他多家机构的测试数据作为支撑。作为一名深耕视觉计算二十五载的科学家,她吐出这句话的潜台词无疑是——我们近年来热议的「智能爆炸」,或许根本算不上真正意义上的「智能」。

她并非反对 AI,而是反对在 AI 发展上的偷懒行为

李飞飞籍贯杭州,十六岁那年随双亲赴美。父亲在新泽西的洗衣店务工,她则在中餐馆里帮忙端盘。就读普林斯顿本科期间,她既要闻量子物理之深奥,又要去洗衣店熨烫衬衫。

此后赴加州理工攻读博士,再至斯坦福任教教授。这一路走来,她矢志未改的目标始终如一——让机器学会看懂世界。

她曾向人透露,自己心中存有一个“北极星”般的问题:动物在学会说话之前,早已具备空间认知能力;人类在发明文字之前,便已筑起房屋。一个将九成九算力都压在「读懂语言」之上的智能系统,根本无法构建出这样的架构。

她援引了一个古希腊人的故事为例。埃拉托色尼,这位公元前三世纪的学者,仅凭观测两座城市间影子角度的差异,便利用几何学推算出了地球周长。她指出,此事今日的 GPT-4 尚无法做到。非因它不知地球周长几何,实乃它根本不知“影子”为何物。

2024 年初,她与三位合伙人共同创立了一家名为 World Labs 的公司。Justin Johnson、Christoph Lassner、Ben Mildenhall——这三位在视觉计算领域,每一位都足以独当一面,著书立说。

World Labs 志在构建被她称为「世界模型」的体系。这套系统不止于看图、阅片,更需在脑海中模拟物理法则、几何结构与动力学机制,继而反向生成一个可供人走入的虚拟世界。

公司成立不足一年,便完成了一轮估值达 10 亿美元的融资。投资方名单星光熠熠,a16z、NEA、Radical Ventures 等巨头悉数在场。

依据 SVTR 那份 AI 创投数据库显示,过去十二个月内,冠以「世界模型」之名的 AI 初创企业,融资总额已突破 5 亿美元。年增长率超过七成。

资本或许看不透语言模型的确切边界,但资本敏锐地嗅到了边界所在。

在李飞飞那篇长文中,最易被忽视之处,莫过于她引出了维特根斯坦。

维特根斯坦曾于 1922 年写下一句名言:语言的边界,即是世界的边界。

李飞飞引用此语后,随即加以反驳:

一位钻研视觉论文二十五载的学者,与百年前那位探讨语言哲学的奥地利哲人,展开了一场跨越时空的对话。她所坚持的理念看似笨拙:即便让 AI 读尽人类写下的所有文字,它依然不懂一滴水珠是如何坠落地面的。

世界不仅仅生长在文字之中。世界更存在于那些无人诉诸笔端的瞬间里。

然而有一个问题,她在文中并未正面作答。

「世界模型」这一构想,所需的数据量级远超 ImageNet,所需的算力更是远超训练 GPT-4 之多。况且,它不具备 ChatGPT 那种“开箱即用”的消费级入口,其首批客户将是机器人公司、游戏引擎开发商以及电影制片厂。

换言之,这是一条比大型语言模型更为缓慢、更为沉重、也更为缺乏性感色彩的道路。

OpenAI 那种十八个月走完十年路程的速度,在此路上注定无法复制。

做慢事,需要肯慢下来的人

李飞飞本人,乍看之下便是那般愿意慢下来的人。

她在斯坦福实验室的白板上,曾画过一幅极简的图示:一只动物、一只手、一个杯子、一道桌沿。她告诫学生,待到哪一日 AI 能明白这只手伸向桌沿的瞬间,杯子或许会被推落下去,那我们的事业才算初现端倪。

这件事,她已坚守了二十五年。

她仍计划再干下一个二十五年。

精益数据训练营/解决方案架构师特训营

从数据到价值:精益数据工作坊

数字化咨询教练陪跑服务:

数字化转型规划 | 顶层设计 |企业创新与运营

IT战略规划 | IT服务管理体系 | 数据治理