聊聊人工智能那些事儿

发布时间：2026-05-14 14:09阅读：23

作为一个人工智能主题的公众号，已经许久没有涉及AI这个话题了，说起来确实有些不太像话。近些年来AI的进步实在太过迅猛，各类热点话题虽然层出不穷，但来得快去得也快，本号希望能写出经得起时间检验的内容，所以一直没有动笔。。。好吧，以上都是借口，主要还是。。。人生艰难，这次就来聊一聊AI，没有什么固定主题，思绪飘到哪里就写到哪里，所以叫杂谈。

还是先从前段时间最火爆的编程助手说起，Cursor算是近年来AI应用破圈的典型案例，特别是春节之后，达到了热度的顶峰，几乎所有AI大厂都推出了自己的解决方案，仿佛不拥有一个编程助手就落后于时代了。社交媒体上也充斥着各种热门梗，比如编程助手取代了程序员的工作，某天上班发现旁边工位空无一人，只剩下一位同事的Cursor；多用几个编程助手，用各种大厂PUA话术来“PUA”编程助手等等。然而几个月过去，热度消退后，还有多少人在持续折腾这些编程助手呢？后续的改进产品也没有掀起太大波澜。

以我个人的经历来说，也花了不少时间研究编程助手。回顾总结一下，其实大部分时间都在解决编程助手本身的配置问题。为了实现某些自动化功能，需要配置各种API，编程助手几乎每两天就更新一个版本，早期每次升级都会带来一些问题，大的功能升级，比如执行命令的安全性限制，还会让之前的配置全部失效。因此可能有超过八成的时间都在维护编程助手，剩下一点时间基本都是在尝试各种插件。几个月后，编程助手还能有点用处的功能就只剩下每天推送几条新闻简报了。

这与当初的预期似乎相差甚远。但实际上这也是技术发展的规律，热度过后，沉淀下来的才是真正有价值的应用。推动编程助手这类产品破圈的背后实际上是技术的进步，大约在半年前，AI编程能力的持续改进突破了可用临界点，全面超越了初级程序员的水平。能体验到这个质变的最初只有日常从事编程的开发者。而编程助手借助编程能力的突破，可以通过编写脚本来完成日常任务，把这种能力展现给了公众，才让大家意识到AI原来这么强大，产生了暂时的破圈效应。

在编程领域之外，AI还远不是无所不能，只是在个别应用领域，比如绘图、视频生成等方面超越了人类。但AI在每一个应用领域的突破，都会全面改造这个领域的工作形式和流程，当然也会影响这个领域的工作机会。那么问题来了，下一个突破是什么？或者回到更根本的问题，通用的AI能力、全能的六边形战士，AGI什么时候会到来？

回答这个问题相当困难，甚至AGI本身是什么都缺乏普遍认可的定义。当下的进展也仍然处于探索阶段，还存在极大的不确定性。但我们还是可以借助引领AI进展的顶尖专家的观点，比如可能当世最懂AI的几个人之一，DeepMind的哈萨比斯的观点，来一窥究竟。

哈萨比斯不仅是世上少有的聪明人，更是非常罕见的，愿意与人分享，并且能够把自己的想法解释得深入浅出的聪明人。想要了解AI进展的大方向，最近几年哈萨比斯的演讲和一些技术博客的访谈都非常值得研读。哈萨比斯属于技术乐观派，他认为各种问题都可以也应当靠技术的发展来解决，并且他本人预期AGI会在大约5年之后，也就是2030年左右真正到来。

本文不想简单重复哈萨比斯的观点，感兴趣的还是建议去阅读原文。还是回到AI的基本框架，特别是最近几年大语言模型的突破本身，来探讨一下AI的可能进展方向。

可能很多读者已经了解过，最近几年大语言模型的突破，是依赖于一个简单的范式，就是预测语言里的下一个词。通过这样一个简单的范式，学习海量的数据，可能包括当前互联网上所有的文本知识，大模型就学会了理解语言内在的结构，也掌握了用语言表达的知识。可能有人会说，大模型内部像一个黑箱，我们并不知道模型是不是真正理解了知识。这种说法很难反驳，因为理解本身就是一个很难精确定义的概念。只从输入输出的角度，只要对于我们给的问题，模型能像真正理解这个问题并且掌握知识的人给出同样水平的输出，我们就假定，模型也同样“理解”了这些知识。

按照这个范式，一个大模型要具有和人一样的能力，我们需要准备覆盖领域知识的充足的数据，设计能够表示学习这些知识的算法，还需要有提供充足计算能力的硬件设备。这也就是影响AI下一步可能进展的三个关键因素：数据，算法，算力。

先从数据说起，大语言模型能够成功的前提条件之一，就是人类已经积累的文本知识，随着互联网的发展，人类已经把所有的书籍，各种知识积累都数字化了，这就方便了大模型的取用。大模型实际上是借助了人类的语言，这种对现实世界的符号化表示，来学习，掌握和理解现实世界。有观点认为，人脑的学习不光是通过读书写字掌握的语言知识，还有直接

← 上一篇：腾讯AI Lab十年演进：从学术高地到产业落地的转型之路下一篇：AI短剧造富神话背后：被忽视的成本真相 →