标签

聊聊人工智能那些事儿

发布时间:2026-05-14 14:09来源:微信阅读:6

作为一个人工智能主题的公众号,已经许久没有涉及AI这个话题了,说起来确实有些不太像话。近些年来AI的进步实在太过迅猛,各类热点话题虽然层出不穷,但来得快去得也快,本号希望能写出经得起时间检验的内容,所以一直没有动笔。。。好吧,以上都是借口,主要还是。。。人生艰难,这次就来聊一聊AI,没有什么固定主题,思绪飘到哪里就写到哪里,所以叫杂谈。

还是先从前段时间最火爆的编程助手说起,Cursor算是近年来AI应用破圈的典型案例,特别是春节之后,达到了热度的顶峰,几乎所有AI大厂都推出了自己的解决方案,仿佛不拥有一个编程助手就落后于时代了。社交媒体上也充斥着各种热门梗,比如编程助手取代了程序员的工作,某天上班发现旁边工位空无一人,只剩下一位同事的Cursor;多用几个编程助手,用各种大厂PUA话术来“PUA”编程助手等等。然而几个月过去,热度消退后,还有多少人在持续折腾这些编程助手呢?后续的改进产品也没有掀起太大波澜。

以我个人的经历来说,也花了不少时间研究编程助手。回顾总结一下,其实大部分时间都在解决编程助手本身的配置问题。为了实现某些自动化功能,需要配置各种API,编程助手几乎每两天就更新一个版本,早期每次升级都会带来一些问题,大的功能升级,比如执行命令的安全性限制,还会让之前的配置全部失效。因此可能有超过八成的时间都在维护编程助手,剩下一点时间基本都是在尝试各种插件。几个月后,编程助手还能有点用处的功能就只剩下每天推送几条新闻简报了。

这与当初的预期似乎相差甚远。但实际上这也是技术发展的规律,热度过后,沉淀下来的才是真正有价值的应用。推动编程助手这类产品破圈的背后实际上是技术的进步,大约在半年前,AI编程能力的持续改进突破了可用临界点,全面超越了初级程序员的水平。能体验到这个质变的最初只有日常从事编程的开发者。而编程助手借助编程能力的突破,可以通过编写脚本来完成日常任务,把这种能力展现给了公众,才让大家意识到AI原来这么强大,产生了暂时的破圈效应。

在编程领域之外,AI还远不是无所不能,只是在个别应用领域,比如绘图、视频生成等方面超越了人类。但AI在每一个应用领域的突破,都会全面改造这个领域的工作形式和流程,当然也会影响这个领域的工作机会。那么问题来了,下一个突破是什么?或者回到更根本的问题,通用的AI能力、全能的六边形战士,AGI什么时候会到来?

回答这个问题相当困难,甚至AGI本身是什么都缺乏普遍认可的定义。当下的进展也仍然处于探索阶段,还存在极大的不确定性。但我们还是可以借助引领AI进展的顶尖专家的观点,比如可能当世最懂AI的几个人之一,DeepMind的哈萨比斯的观点,来一窥究竟。

哈萨比斯不仅是世上少有的聪明人,更是非常罕见的,愿意与人分享,并且能够把自己的想法解释得深入浅出的聪明人。想要了解AI进展的大方向,最近几年哈萨比斯的演讲和一些技术博客的访谈都非常值得研读。哈萨比斯属于技术乐观派,他认为各种问题都可以也应当靠技术的发展来解决,并且他本人预期AGI会在大约5年之后,也就是2030年左右真正到来。

本文不想简单重复哈萨比斯的观点,感兴趣的还是建议去阅读原文。还是回到AI的基本框架,特别是最近几年大语言模型的突破本身,来探讨一下AI的可能进展方向。

可能很多读者已经了解过,最近几年大语言模型的突破,是依赖于一个简单的范式,就是预测语言里的下一个词。通过这样一个简单的范式,学习海量的数据,可能包括当前互联网上所有的文本知识,大模型就学会了理解语言内在的结构,也掌握了用语言表达的知识。可能有人会说,大模型内部像一个黑箱,我们并不知道模型是不是真正理解了知识。这种说法很难反驳,因为理解本身就是一个很难精确定义的概念。只从输入输出的角度,只要对于我们给的问题,模型能像真正理解这个问题并且掌握知识的人给出同样水平的输出,我们就假定,模型也同样“理解”了这些知识。

按照这个范式,一个大模型要具有和人一样的能力,我们需要准备覆盖领域知识的充足的数据,设计能够表示学习这些知识的算法,还需要有提供充足计算能力的硬件设备。这也就是影响AI下一步可能进展的三个关键因素:数据,算法,算力。

先从数据说起,大语言模型能够成功的前提条件之一,就是人类已经积累的文本知识,随着互联网的发展,人类已经把所有的书籍,各种知识积累都数字化了,这就方便了大模型的取用。大模型实际上是借助了人类的语言,这种对现实世界的符号化表示,来学习,掌握和理解现实世界。有观点认为,人脑的学习不光是通过读书写字掌握的语言知识,还有直接