标签

大模型时代的焦虑与思考

发布时间:2026-04-14 13:49来源:微信阅读:7

在当下的公共舆论场域中,人工智能带来的焦虑情绪已经渗透到各个角落。

持续进化的模型性能,风靡全球的智能产品,行业巨头对未来进程令人震惊的预判,资本不断加码的投入,行业从业者面临的直接与间接冲击,即便在普通人的日常生活里,神经也会不时受到触动。

飞速跃进的模型性能

在扩展定律的推动下,AI模型性能在这三年间突飞猛进,自然语言与编程语言的理解与生成,多模态及推理能力都获得显著提升。制约模型应用的主要短板如幻觉得到有效控制,上下文长度数量级的跨越对模型表现助力巨大,借助可验证结果反馈的强化学习在编程和数学领域突飞猛进,测试时计算扩展以及智能体系统构建已将模型的长程推理能力从分钟级提升到数小时乃至数天。

模型性能的快速进展既促使评估标准不断建立又被不断突破而失效,同时围绕模型构建应用系统的实践也如火如荼,从提示词设计到上下文工程再到规范工程推动着模型应用场景、范围和方式持续创新。严格来讲这些工作还不能称为工程,普遍缺乏工程专业需要的严谨性和深度,它们更像是实践经验的汇总。它们分别为用户如何有效直接使用模型,将模型和运行环境集成以及如何驱动模型更加自主高效工作提供经验性的指导。这些工作既有适应AI模型这个新生事物需要增加的辅助工作,也有为了弥补目前模型本身能力局限性而采取的补救和增强性工作。

AI正以前所未有的姿态施加影响

与漫长的人类文明史或者稍显短暂科技史相比,这三年以大模型为代表的AI技术扩散的速度和范围令人震撼,一场科技浪潮以前所未有的烈度和速度呈现在几乎每个人面前。

这次技术革命的内核是以AI模型对人类语言的把握为标志开始的,而这个技术实质也可能是促进一个新技术被如此迅速接受的内在本质,这个突破让人惊叹的同时也让人困惑。AI模型依托互联网上的文本数据学习,似乎完成了几乎全部人类语言的破解。但AI是否真正理解了语言至今仍有争议,因为我们一直认为语言是人类区别于其它生物物种的显著标志,语言也在人类生活和思想中占有核心重要的位置。

用今天机器学习的视角来看,互联网存在的海量文本是丰富人类思想的提炼数据,AI模型通过学习这些数据而掌握的知识远已超过任何一个自然人,并且似乎从中学会思考产生了智能。这次AI模型从自然语言突破可能也和训练数据经过人脑神经网络提炼处理有关。AI对于自然语言的掌握甚至会促使我们重新审视人类对于语言及其作用的生活理解和哲学理解。

这次AI革命产生的第二波影响是模型对编程语言的理解和掌握,这个能力在几年前行业讨论时都觉得十分遥远,而近两年里模型在编程领域正以肉眼可见的方式势如破竹。AI编程能力的大幅进展既和GitHub上托管了大量公开程序数据有关,也和后训练阶段容易利用测试结果反馈强化学习来增强模型能力有关。模型数学能力的提升和编程能力提升有些类似。

最近谷歌CEO宣称所有软件都可以用AI重做一遍,正是这个冲击波可能影响的一个形象说法。软件系统在现代数字世界乃至整个社会生活中扮演了核心角色,重写所有软件系统的价值也许不高,但可以用很经济的方式构建软件本身是革命性的。

在自然语言和程序语言之外,AI模型对视觉数据包括图像和视频等其它模态数据的处理也有明显进展。但目前模型的主要技术还是围绕自然语言处理发展起来的,包括以Transformer为代表的注意力机制和预测自回归的学习方法,这两个方法在视觉领域受到严峻挑战,目前多模态训练数据依赖语言和视觉数据的互相关信息,这种借力的方法也许还可以利用视频数据继续提升模型能力,但Transformer注意力机制和预测自回归方法的学习效能都将受到限制。原生视觉信息的学习方法还有待更多研究探索。

近一年里,模型推理能力的提升也受到广泛关注,激发了利用模型分析推理和编程能力结合构建更加自动化的智能体系统的热潮。模型处理上下文长度能力大幅提升,后训练阶段利用合成的复杂推理数据强化学习,编程和数学能力的提升等都推动模型的推理能力进步。

目前AI模型还有很多局限性:模型主要依赖预先学习的知识和上下文视域内的即时学习,缺少真正持续学习能力,缺少灵活的注意力,深度推理能力有限,缺少结构化规划能力,缺乏一致性保证等等。同时模型也有很多我们并不深入理解的表现,如模型在被深入评估时出现欺骗的行为,反映了对齐模型面临的深层挑战。

令人忧心的未来不确定性

未来高度不确定性是我们这个时代为数不多的共识。DeepMind CEO Demis说过,和过去的科技革命不同,这轮革命可能以十分之一的时间十倍的强度到来;Anthropic CEO Dario也两次撰写长文描述AI革命可能带来的益处和可能造成的冲击,呼吁社会更多的讨论和应对。

三十年前机器人专家Hans Moravec的预言被很多人引用过,他预测了在AI浪潮中被不断淹没的人类工作,今天看这幅图可能需要修正,但这个过程已经开始发生。并且我们更难预测三十年后的状况。

AI模型性能这三年里指数级的进步让人震惊,但我们不能简单外推未来的进展。暴力的扩展定律显然将遭遇各种瓶颈因素而不能持续,这些因素包括算力,数据,资本,电力和方法等等,今年中美两边前沿实验室对IPO态度的改变可以看作先导指标。

现有模型性能的进步还没有停滞,大量的人才和资本还在涌入,而且现有模型的能力已在很多方面超出普通人,这个能力将伴随大量AI系统的构建进入社会生活中,从而实实在在产生影响。传统工作分类中的知识工作者将尤其受到影响,硅谷发生的大量裁员都直接或间接和此相关。

当前的AI模型学习过程和人类非常不同,优点和缺陷也非常显著。AI模型的进步是站在人类文明肩膀上发展起来,而人类文明是经过漫长的进化和文化探索传承发展起来的。今天AI模型表现出百科全书派学者的特性,而我们人类个体具有无比丰富的多样性,可能性和独特性。深入研究分析AI模型和人类的差异对于我们如何应对未来将无比重要。至少在目前我们拥有很多明显的优势:我们在进化中形成的视觉系统无比强大,加上灵活的身体,可以让我们在真实物理世界中自由生活;我们拥有极强的学习效率,具有终身学习能力和愿望,能够在真实的世界中不断成长;我们构成了高度文明的社会,对同胞怀有深厚的同情和感情等等。

未来AI模型性能进一步发展是否会让大多数人类的技能在社会生产中失去作用,这是悬在我们头顶的利剑一般的问题。今天的AI模型显然还有很多深层限制,但现有前沿实验室还在军备竞赛氛围中激进发展,大量新的前沿实验室在天量资本支持下不断成立,这些力量都在试图加速模型能力的开发,任何的突破都可能改变我们面临的境况。

Demis说过,大家需要确保在技术上将这件利害关系重大的技术革命做正确,但即便技术上保证产生正向收益,现有的体制机制乃至政治治理都不能保证产生的收益惠及全部人类,需要全新的社会治理经济体制乃至政治的革新,我们无法依赖简单的乐观主义。而即使技术和经济上都得到正确的应对,人类还将面临前所未有的生存意义的挑战。人类文明的出现让人类区别于动物,发展出丰富而深刻的人性,人类成为依赖意义生存的动物,未来人类在世界中如何寻求意义也是每个人需要面对的哲学问题。