AI发展远未触及天花板:算力扩张催生新兴基础设施产业
近来,围绕人工智能技术存在一种普遍忧虑:其发展是否会很快触及瓶颈。
这种担忧的理由似乎站得住脚。训练成本持续攀升,GPU供应紧张,数据资源也看似趋于饱和。由此推演,不少人得出相似的看法——AI的迅猛发展或许只是暂时的。
然而,在AI公司内部,讨论的核心并非如此。
微软AI负责人Mustafa Suleyman多次重申一个观点:真正左右AI发展步伐的关键因素,是计算能力,而算力正持续以指数级速度增长。
只要这条增长曲线不停滞,AI的发展就很难骤然刹车。
人类对世界的认知通常是线性的。
步行一小时,大约能走10公里;两小时则大约是20公里。这类经验在日常生活中几乎不会出错。
问题在于,技术进步很少遵循这种线性模式。
AI模型训练规模的演变就是一个典型例证。公开研究经常引用的一组估算数据显示:早期机器学习模型的训练规模大约在10^14次浮点运算级别,而当今最尖端的大型模型已接近10^26级别。
时间跨度不过十多年。
换言之,训练所需的计算量增长了近万亿倍。
指数曲线具备一个特性:前半段看起来变化平缓,一旦进入后半段,增长会陡然变得急剧。许多人近两年才显著感觉到AI“能力突飞猛进”,其实正是因为曲线恰好走到了这个阶段。
“AI即将达到极限”这类论断,实际上已经多次出现。
十多年前,深度学习刚开始复兴之际,不少研究人员认为神经网络的规模无法继续扩大,因为计算成本过高。
2012年问世的AlexNet改变了这一局面。研究者开始系统性地利用GPU训练神经网络,算力因此被大幅释放。
此后的十多年间,类似的情形不断重演:
更适合并行计算的芯片架构、更成熟的分布式训练系统、更高效的数据处理流程。
从GPT-3到后续的更庞大模型,训练所需的GPU规模从数千张扩展到上万张。训练成本也随之攀升至极高水准。
但与此同时,工程体系也在同步演进。
模型的进步并非由单一突破所驱动,而是被整个基础设施体系共同托举。
如果将视角拔高审视,AI行业的竞争格局其实相当清晰。
真正稀缺的资源并非算法,而是算力基础设施。
训练最先进的大型模型,需要庞大的GPU集群、高速网络、海量存储系统以及稳定的电力供应。这些条件叠加在一起,本质上构成了一套工业级计算系统。
不少业内专家将此类系统称为“算力工厂”。
这也解释了为何AI浪潮中的核心参与者往往集中于三类企业:
芯片公司,例如NVIDIA;
云计算平台,例如AWS、Azure、Google Cloud;
以及拥有超大规模数据中心的科技巨头。
组建模型团队可以相对迅速,但构建算力基础设施则需要数十亿美元级别的长期投入。这种资本密集度,本身就预示着行业将走向高度集中。
技术能力的提升,并不会自动转化为商业收入。
AI产业真正面临的只有一个核心问题:谁会持续为此买单。
目前最稳定的付费群体并非普通消费者,而是企业客户。
原因很简单。企业只关注两件事:成本是否降低,效率是否提升。
已形成规模的AI产品,几乎都符合这一规律。
例如代码助手。像GitHub Copilot这样的工具被众多开发团队采纳,因为它能直接缩短开发周期。
客服自动化也遵循类似逻辑。许多公司将AI部署于一线客服,处理大量重复性咨询,仅将复杂情况转交人工处理。
还有企业知识系统。公司内部的文档、流程和数据库接入模型后,员工可直接使用自然语言进行信息查询与汇总。
这些产品具备一个共同特点:
其投资回报率(ROI)能够被清晰测算。
只要效率提升可以量化,企业付费就会转化为长期支出。
当基础模型能力越来越强时,从零开始训练模型对大多数创业公司而言并不现实。
资本、算力和数据的门槛都太高。
更实际的机遇,往往存在于模型本身之外。
一个方向是AI基础设施工具,例如数据处理、模型评估、推理优化、训练效率提升工具。这类产品直接服务于AI公司和开发团队。
另一个方向是垂直行业应用。
医疗、法律、金融、制造等行业存在大量复杂流程和专业知识。一旦模型能力达标,效率提升将十分显著。
还有一种正在快速兴起的产品形态:AI工作流系统。
它并非单一模型,而是一整套自动化流程,将信息检索、逻辑推理、内容生成和系统调用串联起来,使AI能够完成完整任务。
一旦这类系统融入企业日常运营流程,便很容易转变为持续的软件服务支出。
如果算力持续增长,模型能力大概率将继续提升。但对于创业者而言,预测技术曲线的具体形态意义有限。
更现实的问题是:谁愿意率先支付费用。
一个可行的起点通常很简单。
首先,定位企业内部一项高频、重复且可量化的工作,例如客服回复、文档检索、销售邮件撰写;
利用现有的大模型API将流程自动化;
再通过真实的业务数据计算所节省的时间或成本。
只要投资回报率(ROI)成立,客户就会持续付费。
AI产业早期最稳定的收入来源,往往并非来自最强大的模型本身,而是来自那些将模型深度嵌入工作流程的实践者。