标签

英伟达性能暴涨594%,大厂却喊亏钱:你的AI用对了吗?

发布时间:2026-05-29 12:08来源:微信阅读:5

5月28日,两条看似背道而驰的AI新闻同步刷屏:

英伟达放出了Polar框架,致使AI编程工具Codex的跑分飙升594.74%——从3.8%跃升至26.4%。Claude Code、Qwen Code等主流编程助手均从中获益。

就在同一天,Uber首席技术官坦承:公司短短数月便耗尽2026年全年的AI预算,却只换来「几乎没有对用户真正有价值的成果」。微软也开始限制Claude Code的订阅访问,统一切换至内部Copilot。

一面是AI能力飞速跃升,另一面则是企业界的集体反思。

这背后的真相究竟为何?并非AI本身无力,而是你运用AI的层级存在偏差。

欲洞悉这场「AI效率危机」,首要任务是厘清一个基础概念——Token(词元)。

当你向ChatGPT输入文本时,它并非逐字阅读。大语言模型会将文字拆解为微小的「词元块」——既可是完整词汇,也可是半个词或单个字母。每一个词元都需消耗算力与成本。

高盛最新报告预测:至2030年,AI智能体将带动全球Token消耗激增24倍——即每月120万万亿Token。

OpenAI一名员工透露:其3人团队单月便烧掉了130万美元的Token费用。

核心认知:AI智能体系统消耗的Token量,可能高达普通聊天机器人的1000倍。因为智能体需反复推演、调用工具、修正错误、生成代码……每一步皆是「烧Token」的过程。

Uber便是典型范例——超80%的工程师在使用AI,超60%的代码由AI生成。然而,代码量的爆发并未自动转化为产品体验的质变。

基于众多企业实践,我将AI效率划分为四个层级,每上升一层,效率提升一个数量级:

🔹 Lv.1 闲聊层:将AI仅作搜索引擎,一问一答。效率提升≈10%

🔹 Lv.2 辅助层:利用AI撰写文案、修改邮件、执行翻译。效率提升≈30%

🔹 Lv.3 协作者层:让AI介入全流程,例如代码编写→测试→调试→部署的闭环。效率提升≈100%

🔹 Lv.4 智能体层:让AI自主执行多步骤任务,企业级AI agent嵌入业务系统。效率提升≈500%+

英伟达的Polar为何能令Codex暴涨594%?因为它在「智能体层」实现了关键性突破。

传统强化学习训练AI智能体时,需将执行框架改写为env.init()、env.step()等固定接口——既缓慢又易丢失细节。

Polar的策略是将AI模型与智能体框架间的接口作为训练边界,迫使AI在真实的代码编写、工具调用、补丁提交场景中学习,而非局限于模拟环境。

(无需深究技术细节,核心仅有一句:)

最高效的AI使用方式,并非让其回答单个问题,而是使其融入完整的任务流程。

❌ 低效用法:「帮我写一封客户跟进邮件」 ✅ 高效用法:「这是A客户过去3个月的沟通记录(附文件),他之前提到预算紧张。请写一封跟进邮件,语气不要太强硬,最后可附上一个折中方案。先提供3个版本供我选择。」

关键转变:并非让AI单纯作答,而是为其布置任务,并附带完整的上下文与约束条件。

许多人习惯一次性将庞大需求抛给AI,导致其理解偏差,反复修正耗费更多时间。

正确做法如下:

将高频场景封装为Prompt模板,以便复用。例如:

每次使用时仅调整核心参数,从而节省大量重复调校时间。

这才是微软、Uber们真正该反思的——非AI无能,而是未将AI嵌入标准化工作流,而是让人零散、随机地使用它。

当下的AI行业涌现出两股力量:

这两股力量并不冲突。它们共同指向一个结论:

AI确实在变强,但「会用AI」与「用对AI」完全是两码事。

若你仍停留在「闲聊层」使用AI,投入再多Token亦难提升效率。不妨向「协作者层」「智能体层」迈进——让AI介入你的完整工作流,而非仅充当高级搜索框。

效率倍增非依赖更昂贵的模型,而在于更优的用法。