英伟达性能暴涨594%，大厂却喊亏钱：你的AI用对了吗？

发布时间：2026-05-29 12:08阅读：17

5月28日，两条看似背道而驰的AI新闻同步刷屏：

英伟达放出了Polar框架，致使AI编程工具Codex的跑分飙升594.74%——从3.8%跃升至26.4%。Claude Code、Qwen Code等主流编程助手均从中获益。

就在同一天，Uber首席技术官坦承：公司短短数月便耗尽2026年全年的AI预算，却只换来「几乎没有对用户真正有价值的成果」。微软也开始限制Claude Code的订阅访问，统一切换至内部Copilot。

一面是AI能力飞速跃升，另一面则是企业界的集体反思。

这背后的真相究竟为何？并非AI本身无力，而是你运用AI的层级存在偏差。

欲洞悉这场「AI效率危机」，首要任务是厘清一个基础概念——Token（词元）。

当你向ChatGPT输入文本时，它并非逐字阅读。大语言模型会将文字拆解为微小的「词元块」——既可是完整词汇，也可是半个词或单个字母。每一个词元都需消耗算力与成本。

高盛最新报告预测：至2030年，AI智能体将带动全球Token消耗激增24倍——即每月120万万亿Token。

OpenAI一名员工透露：其3人团队单月便烧掉了130万美元的Token费用。

核心认知：AI智能体系统消耗的Token量，可能高达普通聊天机器人的1000倍。因为智能体需反复推演、调用工具、修正错误、生成代码……每一步皆是「烧Token」的过程。

Uber便是典型范例——超80%的工程师在使用AI，超60%的代码由AI生成。然而，代码量的爆发并未自动转化为产品体验的质变。

基于众多企业实践，我将AI效率划分为四个层级，每上升一层，效率提升一个数量级：

🔹 Lv.1 闲聊层：将AI仅作搜索引擎，一问一答。效率提升≈10%

🔹 Lv.2 辅助层：利用AI撰写文案、修改邮件、执行翻译。效率提升≈30%

🔹 Lv.3 协作者层：让AI介入全流程，例如代码编写→测试→调试→部署的闭环。效率提升≈100%

🔹 Lv.4 智能体层：让AI自主执行多步骤任务，企业级AI agent嵌入业务系统。效率提升≈500%+

英伟达的Polar为何能令Codex暴涨594%？因为它在「智能体层」实现了关键性突破。

传统强化学习训练AI智能体时，需将执行框架改写为env.init()、env.step()等固定接口——既缓慢又易丢失细节。

Polar的策略是将AI模型与智能体框架间的接口作为训练边界，迫使AI在真实的代码编写、工具调用、补丁提交场景中学习，而非局限于模拟环境。

（无需深究技术细节，核心仅有一句：）

最高效的AI使用方式，并非让其回答单个问题，而是使其融入完整的任务流程。

❌ 低效用法：「帮我写一封客户跟进邮件」 ✅ 高效用法：「这是A客户过去3个月的沟通记录（附文件），他之前提到预算紧张。请写一封跟进邮件，语气不要太强硬，最后可附上一个折中方案。先提供3个版本供我选择。」

关键转变：并非让AI单纯作答，而是为其布置任务，并附带完整的上下文与约束条件。

许多人习惯一次性将庞大需求抛给AI，导致其理解偏差，反复修正耗费更多时间。

正确做法如下：

将高频场景封装为Prompt模板，以便复用。例如：

每次使用时仅调整核心参数，从而节省大量重复调校时间。

这才是微软、Uber们真正该反思的——非AI无能，而是未将AI嵌入标准化工作流，而是让人零散、随机地使用它。

当下的AI行业涌现出两股力量：

这两股力量并不冲突。它们共同指向一个结论：

AI确实在变强，但「会用AI」与「用对AI」完全是两码事。

若你仍停留在「闲聊层」使用AI，投入再多Token亦难提升效率。不妨向「协作者层」「智能体层」迈进——让AI介入你的完整工作流，而非仅充当高级搜索框。

效率倍增非依赖更昂贵的模型，而在于更优的用法。