AI Agent落地：别让一次点击毁掉45倍成本

发布时间：2026-05-07 13:25阅读：11

AI独立派 · 2026年5月7日

"仅靠模型本身，并不会改变你的工作流，也不会改变你在业务中的运转方式……你需要的是能把技术和真实发生的业务情境结合起来的人。"

这番话出自高盛全球资产与财富管理主管 Marc Nachmann。5 月 4 日，Anthropic 牵手高盛、黑石以及 Hellman & Friedman，成立了一家 15 亿美元的新公司，计划把 AI 工程师直接安排进企业内部，协助中型公司把现有流程重新梳理、完成工作流的重构。

与此同时，Reflex 也抛出了一组让人不寒而栗的基准数据：如果让 AI 通过"观察屏幕、点击按钮"来完成同一类任务，相比直接调用结构化 API，成本会高出 45 倍。

这两则信息其实指向同一件事：AI Agent 能否真正落地，关键从来不只是模型是否足够聪明，而在于你如何让它顺利嵌入你的业务。对独立开发者而言，这种认知差距，可能会成为今年最重要的分水岭。

Reflex 的测试思路非常直接：同一套管理界面（客户、订单、评价），同一个 Claude Sonnet 模型，并让它执行完全一致的业务任务。

那么结果如何？

成本差距到 45 倍，并不是模型能力不足，而是整体架构在决定。视觉 Agent 每一步都得"看"一张截图（会消耗数千 tokens），然后去推断应该点哪里；而 API Agent 拿到的是结构化 JSON，能一步到位处理。

更让人扎心的是，视觉 Agent 进行第一次尝试时，只在 4 条待处理评价里找到了 1 条，而且它甚至不会翻页。

把这件事放到独立开发者的底层，会得到怎样的结论？你的产品设计会决定 AI 接入成本的上限。若你的产品没有提供 API，而是只能让 AI"看屏幕"来操作，那么客户为 AI 自动化支付的费用就会被直接放大 45 倍。

同一周，Anthropic 与华尔街伙伴组建 15 亿美元合资企业；而 OpenAI 则联合 TPG、贝恩资本等 19 家投资方，着手筹建一家估值 100 亿美元的 "The Development Company"。

两家的打法几乎高度一致：不再只是卖 SaaS 订阅，而是把工程师派到客户现场去做事。

Anthropic 这套模式被称为"前置部署工程师"（FDE），与 Palantir 的路线类似——派人驻场，与一线员工并肩协作，把 Claude 直接嵌入他们现有的工作流之中。高盛的 Marc Nachmann 说过一句话，适合每个独立开发者反复记住：

"There's a big shortage of people who know how to apply these tools into businesses."

用更直白的话翻译：模型处处可见，但真正懂得把它们用到真实业务里的专业人才非常稀缺。

这也与 Stripe 的数据与 AI 负责人 Emily Glassberg Sands 在播客里的观点形成呼应——互联网经济正在向"Agent 原生"演进，支付、计费、欺诈检测等基础设施正在被重塑。头部 AI 公司可能在 18 个月内就跑出 3000 万美元 ARR，但新型欺诈（例如计算资源被盗用、AI 被批量滥用免费试用）也会随之加速出现。

对独立开发者而言，这带来两点影响：

第一，API-first 不再只是技术上的“洁癖”，而会直接变成商业竞争力。你提供 API，AI Agent 就能以更低成本去调用；如果不提供，在 Agent 原生时代你的产品就会像一座封闭的孤岛。

第二，"AI 落地服务"正在成为一个巨大的市场。Anthropic 愿意为此投入 15 亿美元，意味着"把 AI 接入业务"这件事带来的复杂度，远比很多人想象得更高。而独立开发者，恰好站在连接工具与业务的那一侧。

Andrej Karpathy 在最新一期 Training Data 播客中提出了"Software 3.0"的概念：

他分享了一个更个人的体会："我意识到 LLM 已经进化到，只需要很少的修正，就能把复杂工作流跑起来。作为程序员，我反而比过去任何时候都觉得自己更落后。"

不过他提到的 MenuGen 案例更有意思：他一开始投入了大量精力，去写应用以处理菜单照片并生成菜品图片；后来他发现，直接把菜单交给 Gemini，并要求"在生成菜品图的同时叠加相关效果"即可——于是原先那套应用就显得冗余。

这是一种反直觉但很真实的趋势：你越把应用层做得薄，AI 越能直接发挥作用。对独立开发者来说，与其花三个月做一个功能齐全的管理后台，不如花三天做一个 API-first 的核心服务，把剩下的交给 AI Agent 来完成。

Anthropic 联合华尔街成立 15 亿美元合资企业——不只是继续销售 Claude API，而是直接做"AI 落地服务"。联合高盛、黑石并采用 FDE（前置部署工程师）模式，先从自家投资组合公司开始验证。核心价值在于：他们确认了“AI 落地”的卡点不在模型本身，而在工程化的服务能力。

Reflex 发布了 Computer Use vs API 的成本基准：同样的模型、同样的任务，视觉路径比 API 路径贵 45 倍、慢 50 倍。核心价值也指向一句话：问题不在模型，而在架构。对独立开发者的提醒是——如果你不提供 API，你的产品在 Agent 时代会越来越“贵”。

Andrej Karpathy 提出 Software 3.0 范式——把编程重心从“写代码”转向“写提示词并设计上下文”。核心价值在于：并不是“程序员要失业了”，而是应用层正在变薄，关键能力正向提示词工程与系统设计迁移。

1. 先核对你的产品是否真的有 API。别只停留在"计划中"或"下个版本"——要落到现在。如果没有结构化 API，AI Agent 只能通过屏幕操作接入，你的客户为此多付 45 倍成本。

2. 用 Karpathy 的"MenuGen 思维"重新审视自己的产品。哪些功能层可以被 LLM 直接替代？哪些能力必须保留？答案也许会是：砍掉 80% 的 UI 功能，保留 20% 的 API 能力，然后让 AI 把剩余部分补齐。

3. 把目光放到"AI 落地服务"这一赛道。Anthropic 愿意为此投入 15 亿美元，说明需求仍远未被满足。独立开发者在技术能力上的积累，加上对垂直行业的理解，正是市场里最稀缺的组合。

最后再补一条很多人容易忽视的利好：Anthropic 和 OpenAI 同时进入"企业服务"，这本质上说明纯模型层正在成为基础设施。当模型变成水电煤，真正值钱的就不再是"谁拥有最好的模型"，而是"谁能把它接进真实的业务场景"。

对独立开发者来说，反而是好消息——因为我们一贯最擅长的，就是把具体问题解决掉。

素材

← 上一篇：主流AI集体失灵：紧急出行难题难倒三大巨头下一篇：AI赋能智慧矿山落地实战：太原煤科院培训收官 →