AI Agent落地:别让一次点击毁掉45倍成本
AI独立派 · 2026年5月7日
"仅靠模型本身,并不会改变你的工作流,也不会改变你在业务中的运转方式……你需要的是能把技术和真实发生的业务情境结合起来的人。"
这番话出自高盛全球资产与财富管理主管 Marc Nachmann。5 月 4 日,Anthropic 牵手高盛、黑石以及 Hellman & Friedman,成立了一家 15 亿美元的新公司,计划把 AI 工程师直接安排进企业内部,协助中型公司把现有流程重新梳理、完成工作流的重构。
与此同时,Reflex 也抛出了一组让人不寒而栗的基准数据:如果让 AI 通过"观察屏幕、点击按钮"来完成同一类任务,相比直接调用结构化 API,成本会高出 45 倍。
这两则信息其实指向同一件事:AI Agent 能否真正落地,关键从来不只是模型是否足够聪明,而在于你如何让它顺利嵌入你的业务。对独立开发者而言,这种认知差距,可能会成为今年最重要的分水岭。
Reflex 的测试思路非常直接:同一套管理界面(客户、订单、评价),同一个 Claude Sonnet 模型,并让它执行完全一致的业务任务。
那么结果如何?
成本差距到 45 倍,并不是模型能力不足,而是整体架构在决定。视觉 Agent 每一步都得"看"一张截图(会消耗数千 tokens),然后去推断应该点哪里;而 API Agent 拿到的是结构化 JSON,能一步到位处理。
更让人扎心的是,视觉 Agent 进行第一次尝试时,只在 4 条待处理评价里找到了 1 条,而且它甚至不会翻页。
把这件事放到独立开发者的底层,会得到怎样的结论?你的产品设计会决定 AI 接入成本的上限。若你的产品没有提供 API,而是只能让 AI"看屏幕"来操作,那么客户为 AI 自动化支付的费用就会被直接放大 45 倍。
同一周,Anthropic 与华尔街伙伴组建 15 亿美元合资企业;而 OpenAI 则联合 TPG、贝恩资本等 19 家投资方,着手筹建一家估值 100 亿美元的 "The Development Company"。
两家的打法几乎高度一致:不再只是卖 SaaS 订阅,而是把工程师派到客户现场去做事。
Anthropic 这套模式被称为"前置部署工程师"(FDE),与 Palantir 的路线类似——派人驻场,与一线员工并肩协作,把 Claude 直接嵌入他们现有的工作流之中。高盛的 Marc Nachmann 说过一句话,适合每个独立开发者反复记住:
"There's a big shortage of people who know how to apply these tools into businesses."
用更直白的话翻译:模型处处可见,但真正懂得把它们用到真实业务里的专业人才非常稀缺。
这也与 Stripe 的数据与 AI 负责人 Emily Glassberg Sands 在播客里的观点形成呼应——互联网经济正在向"Agent 原生"演进,支付、计费、欺诈检测等基础设施正在被重塑。头部 AI 公司可能在 18 个月内就跑出 3000 万美元 ARR,但新型欺诈(例如计算资源被盗用、AI 被批量滥用免费试用)也会随之加速出现。
对独立开发者而言,这带来两点影响:
第一,API-first 不再只是技术上的“洁癖”,而会直接变成商业竞争力。你提供 API,AI Agent 就能以更低成本去调用;如果不提供,在 Agent 原生时代你的产品就会像一座封闭的孤岛。
第二,"AI 落地服务"正在成为一个巨大的市场。Anthropic 愿意为此投入 15 亿美元,意味着"把 AI 接入业务"这件事带来的复杂度,远比很多人想象得更高。而独立开发者,恰好站在连接工具与业务的那一侧。
Andrej Karpathy 在最新一期 Training Data 播客中提出了"Software 3.0"的概念:
他分享了一个更个人的体会:"我意识到 LLM 已经进化到,只需要很少的修正,就能把复杂工作流跑起来。作为程序员,我反而比过去任何时候都觉得自己更落后。"
不过他提到的 MenuGen 案例更有意思:他一开始投入了大量精力,去写应用以处理菜单照片并生成菜品图片;后来他发现,直接把菜单交给 Gemini,并要求"在生成菜品图的同时叠加相关效果"即可——于是原先那套应用就显得冗余。
这是一种反直觉但很真实的趋势:你越把应用层做得薄,AI 越能直接发挥作用。对独立开发者来说,与其花三个月做一个功能齐全的管理后台,不如花三天做一个 API-first 的核心服务,把剩下的交给 AI Agent 来完成。
Anthropic 联合华尔街成立 15 亿美元合资企业——不只是继续销售 Claude API,而是直接做"AI 落地服务"。联合高盛、黑石并采用 FDE(前置部署工程师)模式,先从自家投资组合公司开始验证。核心价值在于:他们确认了“AI 落地”的卡点不在模型本身,而在工程化的服务能力。
Reflex 发布了 Computer Use vs API 的成本基准:同样的模型、同样的任务,视觉路径比 API 路径贵 45 倍、慢 50 倍。核心价值也指向一句话:问题不在模型,而在架构。对独立开发者的提醒是——如果你不提供 API,你的产品在 Agent 时代会越来越“贵”。
Andrej Karpathy 提出 Software 3.0 范式——把编程重心从“写代码”转向“写提示词并设计上下文”。核心价值在于:并不是“程序员要失业了”,而是应用层正在变薄,关键能力正向提示词工程与系统设计迁移。
1. 先核对你的产品是否真的有 API。别只停留在"计划中"或"下个版本"——要落到现在。如果没有结构化 API,AI Agent 只能通过屏幕操作接入,你的客户为此多付 45 倍成本。
2. 用 Karpathy 的"MenuGen 思维"重新审视自己的产品。哪些功能层可以被 LLM 直接替代?哪些能力必须保留?答案也许会是:砍掉 80% 的 UI 功能,保留 20% 的 API 能力,然后让 AI 把剩余部分补齐。
3. 把目光放到"AI 落地服务"这一赛道。Anthropic 愿意为此投入 15 亿美元,说明需求仍远未被满足。独立开发者在技术能力上的积累,加上对垂直行业的理解,正是市场里最稀缺的组合。
最后再补一条很多人容易忽视的利好:Anthropic 和 OpenAI 同时进入"企业服务",这本质上说明纯模型层正在成为基础设施。当模型变成水电煤,真正值钱的就不再是"谁拥有最好的模型",而是"谁能把它接进真实的业务场景"。
对独立开发者来说,反而是好消息——因为我们一贯最擅长的,就是把具体问题解决掉。
素材