标签

AI 独立视角:模型竞赛升级,"AI 写代码"红利消失

发布时间:2026-05-27 12:13来源:微信阅读:4

纯 Python 开源的 Hermes Agent,将 OpenAI 基于 Rust 构建的 Codex 彻底压制。

此事最令人担忧的并非"胜负归属"——而是:"掌握 AI 编程"所带来的溢价,正迅速归零。

本周 AI 领域依旧喧嚣:

模型日益强大且成本降低——这无疑是利好。

然而对独立开发者而言,一个严峻的现实是:"利用 AI 编写代码"正从稀缺技能转变为基础设施。

真正的竞争壁垒究竟为何?今日文章将深入探讨。

受挫的是 OpenAI Codex——业界顶尖的 AI 编程 Agent 之一,底层采用 Rust 极致优化。击败它的,是纯 Python 开源项目 Hermes Agent。

此事最令人心惊的是:你当前引以为傲的"AI 编程实力",究竟价值几何?

过去一年,主流观点是"掌握 Claude Code 或 Cursor,即可实现十倍速开发"。此观点曾属正确。但 Hermes 战胜 Codex 揭示:当开源项目数周内即可追赶工具水平时,"工具使用能力"的溢价正在消失。

这才是今日讨论的核心。

本周真实格局如下:

Anthropic 三张底牌同时显现。Opus 4.8 在 Google Vertex AI 后台被挖掘,Sonnet 4.8 代码泄露,专用安全模型 Mythos 1 也意外亮相。Anthropic 正以前所未有的速度推进迭代。

OpenAI 的反制在途。Codex 后端日志发现 GPT-5.6(iris-alpha),上下文窗口达 150 万 tokens,较 5.5 提升约 43%,预计 6 月发布。

DeepSeek 永久降价 75%。V4-Pro API 价格锁定原价四分之一,输入仅 0.435 美元/百万 token。中国模型在 OpenRouter 占比从 1% 飙升至 60%。

模型更强更便宜。这是好事。

但对独立开发者而言,残酷事实是:模型能力跃升,正让你的"AI 编程技巧"加速贬值。

为何?当 Codex 能被纯 Python 开源项目追平,当 DeepSeek 将价格压至四分之一,当任何人仅需 200 美元即可重建原值 400 万美元的系统(Garry Tan 真实案例)——"利用 AI 写代码"正从稀缺技能变为基础设施。

这如同 2010 年"开发 iOS App"是稀缺技能,而如今"开发 Flutter"仅属基础预期能力。

底层影响在于:你必须重新定义核心竞争力——它不再是"我能多快用 AI 写出代码",而是其他要素。

YC CEO Garry Tan 近期分享了一真实案例:利用 AI Agent 重写整个博客平台,原预估 400 万美元工程量,实际花费仅约 200 美元。

200 美元。非两万,非二十万。

数字本身非重点。关键在于:当"构建完整软件系统"成本从 400 万跌至 200 元,竞争焦点将从"谁能实现"转向"谁能定义需求"。

昔日,核心瓶颈在于技术实现——"想做却不懂前后端或部署"是多数独立开发者放弃的主因。

如今,此瓶颈正被 AI 快速消除。Garry Tan 案例并非特例——Pieter Levels 用 Claude Code 24 分钟构建可变现 MVP,任何具技术背景者皆可做到。

未来 12 至 18 个月,随模型上下文持续扩大,"写代码"在产品开发流程中的时间占比将降至 10% 以下。

剩余 90% 是什么?

此乃 AI 时代独立开发者的真正护城河:你与用户间的连接质量,以及定义有价值问题的能力。

技术实现?那是 AI 的事。

Hermes Agent 在真实 CLI 任务基准测试中,以 6:5 击败 Codex。

最值得关注非"谁更强",而是其获胜方式。

Hermes 开发者未堆砌更多 GPU,亦未训练更大模型。他们做的是工程优化:

无魔法,仅是对系统的深刻理解。

AI 时代,工程能力未消失,只是转移了战场。

昔日,工程能力体现为"以复杂架构解决复杂问题"。如今,体现为"以最少 token、最快响应、最低成本,让 AI 正确做事"。

故"AI 将取代程序员"的正确回答是:取代的是"仅会写代码"的程序员,无法取代"理解系统、定义问题、判断价值"的开发者。

【Hermes Agent 开源胜 Codex】Nous Research 的 Hermes Agent 在基准测试中击败 OpenAI Codex。核心价值:在工程优化层面,独立团队可与巨头正面抗衡。对独立开发者的启示:你无需最大模型,只需最懂模型应用之人。

【GPT-5.6 曝光:150 万上下文】OpenAI Codex 后端日志显示 GPT-5.6 支持 150 万 token 上下文,预计 6 月发布。超长上下文意味着可把整个代码库丢给模型——但 token 成本将激增。"上下文管理"将成为新必备技能。

【Anthropic Opus 4.8 与 Mythos 1 同时曝光】Anthropic 正推进通用模型与专业模型的双轨策略。信号:未来你可能需为不同任务选用不同模型——通用对话用廉价款,安全审核用专业款。"单一模型通吃"思路需改变。

【Garry Tan:200 美元重建 400 万美元系统】核心非省钱,而是利用 AI Agent 数日内验证多个产品构想。速度,乃 AI 赠予独立开发者的最大礼物。

第一件事:重新审视你正在做的产品,自问:"若技术实现成本趋近于零,我的产品核心价值还剩什么?"

若答案是"仅是功能本身",你可能需警惕——因很快任何人皆可用 AI 实现同样功能。若答案是"我对用户问题的理解"或"我建立的信任关系",你便处于相对安全位置。

第二件事:寻找一位真实用户,与其交谈 30 分钟,但全程不提你的产品。

仅问:"你最近为何事烦恼?"和"你目前如何解决此事?"随后闭嘴倾听。此为训练"需求定义能力"最廉价且高效的方式。

第三件事:将你正在进行的某项重复性开发任务,今日即利用 AI Agent 自动化。

非"日后有空再做",而是今日。旨在强迫自己适应"让 AI 干活"的新工作模式。

意外利好:

模型军备竞赛越激烈,独立开发者越受益。Anthropic、OpenAI、Google、DeepSeek 交锋越剧,模型便越强越便宜。大模型能力提升,边际收益最高者恰是独立开发者——因大公司需克服无数流程,而你明日即可将最新模型融入产品。

此乃最佳时代。前提是,你必须清楚自身竞争力究竟何在。

素材