AI自主构建AI：技术闭环的起点

发布时间：2026-05-27 16:35阅读：12

↓↓↓点赞、转发、关注、获取更多AI实战干货！↓↓↓

最近我注意到，AI领域发生了一件令人深思的事。不是因为某个模型性能提升，而是一个完整的自动化流程在2026年5月26日被一家中国公司悄然实现。

事件核心非常清晰：

执行方：面壁智能，联合清华大学与OpenBMB开源社区。

成果内容：推出了端侧大模型MiniCPM5-1B，并开放了其训练框架ForgeTrain的源码。（AI独立造出了AI）

最引人注目的地方在于ForgeTrain这套框架——这些代码完全由AI自动生成，而该框架又成功训练出新的AI模型。

这个过程让我反复确认多次——人类设计了一个AI系统，该系统自行编写出训练框架，再用此框架训练出新AI。工程师在整个代码编写过程中几乎没有参与。

在相同硬件条件下，ForgeTrain的训练效率比英伟达的Megatron高出约10%。Megatron代表了英伟达数十年的技术积淀，而击败它的代码却出自AI之手。

在华为昇腾芯片上，ForgeTrain训练MiniCPM5-1B的速度也比原生框架快了约10%。我一直认为国产芯片在硬件方面追赶迅速，但软件生态一直是短板。现在，AI正在弥补这一短板。

MiniCPM5-1B参数量仅10亿，在AA-Index榜单上超越了所有2B以下的模型。

相比三个月前发布的Qwen3.5-2B，效果更优，参数却减半。

INT4量化后权重仅为0.5GB，可在手机、平板、车机等设备上运行，甚至支持CPU。

它已经可以作为AI桌宠，也能在手机上做端侧Agent，处理复杂的本地多步骤任务。

可以说，这款小型模型直接降低了端侧智能的使用门槛。

我深入研究了背后的技术逻辑，发现面壁采用的方法论与传统软件工程完全不同。

传统软件工程强调“一次编写，到处运行”，即写一套通用代码适配所有硬件。好处是省事，代价是每种硬件都无法达到最优性能。而面壁提出了一种新范式：既然AI生成代码越来越快，为何要追求通用？完全可以根据不同模型、硬件和任务，现场定制专用代码。

具体实现方式是他们开发的Harness机制，你可以把它想象成一个全自动的智能考场。AI被投入其中后会自动：

生成代码

运行测试

获取反馈

持续改进

一轮轮循环，全程无需人工干预。最终产出的就是ForgeTrain。其功能对齐Megatron，速度还快10%。

面壁智能还提供了一个进化路线图：

L1：AI提供建议，人类全盘操作（如Copilot）

L2：AI辅助完成具体环节（如Cursor、Claude Code）

L3：AI端到端产出下一代模型——ForgeTrain正处于此阶段

L4：AI递归自改进，能改造自己的训练管线

L5：AI自主设定研究议程，进行开放式探索

我的理解是，ForgeTrain目前处于L3和L4之间。AI已触及预训练框架这一核心基础设施层，但距离完全自我改造还有距离。

谈完技术，再看市场。端侧AI这条赛道，2026年确实在加速。

手机AI渗透率预计将达到约45%，PC约为62%。

整个端侧AI市场规模，预计将从2025年的3219亿元增长至2029年的1.22万亿元，年复合增长率约40%。

大模型的智能密度大约每3.5个月翻一番。

面壁智能年初刚完成超10亿元融资，正式进入独角兽行列。

在这种背景下，MiniCPM5-1B这种“小钢炮”模型的出现，时机非常精准。

回顾历史，人类制造的所有工具，从石器到光刻机，都需要人直接制造。但ForgeTrain让我看到，制造先进工具的行为本身正被AI接管。预训练框架本是大模型领域最依赖经验的工作，现在它成为可自动化的生产力。这个节点意义非凡。

过去讨论国产芯片生态时，大家总说要追赶CUDA，但几十年积累哪能轻易填平。ForgeTrain提供了一条新路径：不追求“国产CUDA”，而是让AI为每款芯片、每个模型现场锻造最优代码。这种“量体裁衣”如果跑通，国产芯片在软件层面的差距可能被指数级压缩。我认为，2026年中国AI芯片行业期待的“DeepSeek时刻”，ForgeTrain或许就是第一个明确信号。

面壁这次将ForgeTrain的代码和MiniCPM5-1B的权重都开源了。但我更关注的是他们开源了一种新的生产方式。如果未来训练框架都可以由AI自动生成且开源，那“训练模型”这件事的成本结构会彻底改变。小团队、个人开发者，甚至非技术背景的人，都可能调用AI生成所需专用框架。当生产工具变得极度廉价和可获取时，创造的门槛就塌缩了。

当然，ForgeTrain还远未到终点。它能端到端产出模型，但还不能自主改造整条训练管线，更别说自己设定研究方向。从辅助到自主，可靠性和可控性仍有一堆难题要解决。但方向已经很明确：AI不仅在被制造，也开始制造。当这个能力被开源，整个社区都可以一起向下一个台阶探索。

2026年5月26日，或许就是这一切加速的起点。亲眼见证一个闭环的完成，说实话，这种感觉挺奇妙的。

不过，奇妙归奇妙，“局外人”这个词还是让人忍不住多想一层。工程师这个角色，一直以来都是造物的主角——写代码、搭框架、调参数，双手永远沾着机油的温度。而这一次，AI自己写完了训练框架，自己训出了新模型，人类被请到了观赛席。这不是替代，是一种安静的位置转换。当AI开始接手“制造AI”这件事，人类工程师接下来该做什么？可能是往后退一步，去看方向、定边界、问该不该。也可能是往前跨一步，去和AI协作，做那些一个人永远做不了的事。局外人不可怕，怕的是坐进观众席就不愿意再上场了。

好在，这场游戏的哨声，才刚刚吹响。

涛子聊ai，为你解锁ai理想！创作不踩坑，变现加速度。2026 风口正劲，让我们一起以 AI 为翼，让每一个ai梦想落地成真！

← 上一篇：活动招募|AI 驱动增长与资本升级专题培训下一篇：科技金融赋能“智”造升级，桂林银行柳州分行精准服务 →