标签

AI自主构建AI:技术闭环的起点

发布时间:2026-05-27 16:35来源:微信阅读:6

↓↓↓点赞、转发、关注、获取更多AI实战干货!↓↓↓

最近我注意到,AI领域发生了一件令人深思的事。不是因为某个模型性能提升,而是一个完整的自动化流程在2026年5月26日被一家中国公司悄然实现。

事件核心非常清晰:

执行方:面壁智能,联合清华大学与OpenBMB开源社区。

成果内容:推出了端侧大模型MiniCPM5-1B,并开放了其训练框架ForgeTrain的源码。(AI独立造出了AI)

最引人注目的地方在于ForgeTrain这套框架——这些代码完全由AI自动生成,而该框架又成功训练出新的AI模型。

这个过程让我反复确认多次——人类设计了一个AI系统,该系统自行编写出训练框架,再用此框架训练出新AI。工程师在整个代码编写过程中几乎没有参与。

在相同硬件条件下,ForgeTrain的训练效率比英伟达的Megatron高出约10%。Megatron代表了英伟达数十年的技术积淀,而击败它的代码却出自AI之手。

在华为昇腾芯片上,ForgeTrain训练MiniCPM5-1B的速度也比原生框架快了约10%。我一直认为国产芯片在硬件方面追赶迅速,但软件生态一直是短板。现在,AI正在弥补这一短板。

MiniCPM5-1B参数量仅10亿,在AA-Index榜单上超越了所有2B以下的模型。

相比三个月前发布的Qwen3.5-2B,效果更优,参数却减半。

INT4量化后权重仅为0.5GB,可在手机、平板、车机等设备上运行,甚至支持CPU。

它已经可以作为AI桌宠,也能在手机上做端侧Agent,处理复杂的本地多步骤任务。

可以说,这款小型模型直接降低了端侧智能的使用门槛。

我深入研究了背后的技术逻辑,发现面壁采用的方法论与传统软件工程完全不同。

传统软件工程强调“一次编写,到处运行”,即写一套通用代码适配所有硬件。好处是省事,代价是每种硬件都无法达到最优性能。而面壁提出了一种新范式:既然AI生成代码越来越快,为何要追求通用?完全可以根据不同模型、硬件和任务,现场定制专用代码。

具体实现方式是他们开发的Harness机制,你可以把它想象成一个全自动的智能考场。AI被投入其中后会自动:

生成代码

运行测试

获取反馈

持续改进

一轮轮循环,全程无需人工干预。最终产出的就是ForgeTrain。其功能对齐Megatron,速度还快10%。

面壁智能还提供了一个进化路线图:

L1:AI提供建议,人类全盘操作(如Copilot)

L2:AI辅助完成具体环节(如Cursor、Claude Code)

L3:AI端到端产出下一代模型——ForgeTrain正处于此阶段

L4:AI递归自改进,能改造自己的训练管线

L5:AI自主设定研究议程,进行开放式探索

我的理解是,ForgeTrain目前处于L3和L4之间。AI已触及预训练框架这一核心基础设施层,但距离完全自我改造还有距离。

谈完技术,再看市场。端侧AI这条赛道,2026年确实在加速。

手机AI渗透率预计将达到约45%,PC约为62%。

整个端侧AI市场规模,预计将从2025年的3219亿元增长至2029年的1.22万亿元,年复合增长率约40%。

大模型的智能密度大约每3.5个月翻一番。

面壁智能年初刚完成超10亿元融资,正式进入独角兽行列。

在这种背景下,MiniCPM5-1B这种“小钢炮”模型的出现,时机非常精准。

回顾历史,人类制造的所有工具,从石器到光刻机,都需要人直接制造。但ForgeTrain让我看到,制造先进工具的行为本身正被AI接管。预训练框架本是大模型领域最依赖经验的工作,现在它成为可自动化的生产力。这个节点意义非凡。

过去讨论国产芯片生态时,大家总说要追赶CUDA,但几十年积累哪能轻易填平。ForgeTrain提供了一条新路径:不追求“国产CUDA”,而是让AI为每款芯片、每个模型现场锻造最优代码。这种“量体裁衣”如果跑通,国产芯片在软件层面的差距可能被指数级压缩。我认为,2026年中国AI芯片行业期待的“DeepSeek时刻”,ForgeTrain或许就是第一个明确信号。

面壁这次将ForgeTrain的代码和MiniCPM5-1B的权重都开源了。但我更关注的是他们开源了一种新的生产方式。如果未来训练框架都可以由AI自动生成且开源,那“训练模型”这件事的成本结构会彻底改变。小团队、个人开发者,甚至非技术背景的人,都可能调用AI生成所需专用框架。当生产工具变得极度廉价和可获取时,创造的门槛就塌缩了。

当然,ForgeTrain还远未到终点。它能端到端产出模型,但还不能自主改造整条训练管线,更别说自己设定研究方向。从辅助到自主,可靠性和可控性仍有一堆难题要解决。但方向已经很明确:AI不仅在被制造,也开始制造。当这个能力被开源,整个社区都可以一起向下一个台阶探索。

2026年5月26日,或许就是这一切加速的起点。亲眼见证一个闭环的完成,说实话,这种感觉挺奇妙的。

不过,奇妙归奇妙,“局外人”这个词还是让人忍不住多想一层。工程师这个角色,一直以来都是造物的主角——写代码、搭框架、调参数,双手永远沾着机油的温度。而这一次,AI自己写完了训练框架,自己训出了新模型,人类被请到了观赛席。这不是替代,是一种安静的位置转换。当AI开始接手“制造AI”这件事,人类工程师接下来该做什么?可能是往后退一步,去看方向、定边界、问该不该。也可能是往前跨一步,去和AI协作,做那些一个人永远做不了的事。局外人不可怕,怕的是坐进观众席就不愿意再上场了。

好在,这场游戏的哨声,才刚刚吹响。

涛子聊ai,为你解锁ai理想!创作不踩坑,变现加速度。2026 风口正劲,让我们一起以 AI 为翼,让每一个ai梦想落地成真!