市政部门逆袭:里约 IT 公司开源模型硬刚 GPT-5.5
今日凌晨,AI 界被一张 HuggingFace 的模型截图彻底引爆。主角并非 OpenAI 或谷歌的新作,而是一行令人大跌眼镜的开发者署名:
"Prefeitura do Rio de Janeiro"——即里约热内卢市政府。
绝非误读。这家肩负巴西城市 IT 基建重任的市政企业,在未做任何预热、未发一篇论文、未开一场发布会的前提下,径直在 HuggingFace 上线了一款参数量达 3970 亿的开源大模型,随即——它竟将一众硅谷巨头的作品甩在身后。
该企业名为 IplanRIO,全称为"里约热内卢市政信息与规划公司"。浏览其日常业务列表,你会发现其核心职能涵盖:城市交通信号系统维保、政府官网建设、垃圾清运调度系统、市民热线后台支撑等……
通俗来讲,这便是一个巴西版的"城市信息化中枢"。其本职工作与大模型训练可谓风马牛不相及。
然而正是这般机构,于 6 月 14 日突兀地在 HuggingFace 推出了 Rio 3.5 Open 397B 模型。发布前夕,就连巴西本土的 AI 专家都坦言"闻所未闻此项目"。
随后,各界开始运行评测。
紧接着,全场陷入沉寂。
先聊聊硬核参数。
Rio 3.5 依托阿里通义千问 Qwen 3.5 397B 基座进行后训练,采纳 MoE(混合专家)架构,总参数量约 3970 亿,单 token 推理仅激活约 170 亿参数——这意指其推理开销远低于同体量全量模型。
上下文窗口支持百万 token 级别,轻松容纳三部《三体》绰绰有余。
开源协议选用 MIT 许可证——此为最宽松的开源协定之一,意味着任何个人或企业均可将其用于商业产品,无需支付分文。
但这些尚非最震撼之处。真正令人倒吸凉气的是评测数据。
在 SWE-Bench Pro(软件工程智能体编程基准)测试中,Rio 3.5 斩获 58.1 分,而 Qwen 3.5 原版仅得 50.9——相对提升近乎翻倍。在 IMOAnswerBench(数学推理基准)上,Rio 3.5 得分 89.5,原版 Qwen 3.5 仅为 80.9——同样接近翻倍增长。
整体表现上,其在多项基准测试中力压同为开源模型的 Qwen 3.7 Plus,跃居全球第一阵营,足以与 GPT-5.5、Claude Opus 4.7 等顶尖闭源模型正面对决。
换算成大白话即是:一个掌管红绿灯与垃圾桶的市政 IT 部门,利用阿里开源基座进行后训练,打造出了一款在多项测试中能与 OpenAI、Anthropic 旗舰产品抗衡的模型。
IplanRIO 凭何仅靠后训练便将模型性能提升近一倍?
答案隐匿于名为 SwiReasoning 的推理框架之中。
这是一种"免训练推理方案"——无需重新微调模型,无需耗费 GPU 燃烧数月。其核心机理极为精妙:依据输入问题的信息熵自动甄选推理模式。
若问题繁杂、不确定性高——例如数学证明、代码逻辑分析——它会自动切换至显式思维链,逐步推导,让你清晰目睹思考路径。
若问题相对简易、信息充裕——例如翻译、摘要——它会自动转入隐式向量空间推理,在后台极速完成运算,节省 token、节约时间、降低成本。
简言之即:该深思时深思,能省力时省力——但省力之际亦不损质量。
此框架非 IplanRIO 首创,而是基于学术界 2025 年公开论文落地实现。但关键点在于:他们证实了你无需成为 OpenAI 或谷歌,只需一套机智的后训练策略与一个优质开源基座。
消息扩散后,AI 圈的反应颇为精彩。
HuggingFace 联合创始人兼 CEO Clem Delangue 特地发文,直言此事印证了一个重要真理:
"AI 的未来绝非由少数巨头独占。开源路径能让里约市此类非传统机构投身前沿模型构建。"
有趣的是,就在同一周,另有团队基于 Qwen 3.5 打造了后训练模型 Nex-N2-Pro 397B,性能同样可比肩 GPT-5.5 层级。
这预示着什么?
阿里 Qwen 3.5 正演变为"开源界的 GPT 底座"——谁获取它、做好后训练,谁便有望铸就顶级模型。昔日需耗资数十亿美元方能拥有的能力,如今一家市政 IT 部门亦可达成。
Rio 3.5 的问世之所以引发 AI 界震荡,不只因其性能——当下开源社区已涌现不少强力模型。
真正令人不安(抑或兴奋)的,是它揭示的一种趋势:大模型研发的门槛正以肉眼可见之势崩塌。
去年,训练一款前沿大模型 requisite:一支数百人的顶尖 AI 研发团队、数亿美元资金、数万张 H100 GPU、复杂的数据流水线。全球具备此能力的组织,屈指可数。
今年,公式已变:寻觅一个优质开源基座(如 Qwen 3.5),应用一套聪慧的后训练策略(如 SwiReasoning),继而开源反哺社区。
巴西一家主管市政 IT 的企业能办到的事,全球还有多少团队能够复刻?
2024 年我们热议"AI 军备竞赛",2025 年探讨的是"模型商品化"。待到 2026 年 6 月,一家巴西市政部门用行动告知世界:顶尖 AI 能力已非少数巨头的专属特权。
这或许才是硅谷最为恐惧的叙事——并非被中国赶超,亦非被欧洲超越,而是被一个你从未耳闻的市政 IT 部门实现弯道超车。
🔗 延伸阅读
• Rio 3.5 Open 397B 官方 HuggingFace:huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
• SwiReasoning 论文:arxiv.org/abs/2510.05069
• 同周另一基于 Qwen 3.5 的后训练模型:Nex-N2-Pro 397B(性能同样比肩 GPT-5.5 级别)
本文由 WorkBuddy AI 辅助撰写 | 数据