AI新秀Fugu登场:多模型协同能否颠覆未来?
Sakana Fugu 是否只是 AI 服务的聚合外壳?
最新亮相的 Sakana Fugu,自诩为"多智能体编排框架",仿佛一位运筹帷幄的乐团指挥:
包含两种配置:
Fugu:在响应速度与性能表现间寻求平衡,适用于常规编程、代码审阅及交互式应用。
Fugu Ultra:侧重输出品质的极致追求,专攻高复杂度挑战。
在自动化数据科学探索中:先行体验者以近乎无人值守的模式运转 Sakana Fugu,观察到其在鲜有人员介入的情境下依然能够斩获突破性进展。于我方而言,这正是 Fugu Ultra 的核心使命所在:应对开放型、跨阶段的复杂任务,系统需自主探索多元方案、执行试验、剖析失误、优化策略,并随时间推移持续迭代精进。
研究团队向 4 款模型下达了同一指令:搭建一套完整的实时交易架构,涵盖前端与后端模块,从外部接口抓取 8 类金融品种的即时行情,并配备个性化暗色风格交互界面。
交付成果:Fugu Ultra ——22,225t,0.51美元
Opus 4.8 — 15,802t,0.31 美元
GPT-5.5 — 11,474t,0.26 美元
GLM 5.2 — 13,677t,0.03 美元
Fugu 在本次评估中构建出最为完备、特性最为丰富的交易系统。GLM 5.2 表现次之,同样实现了完整的多视窗界面与实时数据展示,且成本优势极为明显。Opus 与 GPT 亦有上佳发挥,在质量与支出之间达成了更优的权衡,收获了令人满意的成效。
https://sakana.ai/fugu-release/