前Databricks AI掌门人计划将AI推理电费削减千倍

发布时间：2026-06-29 09:33阅读：2

原作者： Russell Brandom

导读

Russell Brandom 这篇 TechCrunch 报道表面上写的是 Unconventional AI 想用全新的 oscillator-based computing 架构，把 AI inference 的功耗降到传统方案的千分之一。对 Lets TrAI 读者更重要的是，这家公司押注的不是“再做一颗更快的芯片”，而是从计算架构层重写 AI 推理的能耗约束。

如果这条路成立，未来 AI 基础设施的竞争焦点就不只是模型能力和 GPU 供给，而是谁能把每一次调用的电力账单、功耗密度和部署成本一起打下来。

这家公司由 Databricks 前 AI 负责人 Naveen Rao 领衔。报道提到，Unconventional AI 刚发布首个模型 Un-0，是一个 image-generation system。重点不在于它做了一个新文生图模型，而在于它用软件模拟方式证明：基于全新 oscillator 架构的系统，也可以跑出接近主流 diffusion model 的结果。

也就是说，它先做的是“hello world 级别的架构可行性验证”。报道里明确写到，当前版本还运行在对自家未来芯片的 software simulation 上，真实芯片原理图会在后面释出。路线图不是卖单颗器件，而是逐步搭出完整 inference stack，再把它像普通 compute provider 一样对外供给。

Rao 给 TechCrunch 的判断非常直接：AI 扩张的硬约束正在从模型参数，转向能源。换句话说，算力并不只是“贵”，它正在变成部署规模的物理边界。

1. 推理能耗开始从运营成本问题，升级成产品边界问题过去很多团队把 inference cost 理解成 margin 问题，更多像 CFO 看板上的数字。现在 agent、实时交互和持续在线 workflow 越来越多，功耗直接决定一个产品能否以合理价格长期服务更多用户。能耗曲线如果压不下来，很多 AI-native 产品会先被账单拖住，而不是被模型质量拖住。

1. 推理能耗开始从运营成本问题，升级成产品边界问题

过去很多团队把 inference cost 理解成 margin 问题，更多像 CFO 看板上的数字。现在 agent、实时交互和持续在线 workflow 越来越多，功耗直接决定一个产品能否以合理价格长期服务更多用户。能耗曲线如果压不下来，很多 AI-native 产品会先被账单拖住，而不是被模型质量拖住。

2. 这不是替代 GPU 的普通创业故事，而是在赌新的计算范式很多基础设施公司做的是 chip packaging、network optimization 或者更高效的 serving software。Unconventional AI 想跳得更深一层，直接绕开传统数字计算范式，去押注 oscillator-based architecture。技术风险更高，但如果成立，护城河也会更厚，因为它改变的是底层物理实现方式，而不是软件层调优。

2. 这不是替代 GPU 的普通创业故事，而是在赌新的计算范式

很多基础设施公司做的是 chip packaging、network optimization 或者更高效的 serving software。Unconventional AI 想跳得更深一层，直接绕开传统数字计算范式，去押注 oscillator-based architecture。技术风险更高，但如果成立，护城河也会更厚，因为它改变的是底层物理实现方式，而不是软件层调优。

3. “先做 simulation 再做 chip”是一条更像模型公司的迭代路径它没有先拿硬件 tape-out 当第一性目标，而是先用软件模拟跑出一个可展示、可比较的模型结果。这种做法很像 AI 公司的产品验证方式：先证明 workload 能跑、结果能对齐、价值能表达，再往更重的硬件资本开支推进。

3. “先做 simulation 再做 chip”是一条更像模型公司的迭代路径

它没有先拿硬件 tape-out 当第一性目标，而是先用软件模拟跑出一个可展示、可比较的模型结果。这种做法很像 AI 公司的产品验证方式：先证明 workload 能跑、结果能对齐、价值能表达，再往更重的硬件资本开支推进。

4. 它映射出下一轮 AI infra 的真正主题：energy-limited scaling Rao 说“AI scaling is hard because of energy”，这句话值得记住。训练规模和数据规模还可以继续扩，但一旦 inference 进入更大规模商用，真正紧张的是电力、散热、机房密度和单位吞吐成本。行业可能会越来越多地从“多买一点 GPU”转向“换一种算”。

4. 它映射出下一轮 AI infra 的真正主题：energy-limited scaling

Rao 说“AI scaling is hard because of energy”，这句话值得记住。训练规模和数据规模还可以继续扩，但一旦 inference 进入更大规模商用，真正紧张的是电力、散热、机房密度和单位吞吐成本。行业可能会越来越多地从“多买一点 GPU”转向“换一种算”。

对做 AI 应用和 agent 的团队来说，这条新闻最大的提醒是：未来差异化不只来自模型选择，也来自你跑模型的经济性。谁能把推理层做到更低延迟、更低功耗、更可预测，谁就能把用户价位打得更 aggressive，把 agent 调用频率提得更高，把产品体验做得更连续。

对基础设施投资和供应链来说，它也说明一个趋势：下一波赢家未必只来自云厂商和 GPU 厂，也可能来自能把特定 AI workload 写进硬件物理结构的人。当推理进入规模化时代，architecture 本身就会变成产品策略的一部分。

当然，这类故事风险也很高。千倍功耗改善现在仍是 ambitious claim，真实芯片、制造良率、生态兼容性和客户迁移成本都还没被验证。但正因为问题足够大，行业才会认真对待这种“从底层重做”的路线。

一句结论

Unconventional AI 真正想改写的，不是某个模型 benchmark，而是 AI 推理时代最贵的一张账单: 能耗。

← 上一篇：南昌工学院AI与短漫剧产业学院推进产教融合举办'AI+短剧'剧本创作师资培训下一篇：智能制造核心：MES+AI如何重塑工厂决策力 →