前Databricks AI掌门人计划将AI推理电费削减千倍
原作者: Russell Brandom
导读
Russell Brandom 这篇 TechCrunch 报道表面上写的是 Unconventional AI 想用全新的 oscillator-based computing 架构,把 AI inference 的功耗降到传统方案的千分之一。对 Lets TrAI 读者更重要的是,这家公司押注的不是“再做一颗更快的芯片”,而是从计算架构层重写 AI 推理的能耗约束。
如果这条路成立,未来 AI 基础设施的竞争焦点就不只是模型能力和 GPU 供给,而是谁能把每一次调用的电力账单、功耗密度和部署成本一起打下来。
这家公司由 Databricks 前 AI 负责人 Naveen Rao 领衔。报道提到,Unconventional AI 刚发布首个模型 Un-0,是一个 image-generation system。重点不在于它做了一个新文生图模型,而在于它用软件模拟方式证明:基于全新 oscillator 架构的系统,也可以跑出接近主流 diffusion model 的结果。
也就是说,它先做的是“hello world 级别的架构可行性验证”。报道里明确写到,当前版本还运行在对自家未来芯片的 software simulation 上,真实芯片原理图会在后面释出。路线图不是卖单颗器件,而是逐步搭出完整 inference stack,再把它像普通 compute provider 一样对外供给。
Rao 给 TechCrunch 的判断非常直接:AI 扩张的硬约束正在从模型参数,转向能源。换句话说,算力并不只是“贵”,它正在变成部署规模的物理边界。
1. 推理能耗开始从运营成本问题,升级成产品边界问题 过去很多团队把 inference cost 理解成 margin 问题,更多像 CFO 看板上的数字。现在 agent、实时交互和持续在线 workflow 越来越多,功耗直接决定一个产品能否以合理价格长期服务更多用户。能耗曲线如果压不下来,很多 AI-native 产品会先被账单拖住,而不是被模型质量拖住。
1. 推理能耗开始从运营成本问题,升级成产品边界问题
过去很多团队把 inference cost 理解成 margin 问题,更多像 CFO 看板上的数字。现在 agent、实时交互和持续在线 workflow 越来越多,功耗直接决定一个产品能否以合理价格长期服务更多用户。能耗曲线如果压不下来,很多 AI-native 产品会先被账单拖住,而不是被模型质量拖住。
2. 这不是替代 GPU 的普通创业故事,而是在赌新的计算范式 很多基础设施公司做的是 chip packaging、network optimization 或者更高效的 serving software。Unconventional AI 想跳得更深一层,直接绕开传统数字计算范式,去押注 oscillator-based architecture。技术风险更高,但如果成立,护城河也会更厚,因为它改变的是底层物理实现方式,而不是软件层调优。
2. 这不是替代 GPU 的普通创业故事,而是在赌新的计算范式
很多基础设施公司做的是 chip packaging、network optimization 或者更高效的 serving software。Unconventional AI 想跳得更深一层,直接绕开传统数字计算范式,去押注 oscillator-based architecture。技术风险更高,但如果成立,护城河也会更厚,因为它改变的是底层物理实现方式,而不是软件层调优。
3. “先做 simulation 再做 chip”是一条更像模型公司的迭代路径 它没有先拿硬件 tape-out 当第一性目标,而是先用软件模拟跑出一个可展示、可比较的模型结果。这种做法很像 AI 公司的产品验证方式:先证明 workload 能跑、结果能对齐、价值能表达,再往更重的硬件资本开支推进。
3. “先做 simulation 再做 chip”是一条更像模型公司的迭代路径
它没有先拿硬件 tape-out 当第一性目标,而是先用软件模拟跑出一个可展示、可比较的模型结果。这种做法很像 AI 公司的产品验证方式:先证明 workload 能跑、结果能对齐、价值能表达,再往更重的硬件资本开支推进。
4. 它映射出下一轮 AI infra 的真正主题:energy-limited scaling Rao 说“AI scaling is hard because of energy”,这句话值得记住。训练规模和数据规模还可以继续扩,但一旦 inference 进入更大规模商用,真正紧张的是电力、散热、机房密度和单位吞吐成本。行业可能会越来越多地从“多买一点 GPU”转向“换一种算”。
4. 它映射出下一轮 AI infra 的真正主题:energy-limited scaling
Rao 说“AI scaling is hard because of energy”,这句话值得记住。训练规模和数据规模还可以继续扩,但一旦 inference 进入更大规模商用,真正紧张的是电力、散热、机房密度和单位吞吐成本。行业可能会越来越多地从“多买一点 GPU”转向“换一种算”。
对做 AI 应用和 agent 的团队来说,这条新闻最大的提醒是:未来差异化不只来自模型选择,也来自你跑模型的经济性。谁能把推理层做到更低延迟、更低功耗、更可预测,谁就能把用户价位打得更 aggressive,把 agent 调用频率提得更高,把产品体验做得更连续。
对基础设施投资和供应链来说,它也说明一个趋势:下一波赢家未必只来自云厂商和 GPU 厂,也可能来自能把特定 AI workload 写进硬件物理结构的人。当推理进入规模化时代,architecture 本身就会变成产品策略的一部分。
当然,这类故事风险也很高。千倍功耗改善现在仍是 ambitious claim,真实芯片、制造良率、生态兼容性和客户迁移成本都还没被验证。但正因为问题足够大,行业才会认真对待这种“从底层重做”的路线。
一句结论
Unconventional AI 真正想改写的,不是某个模型 benchmark,而是 AI 推理时代最贵的一张账单: 能耗。