Meta自研AI推理芯片:四代产品战略解析
Meta在人工智能领域采取了战略性投入,历时数年潜心研发,专注于打造基于RISC-V架构、采用模块化设计并能快速迭代的推理专用芯片。
MTIA是Meta旗下的人工智能加速器系列,随着公司发布新的硬件路线图,其四代产品的全貌终于清晰展现:MTIA 300、400、450以及500。
许多人或许会困惑:为何Meta不涉足训练芯片领域?原因很直接,模型训练并非Meta最核心的业务需求。
Meta的日常运营高度依赖于其排名与推荐系统。每日,全球数十亿用户在Facebook、Instagram和WhatsApp上的每一次滑动浏览、每一次点击互动,其背后都有一套复杂的推荐算法在进行实时计算。
这套系统真正需要的是什么?并非极致的计算能力,而是处理海量、高频的推理任务。
即便在生成式AI兴起之后,这一根本逻辑并未改变,只是推理任务的规模变得更为庞大。
Meta的观点是:与其将训练芯片的强大算力用于运行推理任务,不如专门为推理场景设计芯片。用他们自己的话来说,这是“针对自身特定业务需求进行深度优化的硬件”——或许不是性能最强的,但却是最契合实际应用的。
MTIA平台构建于行业标准的软件生态之上,原生支持PyTorch、vLLM、Triton等主流框架,并遵循OCP开放计算项目硬件标准。这些策略选择使得MTAI的部署成本远低于构建一套完全封闭的自研体系。
●MTIA 300:奠定基础的首代产品
2024年,Meta推出了其第一代MTIA加速器——MTIA 300。
这款芯片的设计目标十分明确:加速排名模型和推荐模型的推理过程。在生成式AI成为行业热点之前,这两类模型是Meta最大的算力消耗来源。