AI底层架构揭秘
上一期我们讨论了RL,它主要处理大模型"持续优化"的课题。然而深入探究,还存在一个更为根本的议题:
👉 这些强悍的AI功能,其根基究竟是什么?
由此便引出今日的核心话题——AI Infra。
AI Infra即Artificial Intelligence Infrastructure的简称,中文通常译为"AI基础设施"。
究竟何谓AI基础设施?
不妨这样来理解:
AI Infra,实则为支撑大模型运转与进化的底层架构。
若将大模型视作"应用",那AI Infra便是:
👉 承载这些应用的"基石"
不妨采用一个更形象的比喻:
回顾互联网时代:
App是用户可见的产品形态
而服务器、云计算与网络,则构成其底层支撑
日常中你或许不会直接触碰这些,然而:
👉 倘若缺失它们,所有服务都将瘫痪
AI时代亦然如此。
我们日常使用的各类服务:
聊天模型
文生图
智能助理
其背后均由完整的AI Infra体系所支撑。
那么AI Infra具体涵盖哪些内容?
可大致划分为三个层级:
第一层:算力层(Compute) 👉 GPU、计算集群、数据中心
此乃最基础的资源,堪比"电力"
第二层:数据与存储(Data) 👉 数据集、数据清洗、数据管控
无数据则模型无从谈起
第三层:模型与框架(Model & Framework) 👉 训练框架、推理引擎、模型部署平台
例如常见的各类训练/推理系统
换言之:
AI Infra并非单指某项技术,而是完整的支撑体系
为何AI Infra如今如此关键?
缘由在于大模型演进正面临一个核心制约:
👉 成本压力
单次模型训练或需数千万乃至上亿美金投入
单次推理请求亦在持续损耗算力资源
因此当下的竞争焦点,已不再局限于:
👉 谁的模型更强大
而是转向:
👉 谁能以更高效率、更低成本运行模型
若将以下概念类比:
Token为"计费单元"
Embedding是"理解模式"
Prompt乃"交互手段"
RAG即"知识获取"
Agent为"任务执行"
RL是"优化方法"
那么AI Infra所解决的正是:
👉 这些功能"能否实现规模化运转"
互联网时代我们争夺的是"流量",而AI时代我们竞逐的则是:
👉 算力 + 数据 + 系统综合实力
用一句话概括:
AI Infra,正是推动大模型从"可用"迈向"用得起、用得多"的根基。
关注我,每日解锁一个新概念。