AI实验室深度解析:OpenAI与Anthropic算力成本分析
每机柜配备72块B200 GPU及36颗Grace CPU
整机柜总功耗达120千瓦
FP4模式下峰值算力为1,440 PFLOPs
FP8模式下的峰值算力为720 PFLOPs
FP16峰值性能可达360 PFLOPs
搭载13.5 TB HBM3e显存
单机柜预估造价约300万美元
缩写定义
完整名称
对应FLOPs数值
千次浮点运算
10的3次方
百万次浮点运算
10的6次方
十亿次浮点运算
10的9次方
万亿次浮点运算
10的12次方
千万亿次浮点运算
10的15次方
百亿亿次浮点运算
10的18次方
十万亿亿次浮点运算
10的21次方
输入:$5 / 100万 tokens
输出:$25 / 100万 tokens
输入:$5 / 100万 tokens
输出:$30 / 100万 tokens
模型参数
具体数值