AI算力“咽喉”之争:Switch芯片版图与国产替代
Scale-Up 和 Scale-Out 到底是什么意思?先把概念弄清楚,阅读后文会更顺畅。Scale-Up:指将单个机柜或服务器内部的 GPU、算力与带宽尽量拉满,依托机内高速互连提升单机能力,重点在低延迟和高吞吐,追求“单点极致”。Scale-Out:指把大量服务器或机柜通过网络组织成超大规模集群,通过增加节点数量来扩展总体算力,更适合超大模型训练。概括来说,一个偏向把单机做到极强,一个则靠海量服务器/机柜构建庞大算力网络。芯科技圈从东吴证券《Switch芯片研究框架(一):GPU-GPU互联,从Sc
AI集群互联新篇章:国产网卡挑战与机遇
本期嘉宾李文信凌波智芯创始人、天津大学长聘教授、国家级青年人才嘉宾简介李文信,天津大学长聘教授、国家级青年人才、凌波智芯创始人。他作为国家级青年人才,长期钻研AI集群优化和RDMA网络技术,致力于推动大规模智能计算集群中RDMA网卡关键技术的研究与应用创新。他在多个顶级学术会议上发表了超过50篇论文,其中在SIGCOMM和NSDI的发表是天津大学的首次记录。2024年,他创办了凌波智芯科技有限公司,专注于AI互联核心技术及设备研发,旨在通过高性能AI网卡连接规模达十万卡的算力集群,力求打造中国自主的AI网