单芯片算力突破896万亿次,中昊芯英发布TPU新品「须臾」
IT之家 6 月 30 日消息,中昊芯英今日正式推出新一代全自研高性能 TPU AI 专用芯片「须臾」,软硬件一体化智算底座「泰则 2.0」也于今日同步问世。
据官方介绍,须臾的单芯片混合精度浮点运算能力高达 896 TFLOPS,性能达到前代产品「刹那」的 3 倍;8-bit 推理算力可达 1792 TOPS,能够满足海量 token 高并发推理需求。该芯片在显存容量、片内互联带宽方面均有显著升级,支持超长上下文窗口。单卡典型功耗为 600W,相较传统算力芯片能耗下降 50%,有力推动绿色数据中心发展。
值得一提的是,须臾从芯片 IP 核、专用指令集、底层算子加速库到整机系统软件均实现完全自主开发,不存在对海外核心技术的依赖。可满足政务、金融、电力等关键领域的安全合规需求。
「泰则 2.0」作为高性能智算平台的标准最小计算单元,集成双路高性能 CPU 与 8 颗高性能 TPU 处理单元,物理形态表现为 1 台通用 CPU 服务器搭配 1 台高性能 TPU 算力扩展设备,总算力达到 7.168P(IT之家注:混合精度),同等负载下整机功耗仅为传统 GPU 服务器的 80%。
此外,该平台在软件层面实现了对主流 AI 框架的全面兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具,训练侧适配 DeepSpeed、Megatron-LM 等分布式训练框架;已完成 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言模型及多模态模型的深度适配,便于开发者快速实现模型迁移部署。
