标签
昇腾超节点全系适配DeepSeek V4,华为官宣性能突破

昇腾超节点全系适配DeepSeek V4,华为官宣性能突破

IT之家4月24日报道,今日早间,DeepSeek-V4模型预览版正式对外发布并开启开源。华为官方紧接着发布声明,凭借双方在芯片与模型技术上的深度合作,昇腾超节点全系列已完成对DeepSeek V4系列模型的适配支持。据官方介绍,昇腾950借助融合kernel与多流并行技术,有效减少了Attention机制的计算及访存成本,显著增强了推理效率,配合多样化的量化策略,达成了DeepSeek V4模型的高吞吐、低延迟部署。昇腾A3超节点系列同样完成全面适配,并针对用户快速微调需求,推出了基于该平台的训练方案示

2026-04-24 22:33:24  |  5 阅读

国产算力崛起:AI芯片三大发展方向

伴随人工智能技术的迅猛演进,算力已崛起为推动数字经济与科技创新的核心动力源。面对全球AI竞赛日趋激烈、高端芯片供应链风险攀升的局面,国产算力芯片在自主可控与大规模商用方面正迎来重要转折点。本报告全面剖析了GPU与ASIC两条技术路径的发展脉络与落地场景,深度解读了国产算力芯片在性能、功耗、性价比等领域的不断跃进,并预判:2026年,国产算力将开启从点到面的规模化爆发期。报告认为,虽然英伟达等国际巨头依然主导全球GPU市场,但在美国技术封锁与国内扶持政策双重作用下,国产AI芯片的替代窗口正在迅速扩大。以华为

2026-04-24 05:39:17  |  7 阅读

阿里云出席 2026 Open AI Infra Summit:借 UALink 2.0 与 CXL 革新 AI 超节点互联

4月9日至10日,2026 Open AI Infra Summit在北京盛大开幕。该大会由GCC-Open AI Infra社区承办,聚焦从兆瓦级算力到GW级数据中心的热点,涵盖高速互联、800V高压供电、先进液冷、超节点生态及性能测试等关键领域。阿里云服务器研发团队在高速互联及超节点生态论坛分别进行技术分享,全方位展现了阿里云在AI基础设施互联领域的技术实力与生态布局。UALink 2.0 协议迭代:打破 Scale Up 发展瓶颈在高速互联论坛上,阿里云服务器研发架构师邱宇弟发表了题为“突破 Sca

2026-04-13 17:35:44  |  3 阅读

AI算力峰会嘉宾阵容揭晓,OpenCLaw议程同步发布

九位专家深度解读AI算力技术任职于芯桥半导体,专职负责GPGPU芯片的技术方案与生态体系搭建,业务覆盖机器人产业生态培育、超节点算力升级及光电计算融合等领域。率领团队设计机器人算力架构与软硬件协同方案,充分挖掘GPGPU芯片在视觉处理、运动控制与AI推理中的加速效能;打造高性能算力超节点平台,精进多节点GPGPU资源调度能力,保障大模型训练与推理的高效率、低延迟;驱动光电计算融合系统研发,将GPGPU芯片与光芯片矩阵运算深度整合,实现复杂任务的高效处理。统筹解决方案团队,贯穿芯片能力到系统落地提供全链路支

2026-04-11 14:51:15  |  6 阅读

共探AI基础设施新趋势|灵达科技邀您出席2026 Open AI Infra Summit

主题演讲:面向超节点的下一代网卡技术演进方向伴随大模型迈向万亿级参数,超节点正逐步成为算力体系的关键核心。超节点规模的持续跃升,也让 Scale-out 网络承受更大压力:传统 RDMA 网络由于负载分布不均以及 Incast 拥塞问题,造成吞吐能力明显下滑,进而成为算力释放过程中的新障碍。抖音集团创新推出 VeROCE 技术,针对上述难题进行突破;灵达新一代 AI 网卡则通过重塑协议栈、引入智能多路径机制和精细化拥塞控制,实现端侧与网络侧的深度协同。灵达科技产品经理武晓军将于 4 月 10 日在超节点生

2026-04-08 20:21:14  |  5 阅读

莫仕亮相2026峰会 共话AI算力互联新趋势

在本次盛会上,莫仕系统架构总监贾功贤将发表题为《AI 超节点互联架构趋势分析》的演讲。他将深入探讨当前AI算力基础设施面临的挑战以及未来的演进方向。随着大模型训练和推理对算力密度、通信带宽及传输时延提出了极高要求,传统服务器互联架构已无法满足万卡级AI集群的高效协同需求,因此,AI超节点成为了突破算力瓶颈的关键路径。贾功贤将重点分享关于超节点Scale-Up与Scale-Out架构的演变、高速信号传输技术的迭代以及异构计算互联的优化。他将详细解读224G/448G高速互连、XPO、CPO共封装光学及液冷高

2026-04-08 20:07:46  |  6 阅读

本周五大科技趋势:算力革新、脑机商用、AI经济转型

趋势1:算力“超节点”重塑AI基础设施格局随着大模型推理需求呈指数增长,单一计算节点已难承其重。“超节点”技术顺势崛起——借助高速互联架构,将数十至数百颗GPU整合为统一内存空间、低延迟、高吞吐的协同运算单元。中科曙光推出搭载40颗GPU的中型“超节点”,清微智能携手智源研究院构建含4096颗可重构芯片的超级集群。券商预测,2027至2028年间,“超节点”市场渗透率将由10%-20%飙升至50%-60%。从理论构想到产品落地再到规模化部署,“超节点”正逐步确立为下一代算力基建标准。趋势2:脑机接口迈入“

2026-04-04 07:16:48  |  7 阅读

共创未来 AI 基础设施 | 新华三邀您共赴 2026 Open AI Infra 峰会

作为 GCC-Open AI Infra 的核心成员,新华三积极参与社区的线上线下活动。在益企研究院牵头编制并发布的《AIDC 基础设施规范(V0.8)》中,新华三全程参与了规范的制定、讨论和迭代,为规范的实施与应用做出了重要贡献。此外,在《GCC 液冷整机柜系统架构设计规范-A 型》的编撰过程中,新华三也发挥了重要作用。基于字节跳动提供的“大禹 2.0 整机柜”方案,新华三与社区成员企业共同以开放共创的方式,经过数月的努力,最终发布了该规范,并将在 2026 Open AI Infra Summit 上

2026-04-03 13:42:26  |  5 阅读

日均140万亿词元调用引爆AI产业新赛道

新华社北京4月1日电《经济参考报》4月1日刊发记者郭倩采写的文章《我国日均词元调用量超140万亿 企业加码“词元经济”产业链布局》。文章称,数据显示,今年3月,我国日均词元(Token)调用量已经超过140万亿,两年增长超千倍。词元调用量的激增,既印证了人工智能应用场景在不断深化,也催生了新的机遇——相关企业围绕高性能算力供给、词元经营服务、高质量数据集等“词元经济”产业链加速布局。 所谓词元,是大模型处理信息的最小信息单元,例如,日常工作生活中每一次向AI提问、使用AI生成内容,都是在调用词元。特别是,

2026-04-01 09:15:13  |  7 阅读

词元调用量激增 企业布局“词元经济”产业链

数据显示,今年3月,我国日均词元(Token)调用量已突破140万亿,两年内增长超千倍。词元调用量的迅猛增长,不仅反映了人工智能应用场景的不断拓展,也催生了新的发展机遇——相关企业正围绕高性能算力供给、词元运营服务、高质量数据集等“词元经济”产业链加速布局。 所谓词元,是大模型处理信息的基本单位,例如,日常工作生活中每一次向AI提问或使用AI生成内容,都是在调用词元。特别是,今年以来“龙虾”等智能体的爆发式增长,显著推高了词元消耗量。 “今年1月底以来,部分模型企业实现了20天收入超过2025年全年收入的

2026-04-01 08:58:04  |  9 阅读

上海AI实验室发布《超节点技术体系白皮书》

近年来,大模型持续迭代与AI for Science的蓬勃发展,正将算力基础设施推向新一轮系统性承压阶段。模型参数量、上下文窗口、并行计算复杂度及科研求解规模持续攀升,使得传统以单台服务器为单元、依赖局部器件升级的扩展范式,愈发难以兼顾带宽、时延、内存容量、系统可靠性及运维效率等多重硬性约束。对企业和产业界而言,下一代算力建设已远非简单‘采购更高性能芯片’或‘堆叠更多计算节点’所能解决,而演变为一场在成本、效能、稳定性、交付周期与长期演进能力之间寻求全新系统平衡的深层变革。这一转变不仅驱动技术路径重构,更

2026-03-29 19:41:47  |  7 阅读