本地AI工作站崛起:英特尔双芯协同,缓解Token压力
2026年,AI工作站的角色正迎来深层重塑:它不再只是辅助开发的工具,而是在企业侧承载数据安全与效率诉求的“本地AI工厂”。IDC预计,2026年工作站市场出货量将达66万台,同比增长5.2%。为适配不同体量与业务场景,AI工作站形态也在加速分化:一体机方案升温,并进一步延伸到更小巧的“迷你主机”和桌面级工控形态。在大模型与智能体应用持续拉动之下,面向AI工作站的芯片平台又出现了哪些新进展?
4月23日,英特尔在北京举行新一代AI工作站平台发布活动。英特尔中国区技术部总经理高宇宣布,针对AI工作站场景,英特尔带来两项关键新品:英特尔® 至强600工作站处理器,以及英特尔锐炫™ Pro B70、B65 GPU。
至强600为何能更快强化AI工作站能力?锐炫B70相较上一代有哪些性能跃迁与适用场景?英特尔中国区技术部总经理高宇、英特尔中国区显卡和AI高级产品总监徐金平,以及英特尔技术专家王巍巍带来了最新解读。
AI工作站市场加速放量,英特尔以至强平台支撑多形态部署
“当前,一方面用户对AI算力的渴求持续攀升;另一方面又希望算力平台更易落地、运维更省心。AI工作站的产品属性恰好契合这种矛盾需求:交互实时、上手友好、性能稳定,且不少工作站引入了服务器级能力,可充分覆盖企业AI推理与私有化部署的诉求。”高宇表示。
至强600处理器主要体现为三方面能力:1、高性能。以旗舰至强698X为例,最高配置达86个性能核(P-core),多线程性能相对上一代提升61%,最高睿频可到4.8GHz。无论是复杂科学计算、工程仿真,还是作为AI任务的调度中枢,这样的CPU能力都能保障系统稳定与高效。至强600每个核心集成英特尔AMX(高级矩阵扩展)引擎,并新增对FP16数据类型的原生支持,使其在AI推理与机器学习负载上相较前代最高提升17%;在图像降噪等特定场景中,速度甚至可提升4-5倍。
2、高内存。至强600系列最高可支持4TB ECC内存,提供8通道内存配置,并支持128条PCle5.0通道,结合芯片组为工作站带来更丰富且灵活的扩展空间——这对需要装载超大数据集、或并行运行多个巨型模型的企业级场景尤为关键。同时,至强600支持MRDIMM内存技术,显著提高数据传输速率:在至强600平台上MRDIMM速率可达8000 MT/s,相比标准DDR5 RDIMM的6400 MT/s,峰值带宽提升接近40%。
3、高可用。英特尔将服务器级RAS能力延展到工作站领域;同时围绕至强计算引擎,OneAPI、OpenVINO也可将底层AI能力封装为更易用的接口,降低算法迁移门槛。依托英特尔vPro® 技术体系,平台还支持多种管理能力、多密钥内存加密与一键恢复等企业级特性,以满足更灵活的运维需求。
“一个AI推理系统通常不是单一模型在工作,而是多模型组合叠加智能体分阶段调用,因此更依赖强大的CPU技术栈。至强600性能充足,可以用CPU承担部分小模型,把更大模型交由GPU处理,从而让至强600加持下的AI工作站整体性能实现显著提升。就平台综合实力而言,至强600可以说是AI工作站中非常强的一种选择。”高宇强调。
AI推理需求猛增,英特尔Pro B70带来跨代升级
与此同时,英特尔还发布了锐炫B70 GPU。该产品采用第二代Xe2架构,配备32GB GDDR6显存,拥有32个Xe核心,AI峰值算力可达367 TOPS,可在AI推理中支持更大规模模型与更长上下文窗口,覆盖图形渲染、通用并行计算及AI加速等专业工作负载。
32GB大显存使其能够更轻松地加载并运行诸如Qwen3.5-122B等百亿、千亿参数级大模型,并支持更长文本输入长度,这对智能体(Agent)等复杂应用尤为重要。
“以‘玩龙虾’为例,官方建议GPU至少要支持64K上下文窗口;要取得更理想效果,最好能达到80K、90K。32GB显存可支持93K上下文,对‘龙虾’场景非常友好。锐炫Pro B70的大显存、长窗口与高并发,再叠加其展示出的多种AIGC能力和‘养龙虾’能力,给大家留下了很深的印象。”高宇分析道。
英特尔公布的数据表明,相较竞品NVIDIA RTX Pro 4000,锐炫Pro B70在AI推理任务上具备明显优势:上下文窗口:可支持最高达2.2倍的更大上下文窗口。Token吞吐量:在多用户负载下吞吐量提升85%。首字延迟:首个Token生成延迟降至1/6.2,响应更迅速。英特尔中国区显卡和AI高级产品总监徐金平表示,锐炫B70 Pro的关键价值在于凭借大显存与高并发能力,让大型、复杂模型在本地工作站上也能顺畅运行;随着个人与企业智能体AI加速发展,英特尔以CPU+GPU的组合方案,尤其是“至强600+锐炫B70 Pro”,正是面向当下需求打造的配置方向。
联想展台展示了AI工作站ThinkStation P7,搭载两张Intel Arc ProB70专业显卡,可在本地高效运行z-image-turbo文生图与wan2.2-14B图生视频模型,显著提升图文视频内容生产效率。
在现场展区,深圳触动互联科技带来了企业智能体一体机。展台人员介绍称,依托新一代Xeon 600多核心与高内存等特性,可在企业本地部署高密度数字员工智能体集群;同时企业还可基于4卡B70在本地运行100B级参数规模大模型,与云端大脑形成互补,分别承担不同层级的企业任务。