本地AI工作站崛起：英特尔双芯协同，缓解Token压力

发布时间：2026-04-27 20:05阅读：10

2026年，AI工作站的角色正迎来深层重塑：它不再只是辅助开发的工具，而是在企业侧承载数据安全与效率诉求的“本地AI工厂”。IDC预计，2026年工作站市场出货量将达66万台，同比增长5.2%。为适配不同体量与业务场景，AI工作站形态也在加速分化：一体机方案升温，并进一步延伸到更小巧的“迷你主机”和桌面级工控形态。在大模型与智能体应用持续拉动之下，面向AI工作站的芯片平台又出现了哪些新进展？

4月23日，英特尔在北京举行新一代AI工作站平台发布活动。英特尔中国区技术部总经理高宇宣布，针对AI工作站场景，英特尔带来两项关键新品：英特尔® 至强600工作站处理器，以及英特尔锐炫™ Pro B70、B65 GPU。

至强600为何能更快强化AI工作站能力？锐炫B70相较上一代有哪些性能跃迁与适用场景？英特尔中国区技术部总经理高宇、英特尔中国区显卡和AI高级产品总监徐金平，以及英特尔技术专家王巍巍带来了最新解读。

AI工作站市场加速放量，英特尔以至强平台支撑多形态部署

“当前，一方面用户对AI算力的渴求持续攀升；另一方面又希望算力平台更易落地、运维更省心。AI工作站的产品属性恰好契合这种矛盾需求：交互实时、上手友好、性能稳定，且不少工作站引入了服务器级能力，可充分覆盖企业AI推理与私有化部署的诉求。”高宇表示。

至强600处理器主要体现为三方面能力：1、高性能。以旗舰至强698X为例，最高配置达86个性能核（P-core），多线程性能相对上一代提升61%，最高睿频可到4.8GHz。无论是复杂科学计算、工程仿真，还是作为AI任务的调度中枢，这样的CPU能力都能保障系统稳定与高效。至强600每个核心集成英特尔AMX（高级矩阵扩展）引擎，并新增对FP16数据类型的原生支持，使其在AI推理与机器学习负载上相较前代最高提升17%；在图像降噪等特定场景中，速度甚至可提升4-5倍。

2、高内存。至强600系列最高可支持4TB ECC内存，提供8通道内存配置，并支持128条PCle5.0通道，结合芯片组为工作站带来更丰富且灵活的扩展空间——这对需要装载超大数据集、或并行运行多个巨型模型的企业级场景尤为关键。同时，至强600支持MRDIMM内存技术，显著提高数据传输速率：在至强600平台上MRDIMM速率可达8000 MT/s，相比标准DDR5 RDIMM的6400 MT/s，峰值带宽提升接近40%。

3、高可用。英特尔将服务器级RAS能力延展到工作站领域；同时围绕至强计算引擎，OneAPI、OpenVINO也可将底层AI能力封装为更易用的接口，降低算法迁移门槛。依托英特尔vPro® 技术体系，平台还支持多种管理能力、多密钥内存加密与一键恢复等企业级特性，以满足更灵活的运维需求。

“一个AI推理系统通常不是单一模型在工作，而是多模型组合叠加智能体分阶段调用，因此更依赖强大的CPU技术栈。至强600性能充足，可以用CPU承担部分小模型，把更大模型交由GPU处理，从而让至强600加持下的AI工作站整体性能实现显著提升。就平台综合实力而言，至强600可以说是AI工作站中非常强的一种选择。”高宇强调。

AI推理需求猛增，英特尔Pro B70带来跨代升级

与此同时，英特尔还发布了锐炫B70 GPU。该产品采用第二代Xe2架构，配备32GB GDDR6显存，拥有32个Xe核心，AI峰值算力可达367 TOPS，可在AI推理中支持更大规模模型与更长上下文窗口，覆盖图形渲染、通用并行计算及AI加速等专业工作负载。

32GB大显存使其能够更轻松地加载并运行诸如Qwen3.5-122B等百亿、千亿参数级大模型，并支持更长文本输入长度，这对智能体（Agent）等复杂应用尤为重要。

“以‘玩龙虾’为例，官方建议GPU至少要支持64K上下文窗口；要取得更理想效果，最好能达到80K、90K。32GB显存可支持93K上下文，对‘龙虾’场景非常友好。锐炫Pro B70的大显存、长窗口与高并发，再叠加其展示出的多种AIGC能力和‘养龙虾’能力，给大家留下了很深的印象。”高宇分析道。

英特尔公布的数据表明，相较竞品NVIDIA RTX Pro 4000，锐炫Pro B70在AI推理任务上具备明显优势：上下文窗口：可支持最高达2.2倍的更大上下文窗口。Token吞吐量：在多用户负载下吞吐量提升85%。首字延迟：首个Token生成延迟降至1/6.2，响应更迅速。英特尔中国区显卡和AI高级产品总监徐金平表示，锐炫B70 Pro的关键价值在于凭借大显存与高并发能力，让大型、复杂模型在本地工作站上也能顺畅运行；随着个人与企业智能体AI加速发展，英特尔以CPU+GPU的组合方案，尤其是“至强600+锐炫B70 Pro”，正是面向当下需求打造的配置方向。

联想展台展示了AI工作站ThinkStation P7，搭载两张Intel Arc ProB70专业显卡，可在本地高效运行z-image-turbo文生图与wan2.2-14B图生视频模型，显著提升图文视频内容生产效率。

在现场展区，深圳触动互联科技带来了企业智能体一体机。展台人员介绍称，依托新一代Xeon 600多核心与高内存等特性，可在企业本地部署高密度数字员工智能体集群；同时企业还可基于4卡B70在本地运行100B级参数规模大模型，与云端大脑形成互补，分别承担不同层级的企业任务。

← 上一篇：AI越强大，我越想弄明白“活着的意义” 下一篇：智启新程：中电普华首期AI电力场景培训启动 →