AI竞赛终点:成本的较量
在21世纪,人工智能(AI)作为一项基础技术,将深刻影响人类社会的发展进程,其能力将渗透到社会各个角落,极大地提升社会效率并重塑社会运作模式。智能文明时代正以前所未有的速度向我们走来。那么,什么才是决定人工智能最终竞争力的关键因素呢?长期以来,我们普遍认为“算力即国力”,并将算力视为重塑AI格局的根本。算力,顾名思义,需要海量的芯片和算卡堆叠,并且这些硬件需要具备极高的性能。然而,经过近几年的飞速发展,人工智能正日益成熟,其竞争焦点正从芯片、算卡和大型模型的比拼,以及模型训练本身,逐渐转向应用能力的较量。
英特尔:让CPU撑起AI代理时代
在 2024 年以前,AI 的关键任务往往集中在“大语言模型(LLM)的训练”上,那时 GPU 几乎独占优势;而进入 2026 年后,AI 的重心转向“代理 AI(Agentic AI)的执行”,CPU 因此重新回到舞台中央。一、在 Agentic AI 时代,CPU 之所以变得关键,主要有四条逻辑:训练(GPU 强项):训练本质上是海量且高度重复的矩阵乘法。就像“搬砖”一样,哪怕任务单调但量大,GPU 擅长并行把活儿高效干完。代理(CPU 强项):Agentic AI 不只是生成内容,它还要完成思考、做
AI算力新阶段:CPU成关键价值洼地
不少人都抓住了一个底层规律:AI产业持续走强,绝不是单一硬件在唱独角戏。 高端GPU通常承担大模型训练与高强度算力渲染,但AI真正落到业务的关键环节——云端推理、智能体调度、数据中心运算以及终端侧交互响应——几乎都离不开高性能CPU作为支撑。 换句话说,GPU更像攻坚的尖刀,CPU则负责统筹全局的“中枢大脑”。只要没有强力CPU完成调度协同,再强的GPU算力也很难被高效释放。随着AI应用快速普及,全域计算需求不断扩张,服务器、数据中心以及国产化终端都会对CPU提出更高的容量与性能要求。 那为何近两年市场热
AI算力转向推理,CPU配置迎来上行
AI算力的重心正从训练阶段逐步转向推理环节,国产算力底座的再搭建,已成为当前算力与芯片相关板块最关键的产业走向。本文着重梳理了英特尔关于CPU/GPU配比变化的公开数据(由1:8调整到1:1,甚至出现2:1的情况),并进一步解读DeepSeek V4对华为CANN架构的系统性适配所带来的战略意义。算力重构:从GPU单核主导到CPU-GPU协同发力,DeepSeek V4如何重新定义国产算力的新“底座”就在近日,全球人工智能产业出现了明显的结构性转向。DeepSeek V4的发布,以及其对华为昇腾CANN生
摩尔线程MTT S5000率先适配中移动九天35B大模型
人民财讯4月27日电,4月27日,摩尔线程(689.500, 51.00, 7.99%)宣布,近日,中国移动(95.500, 0.06, 0.06%)自主研发的九天35B通用大模型即将正式上线。摩尔线程凭借其AI训练推理一体化全功能GPU MTT S5000,已成功率先实现对该35B模型的完整适配,并完成了推理验证工作。
英特尔业绩超预期,获华尔街最高111美元目标价
英特尔(86.82, 4.28, 5.19%)发布亮眼财报后,Evercore分析师在周日调高了对这家芯片厂商的看法,原因包括公司执行表现改善、CPU需求回暖,以及其作为美国唯一具备领先制造能力厂商的战略位置。 Evercore分析师马克·利帕西斯把英特尔评级由“与大盘持平”上调至“跑赢大盘”,并将目标价从45美元大幅提高到111美元,成为华尔街目前最高的目标价。他指出,公司最新季度成绩与业绩指引显示,市场或许低估了英特尔未来数年可释放的盈利空间。 此次上调发生在英特尔公布好于预期的一季度财报之后。数据显
本地AI工作站崛起:英特尔双芯协同,缓解Token压力
2026年,AI工作站的角色正迎来深层重塑:它不再只是辅助开发的工具,而是在企业侧承载数据安全与效率诉求的“本地AI工厂”。IDC预计,2026年工作站市场出货量将达66万台,同比增长5.2%。为适配不同体量与业务场景,AI工作站形态也在加速分化:一体机方案升温,并进一步延伸到更小巧的“迷你主机”和桌面级工控形态。在大模型与智能体应用持续拉动之下,面向AI工作站的芯片平台又出现了哪些新进展?4月23日,英特尔在北京举行新一代AI工作站平台发布活动。英特尔中国区技术部总经理高宇宣布,针对AI工作站场景,英特
AI重应用,不拼排名
2026年4月24日,DeepSeek V4 预览版正式发布。这是 DeepSeek(深度求索)推出的新一代开源 MoE 大模型,统一配置 1M 超长上下文,重点强化长文本效率与 Agent 能力,并提供 Pro/Flash 两个版本。它原生支持 1M 上下文,整本书或整个代码库都能直接塞进来,不再需要 RAG 切块处理。同时它全面兼容华为昇腾 950PR,训练框架也从 CUDA 转向 CANN;单卡推理性能达到英伟达 H20 的 2.87 倍,能耗降低 40%。这条消息在国内外都掀起了不小震动,我也因此
DeepSeek-V4成龙虾默认模型
全球Agent(智能体)风向标OpenClaw正式宣布接入DeepSeek-V4。 4月26日,澎湃新闻记者获悉,OpenClaw(龙虾)已正式官宣,全面接入DeepSeek-V4(Flash和Pro双版本),其中V4 Flash成为默认大模型,V4 Pro也同步上架模型库。 据OpenClaw披露,最新的4.24版本更新包含:实时语音通话全面贯通;DeepSeek-V4-Flash和Pro加入模型库;浏览器自动化新增坐标点击和更完善的恢复机制;Telegram、Slack、MCP、会话以及TTS均已修复
算力转型驱动CPU大爆发:国产算力大脑迎来黄金期
全球算力重心正从训练转向推理,CPU 需求迎来了历史性爆发。英特尔 CEO 指出,AI 工作负载的转变正推动 CPU 与 GPU 比例从 1:8 快速向 1:1 均衡,单台智能体服务器的 CPU 用量更是高达传统 AI 服务器的 20-30 倍。结合 Meta 与亚马逊数十亿美元 CPU 采购协议落地、英特尔/AMD 产能全满且涨价 10%-15% 的现状,CPU 产业链已进入量价齐升的景气期。美股市场反应迅速,英特尔单日暴涨超 25%,AMD、ARM、高通涨幅均超 12%,作为全球算力格局中成长性最强的
理性AI决策的因果机制解析
理性智能与因果推理时间2026年4月28日(星期二)12:00-13:30地点立德楼301理性智能与因果推理一辆自动驾驶汽车正在变道,旁边的人类司机或另一辆自驾汽车会预判它的意图并做出反应。一架军用无人机在执行任务,对手会根据对其行动模式的推测调整部署和交火计划。一个交易算法在市场中下单,其他算法会捕捉它的策略信号并抢先行动。这三个场景有着共同的结构:AI行为体的决策会被其他行为体预测,而这些预测本身又会改变该行为体所面对的环境,进而影响该行为体的决策。在这种情境下,一个AI行为体需要理解什么才能做出理性
清华五道口AI俱乐部:万亿模型百倍提速,千亿投资与政府级项目齐发
大家早安!这里是清华五道口AI俱乐部,每日为您呈现最新的AI行业动态。蚂蚁百灵推出万亿参数模型Ling-2.6-1T,聚焦“快思考”模式,对标GPT-5.4非推理版本近期,蚂蚁集团百灵团队发布了万亿级旗舰模型Ling-2.6-1T。该模型融合了MLA与Linear Attention架构,创新性地放弃了主流的“慢思考”推理方式,通过极低的Token消耗实现高效的“快思考”推断。这不仅大幅削减了计算成本和响应时间,还确保了性能的卓越。在综合实力上,Ling-2.6-1T直逼GPT-5.4非推理版,并在AIM
DeepSeek V4低调发布:百万上下文与低价策略能否突围?
实测V4长文本、代码及推理表现。 AIX财经(AIXcaijing)原创 作者| 李梦冉 编辑| 魏佳 没有发布会,没有倒计时,DeepSeek V4就这样悄无声息地上线了。 这已是DeepSeek的常规操作。但这次的不同之处在于,他们在技术报告中主动提及:V4的能力仍不及GPT-5.4和Gemini-3.1-Pro,发展进度大约落后顶尖闭源模型3至6个月。 这句话在国内AI圈显得有些另类。大多数模型发布时,标配的都是“全球领先”“行业第一”。而DeepSeek反其道而行之,主动承认差距。 但如果细看此次
英伟达新支持DeepSeek-V4,开箱推理速度破150 tokens/s
IT之家 4 月 25 日消息,英伟达今日(4 月 25 日)通过博文宣布,其NVIDIA Blackwell平台已成功兼容DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型,开发者能够通过NVIDIA NIM微服务进行下载部署,也可借助SGLang与vLLM框架实现个性化推理。 英伟达在公告中表示,DeepSeek-V4-Pro具备1.6T总参数和49B激活参数,专为高级推理任务设计;而DeepSeek-V4-Flash版本则拥有284B总参数和13B激活参数,主打高速高效特性。
海外评测解析DeepSeek-V4:开源智能体任务夺魁,幻觉增加,Token耗费较高
每经编辑|兰素英 4月24日,DeepSeek-V4预览版正式发布并开源,声称在代理能力、世界知识和推理性能三大维度达到国内及开源领域的领先水平。 DeepSeek-V4提供Pro和Flash两个版本,均支持百万(1M)Token超长上下文。 两个版本均显著降低了对计算和显存的要求,将每个标记的推理FLOP削减73%,并将KV缓存内存占用减少90%。 4月24日,全球最大AI模型API聚合平台OpenRouter的数据显示,V4-Flash的调用量达270亿Token,V4-Pro为47.9亿Token,