标签

AI 周报:DeepSeek 获巨额注资、微软弃 OpenAI、物理 AI 小脑突破、Token 降本大战

发布时间:2026-06-22 07:55阅读:2

DeepSeek 拿下 500 亿融资刷新国内单轮纪录,英伟达发行 200 亿美元债券押注未来,微软转向抛弃 OpenAI 拥抱 DeepSeek——"成本高出 50 倍"。智谱 GLM-5.2 全面开源,阿里推出首款具身大模型,微信灰度上线 AI 助手"小微"。从资本注入到算力布局,从模型进化到应用落地,本周 AI 产业全景图已然展开。

本周大模型竞技场风云变幻,国内外同步提速。

智谱 GLM-5.2 正式亮相并全量开源,国产算力厂商实现全面适配。阿里推出首款具身大模型 Qwen-Robot 系列,推动模型从纯文本向物理世界控制跨越。DeepSeek 全量上线识图功能,视觉理解短板正式补齐。在模型能力持续拓展之际,价格战也同步打响——多款国产大模型本周集体降价,大模型 API 调用量连续八周攀升,MiniMax M3 跃升至国内调用量第二。

国际方面,谷歌明星研究员诺姆·沙泽尔宣布加盟 OpenAI,前谷歌 Gemini 联席负责人同期跳槽,谷歌 DeepMind 人才流失引发行业高度关注。OpenAI 在 2026 年 Q1 消耗 37 亿美元、去年全年支出高达 340 亿美元的财务数据曝光,微软随即被曝考虑放弃 OpenAI 和 Anthropic,全面转向 DeepSeek——"成本高出 50 倍"成为本周最刺痛人心的话语。

研局评述:大模型赛道正从"谁更强"转向"谁更便宜"。降价潮背后是算力成本骤降与竞争白热化的双重驱动,这对整个 AI 产业链的定价体系是一次重构信号。人才流动方向则折射出 OpenAI 的吸引力——即便烧钱如故,顶级研究员依然趋之若鹜。

本周芯片与算力赛道双线推进,融资与产能同步扩张。

英伟达五年来首次发行投资级债券,计划募资超 200 亿美元,认购额高达 850 亿美元,巨额超额认购显示资本对 AI 算力基建的坚定信心。英伟达同步公布 AI 基础设施扩建计划,并携手 Coherent 扩产 6 英寸磷化铟晶圆与光互连产能。高通据悉正洽谈收购 AI 芯片初创企业 Tenstorrent,剑指边缘计算与汽车 AI 芯片。

国内方面,英特尔与英伟达首款联合芯片确认 2028 年 Q1 落地。沐曦万卡集群将在上海临港落地。商汤宣布建设大规模智算中心。算力网络开启万亿级投资周期。AI 芯片企业微纳核芯完成 B 轮系列融资超 10 亿元。算苗科技发布面向大模型推理的 3D TokenPU 芯片。

研局评述:英伟达发债募资 200 亿,这不仅是融资,更是一个信号——即便是算力链王者也需提速扩张以应对指数级增长的需求。高通收购 Tenstorrent 若成真,将在 AI 推理芯片格局中打开新的竞争维度。算力投资从服务器到光互连全链条铺开,"算力即基础设施"正成为资本共识。

本周融资市场迎来历史性节点:DeepSeek 完成超 70 亿美元(约 500 亿元人民币)融资,估值达 3380 亿元,成为中国 AI 行业史上最大单轮融资,梁文锋个人出资约 200 亿元一票独大。

围绕 DeepSeek 融资的热度,整个 AI 一级市场同步升温:具身智能赛道 17 天内发生 11 起融资;Token 推理服务商硅基流动拿下超 20 亿元 B 轮;AI 独角兽演语科技完成近 3 亿美元 B+ 轮;具身智能公司深朴智能完成数亿元 Pre-A 轮,由滴滴领投;AI 模型公司 Aether AI 完成 2000 万美元首轮。

资本市场侧,燧原科技科创板 IPO 过会并进入提交注册阶段,成为"国产 GPU 四小龙"中首家科创板上市候选。智谱科创板 IPO 辅导状态变更为"辅导验收",IPO 进程加速。壁仞科技纳入港交所科技 100 指数。

研局评述:DeepSeek 融资规模刷新认知,中国 AI 一级市场从"估值泡沫争议"直接跳到"真金白银入场"。与此同时,AI 芯片公司科创板排队落地的节奏,与国内算力投资的万亿周期高度共振,资本正在下一盘大棋。

本周政策端极度活跃,多部委协同发力。

上交所正式发布人工智能大模型企业适用科创板第五套上市标准审核指引,科创板明确向量子科技、大模型企业敞开大门,智谱、MiniMax 等赴港上市企业"回 A"进程有望提速。证监会主席吴清表示将适时发布规范资本市场人工智能发展指导意见,同时明确依法严打利用 AI 非法荐股等乱象。

商务部等八部门联合发布《关于加快"人工智能 + 消费"发展的实施意见》,支持消费者购买 AI 智能手机、智能电脑等产品。国家金融监督管理总局发布银行业保险业 AI 安全开发应用指导意见。国务院、国家发改委与人社部联合印发文件,部署适应人工智能发展的就业创业政策。工信部部署"人工智能 + 制造"专项行动,深入整治"内卷式"竞争。

国际侧,G7 领导人责成各国财政部长讨论 AI 问题。法国宣布追加 AI 投资。阿联酋成立人工智能与数据管理局。中国正在加紧筹建世界人工智能合作组织,主导全球 AI 治理话语权布局。

研局评述:科创板第五套上市标准向大模型开放,是 AI 产业发展里程碑式的政策信号——意味着大模型企业即便没有传统利润指标,也有了登陆 A 股的路径。监管方向整体清晰:既鼓励创新,又划定红线,AI+ 消费的政策拉动意图相当明显。

具身智能赛道本周进入密集发布期。

智元全尺寸人形机器人远征 A3 实现自主打乒乓球,展示了精细运动控制能力。银河通用机器人发布全球首个人形机器人通用小脑 GPT 基础模型。智平方发布全球首个类脑式具身智能系统 NeuroVLA。阿里发布 Qwen-Robot 具身大模型系列。三星电子旗下 Rainbow Robotics 已向 Coupang 物流中心正式供货。

政策侧,北京亦庄启动打造具身智能标杆型超级工厂,拟 2030 年产能达 50 万台。国家地方共建人形机器人创新中心在年内推出 2.0 版实训场。多地出台人形机器人扶持政策。松延动力发布首款开源鸿蒙消费级人形机器人。越疆宣布将推出陪伴交互 AI 人形机器人。

研局评述:"小脑"技术成为本周具身智能最热词——从银河通用到智平方,多家团队在同一周发布不同路线的具身基础模型,说明这个赛道已经从"造壳"进入"造脑"阶段。物流、家居、工厂三条应用线同步推进,但谁的"脑"能真正通用,仍是未解之题。

微信开始灰度测试内置 AI 助手"小微",腾讯在微信生态中的 AI 落地迈出实质一步。MiniMax M3 接入支付宝 Token Pay,AI 调用能力正在向支付场景延伸。Adobe 推出配备 AI 助手功能的 Creative Agent,创意工具 AI 化趋势加速。

万兴科技商业模式从传统软件向"订阅 +Token 消费"转型。美图发布奇想大模型 V6。软银与 OpenAI 将在日本联合推出 AI 网络安全服务。中国信通院联合 10 家企业启动"Token 服务能力攀登计划",同步发布高质量 Token 服务标准体系与性能监测平台。

研局评述:微信接入 AI 助手,意义不在于功能强弱,而在于国内最大流量入口正式拥抱 AI 应用层,这对整个 AI 应用生态的影响不可小觑。Token 服务标准化则是行业成熟度提升的典型标志——从野蛮生长到标准建设,是每个产业发展的必经之路。

谷歌 DeepMind Jumper 研究员宣布离开加入 Anthropic,与同期诺姆·沙泽尔加入 OpenAI 一道,构成本周 AI 圈最引人注目的人才流动图谱。特朗普宣布不再将 Anthropic 视为国家安全威胁,Anthropic 的国际业务扩展空间随之打开。

中美大模型差距之争引发热议:马斯克预测中国模型达到 Fable 级别需到 2027 年 Q1。智谱唐杰则"呛声"表示不需要那么久。美联储主席沃什指出 AI 需求侧正在被广泛关注,但供应侧不确定性较高。亚马逊创始人贝佐斯提出反直觉观点——AI 反而会造成劳动力短缺。

研局评述:马斯克和唐杰的隔空互怼,本质上是中美 AI 能力评估基准的认知分歧。但更值得关注的是贝佐斯的判断——在大多数人担心 AI 抢走工作的时候,他在担心 AI 导致雇不到人,这个认知分歧背后隐藏着两种截然不同的 AI 落地路径假设。

Anthropic 本周遭遇双线诉讼:既因 Claude Agent SDK 的 Token 计费方案引发开发者起诉,又因订阅计划的使用限制面临消费者集体诉讼。OpenAI 再收传票,IPO 前夕法律风险不断累积。

英国一名警官涉嫌使用 AI 工具伪造证据材料,成为全球首批 AI 司法滥用案例之一。挪威宣布禁止小学生使用生成式 AI,教育领域 AI 监管趋严。国家金融监管总局明确要求金融机构 AI 应用与自身风险管理能力相匹配。

研局评述:AI 治理的诉讼压力正在从"隐患"变成"现实成本"。对于 Anthropic 这类头部公司而言,法律风险管理已经成为和技术研发同等重要的战略议题。AI 伪造证据案的出现,也预示着各国司法体系将不得不加速建立 AI 生成内容的鉴别和法律认定机制。

3B 参数的紧凑推理模型,在数学竞赛和编程测试上打败 DeepSeek V3.2、GLM-5、Gemini 3 Pro 等百倍参数量的旗舰模型。AIME 2026 得分 94.3,LeetCode 最新竞赛通过率 96.1%。核心发现:数学和编程推理可以被"压缩"进小模型——你不需要一个亿参数模型来解数学题,你需要的是一个被训练得非常专注、非常能检验自己答案的小脑袋。

将代码库探索与代码求解解耦——专门训练一个子 Agent,专职仓库导航,返回精确文件路径和行号。在 SWE-bench 上解决率提升 5.5%,Token 消耗降低 60%。这个思路——分离"找"和"做"——会影响未来所有编程 Agent 的架构设计。

通用交互式视频世界模型,支持摄像机导航、重访已观测区域、可提示事件控制。核心突破:记忆条件场景持久化,解决长时生成中的场景漂移。八卡 RTX 5090 上达到 16FPS。从"AI 生成视频"到"AI 生成可交互的虚拟世界",这是两个物种。

为物理 AI 设计的原生世界模型框架,三大核心能力:学习世界(跨体态数据课程预训练)、记住世界(混合线性时序注意力,理论上保证长时间误差不累积)、运行世界(消费级硬件支持实时推理)。可能是解开"仿真到现实迁移"问题的关键钥匙之一。

引入循环架构用于世界建模,通过参数共享的 Transformer 块迭代精化隐空间环境状态。同等参数量效率提升最高 100 倍。提出"迭代隐式深度"作为世界模型的全新扩展维度——与扩大模型规模、增加训练数据正交,开辟了新的 Scaling 方向。

在内容送达 LLM 之前压缩工具输出、日志、文件和 RAG 数据块,减少 60-95% 的 Token 消耗。三种接入模式:Library 库、Proxy 代理、MCP Server。支持 Claude Code、OpenAI Codex 等主流平台。

研局虾看行业:这个项目戳中的是当下 AI 应用最疼的痛点——Token 成本。行业已经从"怎么用 AI"进入"怎么用得起 AI"的阶段。省 Token 就是省钱,省钱就是赢。

一条命令安装 13+ 平台接入能力(YouTube、Twitter、Reddit、GitHub、Bilibili、小红书等),完全免费,零 API 费用。每个平台都有"首选 + 备选"多后端路由,自动故障切换。

研局虾看行业:AI Agent 正在从"封闭系统"走向"开放互联网"。一个不能看 YouTube、不能查 Twitter 的 AI 助手,再聪明也只是个书房里的学者;而一个能实时感知全网动态的 AI 助手,才是真正可用的数字员工。

把代码库索引成持久化知识图谱,提供毫秒级结构查询,Token 消耗减少 99%。Linux 内核 2800 万行代码 3 分钟索引完毕,支持 158 种编程语言,单一二进制零依赖。

研局虾看行业:AI 编程赛道的下一个竞争维度是"长期记忆"。谁能给 AI 编程助手装上对代码库的持久记忆,谁就能从"写代码的工具"升级为"理解项目的伙伴"。

三个项目合在一起看,AI Agent 的工具链正在快速分化——有人管压缩(headroom)、有人管数据接入(Agent-Reach)、有人管记忆(codebase-memory-mcp)。这种分工意味着 AI Agent 生态正在从"大而全的单体方案"走向"模块化的专业工具链",就像软件工程从单体应用走向微服务一样。

本周 AI 产业的三个关键词:融资、成本、标准化。

DeepSeek 的 500 亿融资不是孤立事件,它和科创板向大模型企业开放、具身智能 17 天 11 起融资、英伟达发债 200 亿等现象形成共振——资本正在以前所未有的密度涌入 AI 基础设施层。

但与此同时,"成本高出 50 倍"这句话也在提醒所有人:烧钱不是目的,效率才是。本周 GitHub 周榜前三名全部围绕"减少 Token 消耗"做文章,FastContext 论文用分离架构降低 60% Token,VibeThinker-3B 用 3B 参数打出百亿模型的成绩——整个产业都在寻找"更便宜地用 AI"的路径。

标准化方面,从国家金融监管总局的 AI 安全开发指导意见,到信通院的 Token 服务标准体系,再到科创板第五套上市标准扩容,政策端正在为 AI 产业的下一阶段发展搭建制度框架。

下周关注:2026 世界人工智能大会(7 月上海)将有超过 300 款 AI 产品全球首发,可能成为下半年 AI 产业方向的第一个重大风向标。