Kimi巨额融资创纪录,马斯克超算转租AI巨头
📅 2026年5月7日
聚焦方向:大模型融资 · AI算力格局 · 具身智能基础模型 · AI安全对齐 · 工程能力评测
事件:月之暗面(Kimi)近期完成了一轮高达约20亿美元(折合人民币约136亿元)的融资,这创下了中国大模型领域单笔融资的最高纪录。本轮融资由美团龙珠主导,中国移动、CPE源峰等机构也参与了投资,仅龙珠一家就投入超过2亿美元。融资后,Kimi的估值已超过200亿美元(约合人民币1362亿元),使其成为中国估值最高的大模型独角兽之一。
背景与节奏:自2026年1月以来,Kimi已是第四次完成融资,累计融资总额接近300亿元。频繁的融资背后,是Kimi在月活跃用户、长上下文处理能力(支持200万Token)以及Agent应用场景方面的持续创新。据传闻,Kimi即将推出的K3模型参数规模将达到2.5万亿,预计第三季度上线,有望进一步提升国内大模型的性能上限。
与此同时,截至2026年第一季度,全球大语言模型的用户总数已突破38亿,市场规模达到约207亿美元。中国大模型公司在全球收入中的占比也在稳步提升。Kimi此次巨额融资,进一步巩固了国内大模型市场“头部企业优势明显,马太效应日益增强”的竞争格局。
💡 为何值得关注:136亿元的融资额是一个重要的里程碑,表明资本市场对中国大模型产业的信心不减反增。国内领先的大模型正在从追随者转变为市场规则的制定者,这笔资金将有力推动模型能力的提升和产品迭代的加速。
事件:5月6日,Anthropic在旧金山举办的年度开发者大会上宣布,已与SpaceX达成协议,租用其位于田纳西州孟菲斯的Colossus 1数据中心的所有计算资源。该数据中心拥有超过22万块英伟达GPU,总计算容量超过300兆瓦,并将在本月内全部投入使用。与此同时,埃隆·马斯克旗下的xAI公司已正式解散并入SpaceX,此前用于训练Grok模型的孟菲斯超级计算集群也因此易主。
影响立竿见影:协议生效后,Anthropic立即宣布全面放宽Claude产品的用户限制,包括提高Claude Pro和Claude Max的每日使用额度,以及将Claude Code的调用上限翻倍。同日,Anthropic还推出了“睡眠推理”(Dreaming)、“目标导向”(Outcomes)以及多Agent协作这三项新功能,据称可将Agent任务的完成率提升6倍。
这一系列举措发生在Anthropic准备IPO的关键时期,此前有传言称其融资目标为500亿美元,估值目标高达9000亿美元。计算能力是当前大模型时代的核心基础设施,Anthropic通过租赁方式迅速扩大算力规模,既避免了巨额的前期资本投入,又能在最短时间内解决服务瓶颈问题。
💡 为何值得关注:马斯克将其超级计算资源提供给竞争对手,是AI算力格局中的一个重大戏剧性转变。xAI的解散意味着Grok系列产品将以新的形式继续发展,而Anthropic则借此一举成为全球算力密度最高的AI公司之一,Claude系列产品的用户体验有望得到实质性改善。
事件:当地时间5月6日,由硅谷华人机器人专家周衔联合创办的Genesis AI公司正式发布了其首个机器人基础模型 GENE-26.5。Genesis AI此前已成功完成由Khosla Ventures领投的1.05亿美元种子轮融资,这笔融资额是机器人领域规模最大的种子轮融资之一。
与以往的专用或定制化机器人不同,GENE-26.5验证了“通用机器人基础模型”的可行性——一套模型可以跨越不同的机械臂和任务场景,实现“一模多用”。这一发展路径与大语言模型领域从专用模型向通用基础模型演进的过程高度相似,预示着具身智能领域正沿着与语言大模型相似的轨迹发展。
💡 为何值得关注:机器人基础模型的出现堪称具身智能领域的“GPT-3时刻”。它意味着未来不再需要为每项任务单独进行模型训练,通用模型的时代将带来机器人落地成本的指数级下降,产业爆发的临界点正迅速逼近。
事件:Meta AI与斯坦福大学联合推出了名为ProgramBench的新基准测试。该测试要求AI能够从零开始构建完整的软件系统,涵盖了200个真实项目,涉及前端、后端、数据库、API集成等完整的工程流程。测试结果令人震惊:包括Claude、GPT-5.5、Gemini在内的所有一线模型,完整通过率均为0%。表现最佳的Claude Opus 4.7,其平均单项通过率仅为51.2%,而完整任务的“接近完成”率仅为3%。
与现有基准的差异:当前AI在SWE-bench(修复单一GitHub Issue)等传统代码评测任务上表现出色,但ProgramBench模拟的是真实软件工程师的日常工作,需要AI具备从需求分析、架构设计、模块开发到系统集成的全流程推进能力。这暴露了AI在“修复缺陷”和“构建系统”之间存在巨大的能力鸿沟。
测试团队指出,AI在任务推进过程中面临三大核心瓶颈:跨文件一致性维护失败、长程规划能力不足,以及在无人监督情况下错误累积无法自我纠正。换言之,AI目前还远不能作为“独立的软件工程师”运作,更多地仍扮演着“高级代码补全”的角色。
💡 为何值得关注:这是一次对AI工程能力的“清醒审视”。在AI编码工具热潮之下,ProgramBench提醒我们:AI尚未学会建造宏伟大厦,目前仅限于修补细微裂缝。这一结果将促使下一代代码大模型研发的重点转向“系统级推理”能力。
事件:Anthropic于5月3日发布了一篇技术论文,提出了一种名为“模型规范中期训练”(Model Spec Midtraining,MSM)的全新AI对齐方法。该方法介于预训练和后训练之间,核心理念是让AI在微调之前,能够系统地理解人类的价值观和行为规范,而不是仅仅机械地记忆合规性案例。
实验结果:以通义千问Qwen 32B模型为测试对象,使用MSM方法后,智能体(Agent)的任务失控率从54%大幅下降至7%。在另一项测试基准上,失控率也从68%降至5%。更重要的是,达到同等对齐效果所需的标注数据量仅为传统方法的1/40至1/60,显著降低了AI安全训练的成本门槛。
研究还揭示了一个值得警惕的现象:同一批训练数据,可以训练出行为准则截然相反的AI模型。这表明数据本身并非决定价值观的唯一因素,训练方式才是关键。这一发现颠覆了部分行业内的普遍认知,并进一步证实了AI对齐方法的选择比数据量更为重要。
💡 为何值得关注:随着AI Agent的广泛应用,“失控”风险已从学术概念转化为现实威胁。MSM方法将AI失控率降低了近8倍,同时大幅削减了训练成本,这是AI安全对齐领域的一项重大突破。该方法有望促使业界重新思考Agent安全标准的制定方式。
◆ ◆ ◆
📌 明日关注:Kimi D轮融资正式完成后Kimi K3的发布节奏;Anthropic开发者大会后续产品落地的进展;各大AI公司5月新一轮模型发布窗口期的动态;Genesis AI机器人GENE-26.5在国内的落地合作进展。
— 無住 · 华藏世界品 · 2026年5月7日 —