标签

AI日报|5月16日 百度Ernie 5.1训练成本骤降94%、Anthropic市值突破9000亿、蚂蚁推万亿参数开源模型

发布时间:2026-05-16 10:47来源:微信阅读:8

每日 3 分钟,洞悉 AI 行业今日动态

5 月 11 日,百度正式推出 Ernie 5.1,运用突破性的“一次性弹性训练框架”,将预训练费用削减 94%,仅达竞品的 6%。在 Arena Search 榜单上以 1223 分位列全球第四、国产模型之首,且总参数量仅为前代的 33%。

百度同步组建「百度模型委员会」( BMC ),成员均为青年大模型专家,基础模型部与应用模型部统一向 BMC 汇报。显然,百度意在集中 AI 力量精准发力。

5 月 15 日, Anthropic 完成新一轮融资, Dragoneer 、 Greenoaks 、红杉资本与 Altimeter Capital 联手领投,估值暴涨至约 9000 亿美元,反超 OpenAI 的 8520 亿。 Anthropic 年化收入预期将迅速跨越 450 亿美元,达 OpenAI 240 亿的近两倍。

Anthropic 还与盖茨基金会达成 2 亿美元合作协议,聚焦全球健康与教育领域。

OpenAI 推出 GPT-5.5-Cyber,其网络安全实力震撼业界,被誉为“神话级黑客能力,且向全体用户开放”。同时, OpenAI 向美国 Pro 用户预览个人财务管理体验,支持对接超 12,000 家金融机构(通过 Plaid ),理财任务评分 79 分。

另有消息, OpenAI 与微软正式解除独家合作协议,谷歌则向 Anthropic 追加 300 亿美元投资。

Google 在 I/O 大会上公布多项更新:Gemini 3.1 Flash TTS(先进语音合成)、Gemma 4开源模型、以及全新第八代 TPU( 8t 训练/8i 推理)。同步推出 Proactive Assistance 主动式 AI 功能,标志着 AI 从“被动响应”迈向“主动服务”。

5 月 15 日,阿里巴巴发布 Qoder 1.0 ,从 AI IDE 跃升为智能体自主研发工作台。用户仅需专注需求定义, Agent 团队可自主完成执行、验证与交付,覆盖 Windows 、 macOS 与 Linux 系统。

荣耀 CEO 李健宣布 Robot Phone 将于 2026 年 Q3 亮相,配备自研行业最小 4DoF 云台系统,意味着 AI 从软件层向硬件形态的深度拓展。

本周 arXiv 上多篇 MLLM 视觉注意力论文获顶会收录:

CodePercept 被 CVPR 2026 收录,创新性地以 Python 代码作为视觉感知媒介,构建百万级 ICC-1M 数据集,显著增强 STEM 视觉推理能力。其核心观点:“现有大模型 STEM 短板源于视觉感知,代码才是破局关键”。

本周 GitHub 最热关键词是 “Agent Skills as the new Linux packages”:

蚂蚁「百灵」大模型开源,万亿参数规模,采用混合式 MLA 与 LinearAttention 架构,性能可比肩 GPT-5.4(非推理模式),推理成本仅为同类产品的四分之一。

本周多款重磅技能库登场: - addyosmani/agent-skills—— Google Gemini 工程总监打造的生产级技能库 - obra/superpowers( 123K+ stars )—— 完整软件开发“宪法”级技能配置 - github/spec-kit—— GitHub 官方发布的 Spec-Driven Development 工具包,破解“vibe coding”目标漂移难题 - garrytan/gstack—— YC CEO Garry Tan 打造, 13 个专业 Agent 角色, 60 天内构建 3 个生产服务+40+功能

由 AlphaGo 架构师 David Silver 创立的 Ineffable Intelligence 与 NVIDIA 携手,目标是基于 Grace Blackwell 与 Vera Rubin 平台构建大规模 RL 基础设施,标志 AI 竞争从「预训练」转向「经验学习」。

📬 本日报由 AI 自动生成,信息