AI 前沿动态:2026 年 5 月 12 日速递
🔔1、Claude Mythos 超越评测极限,AGI 临界点日益临近
💡核心要点:METR 评估表明,Claude Mythos 在需人类耗时 16 小时的长周期任务中成功率达五成,直接击破现有评测框架上限,16 小时以上区间因样本不足无法测得。AI 能力呈现超指数级跃升,Mythos 表现已超越 2027 年 AGI 预测指标。Palo Alto 测试显示,其辅助漏洞分析三周即可完成顶级渗透团队一年的工作量,攻击链被压缩至 25 分钟,安全攻防正式迈入 AI 对抗 AI 的新纪元。
📌查看原文
🔔2、LaST‑R1 框架引入隐空间物理推理,机器人操作成功率飙升至 99.9%
💡核心要点:至简动力联合北大及港中文推出 LaST‑R1 框架,首次将隐空间物理推理融入强化学习闭环,实现机器人先推理后行动。在 LIBERO 仿真基准中,仅需单条轨迹预热即达成 99.9% 平均成功率,真机任务性能超越 SOTA 模型π0.5 达 22.5%,泛化能力显著增强。
📌查看原文
🔔3、百度文心 5.1 参数与训练成本大幅缩减,全球搜索榜跻身第四
💡核心要点:百度文心 5.1 参数规模缩减为前代的三分之一,预训练成本仅为同类产品的 6%,依托 Once‑For‑All 技术单次训练即可提取多子模型。在全球 Search Arena 排行榜中位列第四,仅次于两款 Claude Opus 变体与 GPT‑5.5 Search,在低成本下依然保持顶尖竞争力。
📌查看原文
🔔4、腾讯云 QClaw 联通腾讯文档与 ima 知识库,办公闭环全面升级
💡核心要点:QClaw 上线“文件空间”,一次授权即可打通本地文件、腾讯文档及 ima 知识库,告别多应用间的数据搬运。深度集成账号权限,AI 生成内容可直接存为协作文档分享,ima 知识库实现双向沉淀,碎片化内容无缝接入工作流,AI 产出可回存构建第二大脑。
📌查看原文
🔔5、阿里通义千问与淘宝深度互通,AI 购物全场景正式落地
💡核心要点:千问 App 与淘宝全面打通,依托 40 亿商品库与 20 年购物数据,支持一句话完成选款、对比及下单。淘宝上线“千问 AI 购物助手”,提供 AI 问答、虚拟试穿、优惠计算、低价抢购及一键退换货服务,AI 种草支持图文链接秒查同款,试穿功能支持自由搭配与潮流建议。
📌查看原文
🔔6、微信四月发布九大功能更新,支付业务接入 AI 原生能力
💡核心要点:微信支付推出 AI Skill 技能包、友好文档及 API 三大工具,加速接入流程。微信 AI 小程序成长计划全面升级,降低门槛并新增工具类变现激励。企业微信 5.0.8 上线“记录面聊”功能,小游戏 IAP 激励最高 5000 万不参与分成,微信小店开启 0 保证金试运营。
📌查看原文
🔔7、Google 升级 Gemini API 文件搜索,多模态 RAG 能力实现全面跨越
💡核心要点:新版基于 Gemini Embedding2 模型,实现多模态嵌入,可处理 PDF、文档及图片视觉信息。支持自定义元数据过滤,按部门、时间等标签提升检索效率,页面级引用明确标注。