标签

AI 日报 | 5 月 26 日重磅:苹果 1.2T 重塑 Siri,GPT-5.6 六月将至,谷歌破解 56 年数学困局

发布时间:2026-05-26 22:21来源:微信阅读:5

AI 日报 | 2026 年 5 月 26 日:苹果 1.2T 参数模型重塑 Siri,GPT-5.6 六月登场,谷歌 AI 突破 56 年数学难题

今日 AI 领域消息铺天盖地。苹果推出基于 1.2T 参数的定制版 Google 模型以重塑 Siri,OpenAI GPT-5.6 提前曝光——拥有 150 万 token 上下文窗口,Anthropic 新模型令欧洲央行紧急召开安全会议,谷歌 AlphaProof Nexus 成功破解两道悬置 56 年的数学题。大模型军备竞赛全面升级,竞争愈发激烈。

面壁智能今日联合清华大学等机构,开源了中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN。1.58-bit 意味着什么?即把模型权重精度压缩至极限,仅需低算力即可运行。国产硬件生态终于拥有了真正可用的端侧大模型方案,信创与自主可控领域补上了关键拼图。

面壁同时开源了 MiniCPM5-1B。名称虽小,实力不俗:1B 参数,在 AA-Index 上超越所有 2B 以下模型,效果优于 3 个月前的 Qwen3.5-2B,参数量却减少一半。INT4 量化后权重仅 0.5GB——手机可运行,浏览器亦支持。模型权重、训练数据及部署方案全量开源,可谓相当慷慨。

腾讯混元发布了翻译模型 Hy-MT2。1.8B 版本在 Hugging Face 排行榜登顶,30B-A3B(MoE)版本位列第四,下载量已超 7000 次。同步上线「腾讯混译」微信小程序,支持语音输入与离线翻译,还可自定义翻译风格。模型与代码均已开源,从事翻译工具开发的同学可以行动起来了。

通义千问方面——Qwen3.7-Max 在 Code Arena 斩获 1541 分,成为全球第二大 AI 编程模型,仅次于 Claude。官方称其专为生产环境打造:可运行 35 小时长任务、支持 1000+ 次工具调用,数小时完成原本需两周的工作。实测视频显示效果确实惊人。此外还上线了隐式缓存功能,自动开启无需配置,速度更快成本更低。

今日最大新闻莫过于此。苹果正利用一款定制版、1.2T 参数的 Google 大模型改造下一代 Siri。1.2T 意味着什么?比此前预估的 Gemini 3.5 Flash(约 300B)整整大了 4 倍。

该模型将驱动 Siri 的部分功能,简单查询在本地运行。苹果要解决的核心问题是——如何让这个 1.2T 的庞然大物足够快速地响应用户的日常提问。没人愿意在查询天气时等待半分钟。

更值得关注的看点是:下个月 AI 圈预计将迎来密集发布——WWDC 上 Apple Intelligence 将与 Gemini 深度整合、GPT-5.6、或许还有 Sonnet 4.8/Opus 4.8、Gemini 3.5 Pro。六月恐怕要再次捅破技术天花板。

几位开发者在 OpenAI Codex 后端日志中发现了一款未官宣的模型——GPT-5.6,内部代号为 iris-alpha。两条关键信息:

第一,拥有 150 万 token 上下文窗口。较 GPT-5.5 的 105 万提升了 43%。测试至 90 万 token 仍能流畅响应——你可以将整部《三体》三部曲投喂进去,它依然能从容与你对话。

第二,可能于 6 月发布。同系列还发现了 ember-alpha 和 beacon-alpha,表明 OpenAI 内部正在进行密集迭代。前端界面生成能力亦有提升。

Anthropic Claude、Google Gemini、xAI Grok 估计也瞄准了同一时间窗口。六月注定非同寻常。

新模型在测试中的表现令欧洲金融监管机构坐立不安——欧洲央行紧急召开会议要求升级网络防御。虽具体细节尚不清楚,但能让央行级别机构紧急行动,说明 AI 已触及金融系统性风险层面。这也是为何 Anthropic 的 Chris Olah 一直呼吁加强外部监督。

在 Qwen Conference 2026 上,阿里云 CTO 李飞飞博士阐述了从云原生到智能体原生的转型路线。阿里云构建了四大基石:模型、智能体云、工具与服务,以及规模。方向十分明确——云厂商不再单纯售卖算力,而是提供 AI 能力即服务,智能体将成为云上的第一公民。

谷歌的 AlphaProof Nexus 今日也释放重磅消息——成功攻克了两道困扰 56 年的数学难题。虽题目仅限数学圈内行理解,但意义在于:AI 在形式化推理和数学证明领域,已能解决人类顶尖数学家半个世纪未能攻克的难题。这比单纯刷榜刷分更为硬核。

这可能超出了许多人的预期——教皇里奥十四世发布了首份关于 AI 的通谕《Magnifica Humanitas》,警告 AI 及不受约束的技术力量带来的风险。重点讨论了 AI 驱动战争、对劳动市场的影响,以及建立新法律和伦理框架的必要性。

有趣的是,Anthropic 联合创始人 Chris Olah 亲自前往梵蒂冈。他说了一段意味深长的话:所有前沿 AI 实验室都面临商业、研究和地缘政治的多重压力,这些可能与做正确之事相冲突,因此外部监督至关重要。他还打了个比方——AI 模型并非像飞机那样被工程化构建,而是基于人类语言和思想“生长”出来的,其内在性质可能复杂到令人难以理清。这个视角,确实值得深思。

xAI 宣布 Grok Build 面向 SuperGrok 和 X Premium+ 用户推出 Beta 版。支持 Plan Mode 规划、Imagine 创建图像视频、CLI 构建自动化和编排器。玩法类似 Claude Code 和 Codex,但更偏向内容创作方向。

Jon Erwin 分享了 Kling AI 在亚马逊 Prime 剧集《大卫之家》中的应用——多项行业首创:首次在完成的剧集中使用 AI 生成场景,首个原生 4K 模型。运动控制功能能在 AI 生成中保留演员真实的情感和感受。AI 影视落地的步伐,比大多数人预想的要快。

华为何庭波在 ISCAS 2026 上提出了「韦定律」,介绍了逻辑折叠(LogicFolding)技术。不依赖新光刻工艺,通过三维空间拓扑重组即可提升芯片性能——麒麟 2026 芯片测试中,晶体管密度从 155 MTr/mm²提升至 238 MTr/mm²,能效提升 41%,时钟频率提升超 13%。芯片技术尚未触及天花板,华为这条路走得颇具想象力。

AI 智能体开发者或许会欣喜若狂——skill-cleaner,专为 AI 智能体的提示词进行体检。5 项核心功能:预算审计、重复检测、未使用筛查、根目录审计、描述优化。有人实测将技能描述从 90 多词精简至 40 词以内,智能体选择技能的准确率显著提升。已开源,从事 Agent 开发的同学不妨一试。

Hugging Face 今日有一篇文章厘清了 AI 智能体领域最易混淆的几个术语:模型(如 Claude、GPT 等)本身是无记忆、无循环的大语言模型;Scaffolding 是行为定义层(系统提示、工具描述);Harness 是执行层,负责调用模型、处理工具调用和控制循环。Agent = Model + Harness。同一模型搭配不同 Harness 体验截然不同——Claude Code 和 Codex 便是最佳例证。

今日 AI 日报信息量确实巨大,从苹果 1.2T 参数模型、GPT-5.6 的 150 万 token 上下文,到谷歌 AI 破解 56 年数学难题、教皇通谕呼吁保持人性,AI 的边界正在以肉眼可见的速度被重新定义。

下个月注定精彩——WWDC、GPT-5.6、或许还有 Sonnet 4.8、Gemini 3.5 Pro……我们下期再见。

AI 日报,每日为你追踪 AI 圈最重要的动态。欢迎关注,不错过每一个改变未来的瞬间。