标签

AI周报:豆包实现重大突破,OpenAI推出自研芯片,GPT-5.6面临访问管控

发布时间:2026-06-30 21:55阅读:2

2026年6月23日—6月30日

各位读者好,又到了每周AI技术盘点的时间。这一周,AI圈可谓冰火两重天——国产大模型高歌猛进,海外巨头却遭遇监管“刹车”。以下是本周值得关注的9条重磅新闻。

一、大模型:国产全面发力,海外遭遇“限流”

1. 豆包2.1 Pro发布,日均调用量突破180万亿

6月23日,火山引擎2026夏季FORCE原动力大会上,豆包大模型2.1 Pro正式发布。火山引擎总裁谭待抛出了一个务实的衡量标准——“生产级质变点”:只有当模型能力跨越质变点,才能真正满足生产场景的使用需求。

豆包2.1 Pro在Coding(编程)、Agent(智能体)、VLM(视觉语言模型) 三大方向实现能力跃升,多项评测表现优于Claude Opus 4.6。Coding维度上,模型已能理解整个代码仓库,完成从需求分析到架构设计、代码生成到测试验证的完整链路,甚至已可落地芯片RTL开发等真实工业代码迭代任务。Agent方面,依托豆包2.1 Pro搭建的3D虚拟城市场景中,500多个智能Agent同步协作,完成上千轮工具调用,最终生成超100栋建筑。

定价方面,豆包2.1 Pro每百万Tokens输入6元、输出30元,综合使用成本较Claude Opus 4.6降低近80%。截至6月,豆包大模型日均Token调用量已突破180万亿,过去一年增长超10倍。

2. 美团LongCat-2.0发布:国产算力跑出的万亿参数模型

6月30日,美团正式发布新一代万亿参数大模型LongCat-2.0并对外开源。这是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型(总参数1.6T,平均激活约48B)。

LongCat-2.0从零开始预训练,原生支持1M超长上下文,预训练数据规模超30T tokens。在国产算力训练挑战方面,团队将月均日故障率降低70%以上,训练MFU提升1.5倍,实现稳态日吞吐超过1T tokens/day。

模型采用MOPD架构融合Agent、Reasoning、Interaction三组专家能力,通过token级动态激活,简单token不消耗算力,复杂token自动获得更多计算资源。预览版已跻身OpenRouter全球大模型调用量前三。

3. GPT-5.6发布即“限流”,海外最强模型遭遇监管刹车

北京时间6月27日凌晨,OpenAI正式发布GPT-5.6系列模型,包含Sol、Terra、Luna三款,其中旗舰Sol在Terminal-Bench 2.1跑分达91.9%。然而这次发布最大的不同是——GPT-5.6并没有全面开放,而是采取了极其苛刻的“一客一审”受限预览模式。

与此同时,Anthropic的Fable 5和Mythos 5因美国出口管制被紧急撤下。不过好消息是,6月28日有消息称美国政府即将允许Anthropic恢复Fable 5的访问权限。

4. 阿里发布首个原生语言世界模型

6月24日,阿里巴巴千问大模型正式发布Qwen-AgentWorld,官方称这是首个原生语言世界模型,能够在七大领域中模拟智能体交互环境。

二、AI芯片:OpenAI入局,推理芯片成新战场

5. OpenAI发布首款自研AI推理芯片Jalapeo

6月24日,OpenAI与博通联合发布首款定制AI芯片Jalapeo,这是一款专门针对大语言模型推理场景优化的ASIC芯片。

该芯片围绕大语言模型推理过程中的内存移动、模型服务、网络连接、任务调度和能效表现进行专门优化,将主要服务于OpenAI自身AI基础设施,用于支撑ChatGPT、Codex等高频调用场景。Jalapeo的发布标志着头部AI企业正从算力采购者转变为算力架构的定义者。首批部署计划于2026年底完成。

同一天,英伟达在2026年股东大会上,黄仁勋继续强化AI基建、AI工厂和“Token经济”的叙事;高通也发布了数据中心整体战略,推出Dragonfly数据中心产品组合。AI推理芯片赛道正在形成“英伟达守擂、OpenAI攻擂”的新格局。

三、应用工具与智能体:商用元年加速到来

6. 豆包专业版上线,Agent能力走向生产级

6月24日,豆包发布基于豆包2.1系列大模型的豆包专业版,提供接入豆包2.1 Pro模型的办公任务模式,可执行Agent任务,包括操作本地电脑、使用浏览器、调用Skills技能和定时任务等能力,内置Office办公套件。

7. 科大讯飞发布招采全链路AI智能体平台2.0

6月25日,科大讯飞发布招采全链路AI智能体平台2.0版,依托自组织、自进化的智能体协作框架与Harness可信执行引擎两大技术突破,推动AI招采迈向“全链原生、自主进化”的新阶段。

四、算法与前沿技术:从“数字计算”到“物理计算”

8. 首个以物理为计算原语的大规模生成模型Un-0发布

6月26日,前Databricks AI负责人Naveen Rao创办的Unconventional AI发布Un-0,这是第一个以物理作为计算原语构建的大规模生成模型。Un-0由“模拟耦合振子系统”驱动,在ImageNet 64×64上达到FID 6.74。

Naveen Rao称其为物理计算的“Hello World”时刻,目标是将AI推理能耗降低到现有系统的千分之一。这代表着AI计算正在从“更大的GPU”路线,探索“利用物理系统天然动态行为完成计算”的全新范式。

9. 韩国科学家实现铁电存储器同时支持随机采样与稳定计算

6月28日,韩国首尔国立大学在《自然·通讯》发表论文,首次在基于铁电存储器的单一器件平台上,同时实现了生成式AI的两大核心能力——随机采样与稳定计算。这项技术有望大幅提升片上生成式AI加速器、神经形态系统及低功耗边缘AI芯片的效率并降低能耗。

五、行业与政策速览

· 调用量数据:本周OpenRouter平台周调用总量达41.9万亿Token,国产模型中DeepSeek稳居全球第一。

· 大模型备案:我国累计已有900余款大模型上线服务;北京推进242款大模型备案上线,数量全国第一。

· 开源生态:Hugging Face报告显示,过去一年该平台41%的大模型下载量来自中国研发的模型。

· 算力瓶颈:因Meta算力需求超出供给能力,谷歌已对Meta调用Gemini大模型实施使用限制。

· 人才流动:Noam Shazeer离开Google加入OpenAI,AlphaFold负责人John Jumper离职DeepMind加入Anthropic。

· 政策信号:上交所发布AI大模型企业上市指引,明确核心门槛为至少一款大模型完成上线并实现规模化商用。

小结:本周AI领域的关键词是“质变”——豆包2.1 Pro正式跨越生产级质变点,美团LongCat-2.0证明国产算力可以支撑万亿参数模型训练,OpenAI入局推理芯片标志着AI产业链进入“模型定义硬件”新阶段。与此同时,GPT-5.6的“限流”发布和Anthropic模型的出口管制,也预示着AI大模型的全球化竞争正面临越来越复杂的地缘政治变量。

---

本文基于公开信息整理,仅供参考,不构成任何投资建议。