AI周报：全球大模型竞速与Agent落地加速

发布时间：2026-07-03 16:35阅读：3

01OpenAI发布GPT-5.6预览版，测评超Claude

推荐理由：推荐AI开发者与科技从业者阅读。OpenAI推出GPT-5.6有限预览版，以Sol、Terra、Luna三款型号精准卡位，性能全面超越Claude Fable 5与Mythos 5，且定价仅为对手三分之一，意图通过“性能+价格”双重优势挤压竞品空间。新模型在编程、生物及网络安全领域实现了显著提升，并投入70万GPU小时构建了多层安全防御体系。与此同时，美国政府解禁Anthropic的Mythos 5模型，一场围绕超级智能的博弈正愈演愈烈。

02Anthropic发布Sonnet 5，性能接近Opus 4.8

推荐理由：适合开发者阅读。Anthropic正式发布Claude Sonnet 5，这款"迄今为止最具Agent属性的Sonnet模型"在推理、工具使用、编程和知识工作方面相比Sonnet 4.6性能显著提升，接近Opus 4.8水平但价格更低。新模型在评测中表现优异，中等努力程度下成本效率大幅提升，提示注入攻击成功率仅0.93%远低于竞品。配合网络安全验证计划和速率限制调整，为开发者提供高性价比的Agent解决方案，标志着Sonnet级模型正式迈入AI Agent时代。

03马斯克发Cursor手机版！撞档OpenClaw，AI编程App入口战打响了

推荐理由：推荐开发者与移动办公用户阅读。Cursor正式推出iOS版移动端应用，用户可通过语音输入或斜杠命令启动Agent，远程控制电脑端任务进度，查看代码差异并直接合并PR。马斯克在X平台转发宣传，引发广泛关注。与此同时，OpenClaw也同步推出iOS和Android移动端应用，两大AI编程工具几乎撞档发布，标志着移动端正成为AI Agent工具的新入口。

04华为开源盘古openPangu-2.0-Flash，920亿参数

推荐理由：适合AI开发者与企业技术团队阅读。华为正式开源盘古920亿参数的openPangu-2.0-Flash模型，6月30日起在开源平台上线模型权重、基础推理代码及训推算子。作为华为开源AI模型品牌，openPangu致力于通过昇腾原生训练与推理技术，为业界提供最佳实践参考，助力打造Agent时代智能底座。openPangu-2.0-Pro模型将于7月开源，更多组件下半年陆续发布。

05虎牙发布实时多模态数字人VAM 1.0

推荐理由：AI从业者、直播电商与数字人开发者必读！虎牙发布实时多模态数字人VAM 1.0，基于DiT架构，仅需一张照片即可驱动7×24小时不间断直播。该模型率先突破稳定性、实时交互与工程部署“三堵墙”，支持全双工语音文字互动、随时打断接话及唱歌跳舞等才艺表演。实测首帧延迟仅1.3秒，8块H200 GPU集群达36.4 FPS，兼具高真实感与低算力开销，为直播带货、虚拟陪伴等场景提供可商用基座，标志着AI数字人从“能播”迈向“能聊”。

06天工3.2上线Skywork Tags，Agent入驻办公群聊

推荐理由：推荐企业团队、项目经理及远程协作成员阅读。天工3.2版本推出Skywork Tags功能，将AI Agent直接接入Slack、飞书、钉钉等主流IM工具，无需迁移现有工作流。该功能让AI以“共享同事”身份加入群组，实时读取上下文、承接任务并支持多人接力协作。相比私人助手，共享模式更透明且能随团队使用越用越强，避免信息孤岛。

013900亿！北京AI芯片龙头冲刺港股IPO，背靠百度，腾讯是客户

推荐理由：推荐半导体行业观察者、AI产业链从业者及科技投资者阅读。百度旗下AI芯片公司昆仑芯拟赴港上市，目标估值约500亿美元，超越母公司百度当前市值。该公司在路演中创新采用“订单换认购”模式，优先选择承诺采购其芯片的投资者，腾讯已成为其主要外部客户。昆仑芯第三代P800芯片已实现万卡集群规模化部署，正同步推进“A+H”两地上市计划。这一资本动作不仅折射出国产AI芯片赛道竞争的白热化，更标志着国产算力正加速迈向商业化独立新阶段。

02Anthropic营收反超OpenAI，企业级AI份额登顶

推荐理由：推荐投资人、企业决策者及AI行业观察者阅读。Anthropic以450亿美元ARR反超OpenAI登顶全球AI营收之王，其“B端企业路线”以高客单价和强粘性战胜“C端流量路线”，展现出惊人的造血能力。然而，Agent疯狂重试引发的百万美元计费黑洞，以及华尔街对其营收真实性的质疑，为这场商业神话埋下了隐患。当中国大模型以“免费+低成本”蓄势待发，全球AI市场的终局之战或将迎来颠覆性的降维打击。

03天塌了，DeepSeek 也要涨价

推荐理由：推荐AI开发者、企业技术负责人及API用户关注。DeepSeek V4正式版定档7月中旬，同步引入峰谷定价机制，工作日高峰时段API价格翻倍，但非高峰时段维持原价。此举旨在优化资源配置，倒逼用户通过错峰调用、提升缓存命中率来控制成本。尽管高峰成本上升，DeepSeek仍以极低单价占据大量高频调用市场。随着商业化加速，学会“错峰用AI”将成为开发者的新必修课。

04Anthropic正和SpaceX洽谈！Anthropic Labs负责人：未来将走向结果定价

推荐理由：AI开发者及行业投资人必看！Anthropic Labs负责人Mike Krieger深度揭秘，尽管Fable模型因安全争议被收回，但其展现的自主性预示着AI能力的质变。Anthropic正与SpaceX洽谈太空项目，探索从“卖Token”转向“按结果定价”的全新商业模式。同时深入探讨了AI自主权、环境感知能力对未来工作流的重塑，以及巨头入局对创业生态的影响，全面勾勒出AI从代码编写到商业变现的未来图景。

01Dwarkesh Patel：下一代AI，可能是干活干出来的

推荐理由：适合AI研究人员、机器学习工程师阅读。Dwarkesh Patel指出下一代AI训练范式的演进方向，仅靠“可验证奖励”的强化学习（RLVR）不足以应对复杂现实。核心观点在于，AI需突破“可刷题”任务的限制，通过“学习回写权重”机制，将真实世界部署中的经验沉淀为长期能力。文章解析了OPSD蒸馏与“梦境”模拟等前沿路径，描绘了AI从发布前训练转向发布后持续学习的未来图景。

02【行业观察】百亿AI短剧淘金热，最赚钱的不是“霸总”，是“生产力”

推荐理由：短剧创作者、影视从业者必读！百亿规模AI短剧淘金热背后的真正赢家并非内容方，而是提供工业化工作流的工具平台。通过将AI模型封装为标准化SaaS服务，这些“卖水人”将制作成本降低85%，并以高复购率的订阅模式稳握行业最大利润。当技术门槛被夷平，竞争回归内容本质，中小团队应利用先进的AI工作流降维打击B端市场或出海赛道，或转型为剧本供应商，以确定性的“工业流水线”放大“好故事”的商业价值。

03Codex负责人谈AI编程，最难的是删代码与判断

推荐理由：推荐程序员、技术管理者及AI从业者阅读。OpenAI Codex负责人揭示，AI时代写代码已非核心，真正稀缺的是判断与筛选能力。随着AI大幅降低实现门槛，代码库易臃肿，开发者需转型为“收尾者”，负责删减冗余、把控质量。Codex正成为调度各类工具的工作入口，未来程序员不会消失，但工作重心将后移，从编写代码转向对AI产出物的审查、重构与价值判断。

- END -

← 上一篇：AI创想挑战赛-十分钟构建你的智能玄学装置下一篇：茶百道三载援建48座运动场，点亮乡村孩童快乐童年 →