AI周报:全球大模型竞速与Agent落地加速
01OpenAI发布GPT-5.6预览版,测评超Claude
推荐理由:推荐AI开发者与科技从业者阅读。OpenAI推出GPT-5.6有限预览版,以Sol、Terra、Luna三款型号精准卡位,性能全面超越Claude Fable 5与Mythos 5,且定价仅为对手三分之一,意图通过“性能+价格”双重优势挤压竞品空间。新模型在编程、生物及网络安全领域实现了显著提升,并投入70万GPU小时构建了多层安全防御体系。与此同时,美国政府解禁Anthropic的Mythos 5模型,一场围绕超级智能的博弈正愈演愈烈。
02Anthropic发布Sonnet 5,性能接近Opus 4.8
推荐理由:适合开发者阅读。Anthropic正式发布Claude Sonnet 5,这款"迄今为止最具Agent属性的Sonnet模型"在推理、工具使用、编程和知识工作方面相比Sonnet 4.6性能显著提升,接近Opus 4.8水平但价格更低。新模型在评测中表现优异,中等努力程度下成本效率大幅提升,提示注入攻击成功率仅0.93%远低于竞品。配合网络安全验证计划和速率限制调整,为开发者提供高性价比的Agent解决方案,标志着Sonnet级模型正式迈入AI Agent时代。
03马斯克发Cursor手机版!撞档OpenClaw,AI编程App入口战打响了
推荐理由:推荐开发者与移动办公用户阅读。Cursor正式推出iOS版移动端应用,用户可通过语音输入或斜杠命令启动Agent,远程控制电脑端任务进度,查看代码差异并直接合并PR。马斯克在X平台转发宣传,引发广泛关注。与此同时,OpenClaw也同步推出iOS和Android移动端应用,两大AI编程工具几乎撞档发布,标志着移动端正成为AI Agent工具的新入口。
04华为开源盘古openPangu-2.0-Flash,920亿参数
推荐理由:适合AI开发者与企业技术团队阅读。华为正式开源盘古920亿参数的openPangu-2.0-Flash模型,6月30日起在开源平台上线模型权重、基础推理代码及训推算子。作为华为开源AI模型品牌,openPangu致力于通过昇腾原生训练与推理技术,为业界提供最佳实践参考,助力打造Agent时代智能底座。openPangu-2.0-Pro模型将于7月开源,更多组件下半年陆续发布。
05虎牙发布实时多模态数字人VAM 1.0
推荐理由:AI从业者、直播电商与数字人开发者必读!虎牙发布实时多模态数字人VAM 1.0,基于DiT架构,仅需一张照片即可驱动7×24小时不间断直播。该模型率先突破稳定性、实时交互与工程部署“三堵墙”,支持全双工语音文字互动、随时打断接话及唱歌跳舞等才艺表演。实测首帧延迟仅1.3秒,8块H200 GPU集群达36.4 FPS,兼具高真实感与低算力开销,为直播带货、虚拟陪伴等场景提供可商用基座,标志着AI数字人从“能播”迈向“能聊”。
06天工3.2上线Skywork Tags,Agent入驻办公群聊
推荐理由:推荐企业团队、项目经理及远程协作成员阅读。天工3.2版本推出Skywork Tags功能,将AI Agent直接接入Slack、飞书、钉钉等主流IM工具,无需迁移现有工作流。该功能让AI以“共享同事”身份加入群组,实时读取上下文、承接任务并支持多人接力协作。相比私人助手,共享模式更透明且能随团队使用越用越强,避免信息孤岛。
013900亿!北京AI芯片龙头冲刺港股IPO,背靠百度,腾讯是客户
推荐理由:推荐半导体行业观察者、AI产业链从业者及科技投资者阅读。百度旗下AI芯片公司昆仑芯拟赴港上市,目标估值约500亿美元,超越母公司百度当前市值。该公司在路演中创新采用“订单换认购”模式,优先选择承诺采购其芯片的投资者,腾讯已成为其主要外部客户。昆仑芯第三代P800芯片已实现万卡集群规模化部署,正同步推进“A+H”两地上市计划。这一资本动作不仅折射出国产AI芯片赛道竞争的白热化,更标志着国产算力正加速迈向商业化独立新阶段。
02Anthropic营收反超OpenAI,企业级AI份额登顶
推荐理由:推荐投资人、企业决策者及AI行业观察者阅读。Anthropic以450亿美元ARR反超OpenAI登顶全球AI营收之王,其“B端企业路线”以高客单价和强粘性战胜“C端流量路线”,展现出惊人的造血能力。然而,Agent疯狂重试引发的百万美元计费黑洞,以及华尔街对其营收真实性的质疑,为这场商业神话埋下了隐患。当中国大模型以“免费+低成本”蓄势待发,全球AI市场的终局之战或将迎来颠覆性的降维打击。
03天塌了,DeepSeek 也要涨价
推荐理由:推荐AI开发者、企业技术负责人及API用户关注。DeepSeek V4正式版定档7月中旬,同步引入峰谷定价机制,工作日高峰时段API价格翻倍,但非高峰时段维持原价。此举旨在优化资源配置,倒逼用户通过错峰调用、提升缓存命中率来控制成本。尽管高峰成本上升,DeepSeek仍以极低单价占据大量高频调用市场。随着商业化加速,学会“错峰用AI”将成为开发者的新必修课。
04Anthropic正和SpaceX洽谈!Anthropic Labs负责人:未来将走向结果定价
推荐理由:AI开发者及行业投资人必看!Anthropic Labs负责人Mike Krieger深度揭秘,尽管Fable模型因安全争议被收回,但其展现的自主性预示着AI能力的质变。Anthropic正与SpaceX洽谈太空项目,探索从“卖Token”转向“按结果定价”的全新商业模式。同时深入探讨了AI自主权、环境感知能力对未来工作流的重塑,以及巨头入局对创业生态的影响,全面勾勒出AI从代码编写到商业变现的未来图景。
01Dwarkesh Patel:下一代AI,可能是干活干出来的
推荐理由:适合AI研究人员、机器学习工程师阅读。Dwarkesh Patel指出下一代AI训练范式的演进方向,仅靠“可验证奖励”的强化学习(RLVR)不足以应对复杂现实。核心观点在于,AI需突破“可刷题”任务的限制,通过“学习回写权重”机制,将真实世界部署中的经验沉淀为长期能力。文章解析了OPSD蒸馏与“梦境”模拟等前沿路径,描绘了AI从发布前训练转向发布后持续学习的未来图景。
02【行业观察】百亿AI短剧淘金热,最赚钱的不是“霸总”,是“生产力”
推荐理由:短剧创作者、影视从业者必读!百亿规模AI短剧淘金热背后的真正赢家并非内容方,而是提供工业化工作流的工具平台。通过将AI模型封装为标准化SaaS服务,这些“卖水人”将制作成本降低85%,并以高复购率的订阅模式稳握行业最大利润。当技术门槛被夷平,竞争回归内容本质,中小团队应利用先进的AI工作流降维打击B端市场或出海赛道,或转型为剧本供应商,以确定性的“工业流水线”放大“好故事”的商业价值。
03Codex负责人谈AI编程,最难的是删代码与判断
推荐理由:推荐程序员、技术管理者及AI从业者阅读。OpenAI Codex负责人揭示,AI时代写代码已非核心,真正稀缺的是判断与筛选能力。随着AI大幅降低实现门槛,代码库易臃肿,开发者需转型为“收尾者”,负责删减冗余、把控质量。Codex正成为调度各类工具的工作入口,未来程序员不会消失,但工作重心将后移,从编写代码转向对AI产出物的审查、重构与价值判断。
- END -