AI周报：大模型迈入“付费纪元”，产业焦点从“算力扩张”转向“Token变现”

发布时间：2026-07-01 22:44阅读：2

覆盖时段：2026.07.01 – 2026.07.07

大模型全面告别“免费时代”：DeepSeek V4正式版7月中推出，高峰期API费用加倍；豆包上线三种会员套餐（68/200/500元/月）；智谱年内三次调高API定价。AI行业从“跑马圈地”正式进入“盈利收割”阶段。

国务院常务会议部署AI发展：推进大规模智能计算集群建设，强调建立灵活调整、分类分级安全监管机制，AI产业获最高级别政策加持。

AI代理支出2026年预计达2065亿美元，同比增长139%，企业应用渗透率从不足5%提升至40%，AI代理正从概念验证转向规模化部署。

招商证券研报指出AI产业主线正从“扩CapEx”转向“Token生产与商业化”，大模型正从“吞金兽”变为“印钞机”。

具身智能融资持续狂热：跨维智能完成10亿元B轮融资、投后估值超百亿元；求之科技完成超1亿美元天使轮融资，创消费级具身机器人赛道单笔天使轮最高纪录。

GitHub AI工程化趋势深化：Headroom开源狂揽4.4万星，Token消耗降低90%；AI/LLM与Agent生态项目占比达48%。

大模型全面告别“免费时代”，行业进入付费前夜

7月1日，随着算力成本持续攀升，国内外大模型厂商集体转向收费模式。DeepSeek宣布V4正式版将于7月中推出，同步启用峰谷计费机制——以DeepSeek-v4-pro为例，输入价格（缓存命中）平时为0.025元/百万tokens，高峰时段升至0.05元/百万tokens；输出价格平时为6元/百万tokens，高峰时段为12元/百万tokens。高峰时段为每日9时至12时、14时至18时。

字节跳动旗下豆包上线三种会员套餐：标准版68元/月、加强版200元/月、专业版500元/月。依托豆包2.1系列大模型打造全新办公任务模式，支持本地电脑操控、浏览器调用、Office套件、应用搭建、定时任务与专业技能包。

智谱AI年内已三次调高API定价，各型号涨幅均在30%以上；腾讯云、阿里云、百度智能云也相继调高AI算力及相关服务价格。一个不争的事实正在浮出水面：免费使用AI的日子所剩无几了。

豆包上线专业版付费订阅

6月24日豆包专业版正式上线，分68元、200元、500元三档包月套餐，学生可享专属低价，免费用户也可体验轻量化办公能力。火山引擎数据显示，截至2026年6月，豆包大模型日均Token调用量达180万亿，较发布时增长超1500倍。

OpenAI ChatGPT与Codex整合为“超级应用”

6月初，OpenAI宣布将在未来几周内推动ChatGPT与智能体Codex深度整合，形成统一入口的“超级应用”。与擅长对话的大语言模型不同，Codex的主要功能是“执行”，如写邮件、管理日程、制作报告等。

微软发布自研推理模型MAI-Thinking-1

微软发布了一款名叫MAI-Thinking-1的推理模型——不是“Copilot更新”、不是“OpenAI新能力集成”，而是微软“自家的”模型。微软向OpenAI投入了超过130亿美元，但到了2026年，这种深度绑定开始显示出两面性：微软在AI技术栈的关键层面上对OpenAI形成了高度依赖。MAI-Thinking-1的定位很明确：在Azure内部工具链、Office的本地AI功能、以及GitHub Copilot的部分代码推理任务中，逐步切换到自己MAI模型家族。

OpenAI推理成本削减50%，发动价格战

OpenAI工程师将部分现有模型的推理成本降低了50%以上，使该公司能够以Anthropic竞品Claude Fable 5一半的价格为旗舰产品GPT-5.6 Sol定价，同时在基准测试中表现更优。Sol在Terminal-Bench 2.1基准测试中得分高于Anthropic的Claude Mythos 5，但成本比Claude Fable 5低50%。OpenAI正接近完成一轮1200亿美元融资，投前估值为7300亿美元。

微软与Anthropic达成关键合作，Claude登陆Azure

微软通过投资Anthropic 50亿美元并采购300亿美元Azure算力的合作，构建多模型AI生态（OpenAI旗舰店＋Anthropic精品店＋xAI特色店），降低企业接入成本并分散对单一供应商的依赖。

美团LongCat-2.0大模型调用量跻身全球前三

6月30日，美团正式发布采用MoE架构的LongCat-2.0大模型，总参数1.6万亿，原生支持1M超长上下文。Preview版本在OpenRouter平台调用量跻身全球前三。

字节跳动计划明年初推出自研CPU

字节跳动计划最晚明年初完成下一代自研CPU设计，2027年下半年大规模部署。早期版本已从去年底开始在内部使用。

中国银联联合腾讯云推出“AI智算卡”

中国银联联合平安银行、腾讯云推出“AI智算卡”，面向AI算力个人消费用户提供借记卡产品，核心权益包括大模型Token套餐、GPU推理时长和AI办公学习工具使用权益，7月陆续开放申请。

招商证券发布研报称，2026年AI产业主线正从“扩CapEx”转向“Token生产与商业化”，市场关注点由谁建设更多GPU和数据中心，转为谁能用更低成本、更低延迟生产并变现更多Token。大模型侧，技术竞争从参数扩张转向推理、Coding、Agent，企业级Coding场景率先验证商业化。算力侧，Token经济推高算租需求，国产芯片与算电协同构成中长期底座。

行业观察指出，2026年AI圈像极了当年视频网站的“付费前夜”。2025年OpenAI全年营收约130亿美元，总成本和支出却高达340亿美元，全年净亏损390亿美元——用户越多，亏得越多，这个反直觉的公式正在成为AI行业的集体噩梦。豆包单次推理成本中硬件折旧占58%，电力消耗占29%。这不是厂商想收钱，而是算力账单实在扛不住了。

国泰海通证券维持计算机板块“增持”评级，推荐标的包括寒武纪、海光信息、浪潮信息等。

直接利好

寒武纪、海光信息（国产算力）：国务院部署推进大规模智能计算集群建设，叠加Token经济推高算租需求，国产算力作为AI自主可控的战略底座持续受益。

浪潮信息、中科曙光（算力基础设施）：AI算力需求爆发推动数据中心建设进入黄金期，单柜功率突破30kW。

间接利好

Anthropic发布Claude Sonnet 5低价模型

7月1日，Anthropic推出Claude Sonnet 5，定位为“便宜版Opus”，能力接近Opus 4.8但价格更低，API首发窗口期至8月31日。新模型强化Agent能力，支持浏览器和终端工具调用，同时发布面向科研场景的Claude Science平台。

OpenAI开启高端企业AI咨询业务

7月1日，OpenAI开始提供起步价1000万美元的企业AI咨询服务，从卖模型转向陪客户干活，直接与麦肯锡等咨询公司竞争。

DeepSeek联合北大发布DSpark推理加速框架

6月30日，DeepSeek团队联合北京大学发布DSpark论文，提出半自回归推测解码新方法，在DeepSeek-V4线上系统中推理速度提升60%至85%。创始人梁文锋亲自参与研发，框架已开源并适配阿里Qwen3等主流模型。

跨维智能完成10亿元B轮融资，估值超百亿

6月30日，物理AI、具身智能企业跨维智能完成B轮融资，融资金额10亿元，投后估值超百亿元。投资方包括深创投、贵阳数字经济基金、前海母基金、蓝思科技、工银资本等。跨维智能选择了“世界模型+物理仿真+真机落地”的技术路径，产品主要落地应用于智能制造、商业服务等领域。创始人贾奎表示，行业已充分认识到VLA路线的局限性，面向具身智能的世界模型需要理解三维物理世界。

求之科技完成超1亿美元天使轮融资

7月1日，求之科技宣布完成超1亿美元首轮融资，创下消费级具身机器人赛道单笔天使轮融资最高纪录，参投方包括君联资本等。

自变量机器人估值突破200亿元

自变量机器人连续完成B+、B++和C轮融资，估值突破200亿元，投资方包括小米战投。

英伟达机器人团队在京沪深招人

7月1日，英伟达机器人团队在北京、上海、深圳三地启动招聘。

招商证券指出，AI产业技术竞争正从参数扩张转向推理、Coding、Agent。企业级Coding场景率先验证商业化，B端因付费能力和结果可验证性更强，成为AI应用规模化落地的主战场。

具身智能领域，世界模型正从学术概念走向一级市场融资热门方向，短时间内催生出多家估值超百亿的独角兽企业。跨维智能、极佳视界、千寻智能、自变量、智平方等均获得大额融资。行业共识正在形成：VLA路线存在局限性，难以解决具身智能模型的通用泛化性问题，面向具身智能的世界模型成为新方向。

直接利好

跨维智能（未上市）：10亿元B轮融资完成，投后估值超百亿，具身智能“大脑”赛道再添独角兽。

自变量机器人（未上市）：估值突破200亿元，小米战投入局。

间接利好

国务院常务会议：推进大规模智能计算集群建设

6月29日召开的国务院常务会议听取人工智能发展情况汇报，指出要加快关键技术攻关和大规模智能计算集群建设，强化高质量数据供给，加强人才、资金等要素保障，支持企业开展基础研究和前沿探索。会议强调，要守牢人工智能安全底线，完善科技伦理、测试认证等制度规则，建立灵活调整、分类分级安全监管机制。2025年，我国人工智能核心产业规模已超过1.2万亿元，企业数量超过6200家。

AI应用迈入强监管时代

随着治理举措密集落地，行业生态正在发生实质改变。强制标注制度让AI内容亮明身份，举报专区降低了用户维权门槛。《网络安全标识管理办法》自2026年7月1日起正式施行，旨在提升产品的网络安全能力。

亚马逊投入10亿美元组建AI前部署工程师部门

亚马逊投入10亿美元组建AI前部署工程师部门，标志AI商业模式从模型销售向交付服务转型。

英伟达Rubin平台秋季量产，全液冷方案落地

英伟达Vera Rubin平台将于2026年秋季量产出货，作为全球首款100%全液冷AI计算平台，整套散热方案被纳入英伟达DSX AI工厂参考设计。

OpenAI自研推理芯片Jalapeño年底部署

OpenAI联合博通、Celestica推出自研AI芯片Jalapeño，专为大语言模型推理设计，从零研发仅耗时9个月，创下高性能ASIC最快研发纪录，样片已适配GPT系列模型，整套算力平台2026年底启动部署。

交换机接棒GPU成AI集群新瓶颈

随着AI集群规模扩大，交换机成为新的性能瓶颈，工业富联凭借CPO订单受到市场高度关注。

国务院常务会议部署AI发展，标志着AI产业获得最高级别政策加持。招商证券指出，算力侧Token经济推高算租需求，国产芯片与算电协同构成中长期底座。国产算力作为我国AI自主可控的战略底座，2026年以来呈现硬件性能迭代、模型适配加速和商业化扩容三大发展趋势。

行业观察指出，AI服务器MLCC用量激增推动价格暴涨——英伟达GB200 NVL72单机MLCC用量达44.1万颗，相比普通服务器增长220倍。2026年1-6月高端AI服务器MLCC价格累计上涨50%-60%，部分现货型号涨幅达5-10倍。

直接利好

寒武纪、海光信息（国产算力）：国务院部署大规模智能计算集群建设，国产算力战略地位进一步强化。

工业富联（交换机/算力基础设施）：交换机成AI集群新瓶颈，CPO订单预期推动估值重估。

间接利好

说明：基于GitHub Trending第26周数据（6月24日-7月1日）综合整理。

← 上一篇：豆包AI后台真有人审？隐私疑云引爆热议下一篇：探秘智能未来：AI改变生活 →