AI周报:大模型迈入“付费纪元”,产业焦点从“算力扩张”转向“Token变现”
覆盖时段:2026.07.01 – 2026.07.07
大模型全面告别“免费时代”:DeepSeek V4正式版7月中推出,高峰期API费用加倍;豆包上线三种会员套餐(68/200/500元/月);智谱年内三次调高API定价。AI行业从“跑马圈地”正式进入“盈利收割”阶段。
国务院常务会议部署AI发展:推进大规模智能计算集群建设,强调建立灵活调整、分类分级安全监管机制,AI产业获最高级别政策加持。
AI代理支出2026年预计达2065亿美元,同比增长139%,企业应用渗透率从不足5%提升至40%,AI代理正从概念验证转向规模化部署。
招商证券研报指出AI产业主线正从“扩CapEx”转向“Token生产与商业化”,大模型正从“吞金兽”变为“印钞机”。
具身智能融资持续狂热:跨维智能完成10亿元B轮融资、投后估值超百亿元;求之科技完成超1亿美元天使轮融资,创消费级具身机器人赛道单笔天使轮最高纪录。
GitHub AI工程化趋势深化:Headroom开源狂揽4.4万星,Token消耗降低90%;AI/LLM与Agent生态项目占比达48%。
大模型全面告别“免费时代”,行业进入付费前夜
7月1日,随着算力成本持续攀升,国内外大模型厂商集体转向收费模式。DeepSeek宣布V4正式版将于7月中推出,同步启用峰谷计费机制——以DeepSeek-v4-pro为例,输入价格(缓存命中)平时为0.025元/百万tokens,高峰时段升至0.05元/百万tokens;输出价格平时为6元/百万tokens,高峰时段为12元/百万tokens。高峰时段为每日9时至12时、14时至18时。
字节跳动旗下豆包上线三种会员套餐:标准版68元/月、加强版200元/月、专业版500元/月。依托豆包2.1系列大模型打造全新办公任务模式,支持本地电脑操控、浏览器调用、Office套件、应用搭建、定时任务与专业技能包。
智谱AI年内已三次调高API定价,各型号涨幅均在30%以上;腾讯云、阿里云、百度智能云也相继调高AI算力及相关服务价格。一个不争的事实正在浮出水面:免费使用AI的日子所剩无几了。
豆包上线专业版付费订阅
6月24日豆包专业版正式上线,分68元、200元、500元三档包月套餐,学生可享专属低价,免费用户也可体验轻量化办公能力。火山引擎数据显示,截至2026年6月,豆包大模型日均Token调用量达180万亿,较发布时增长超1500倍。
OpenAI ChatGPT与Codex整合为“超级应用”
6月初,OpenAI宣布将在未来几周内推动ChatGPT与智能体Codex深度整合,形成统一入口的“超级应用”。与擅长对话的大语言模型不同,Codex的主要功能是“执行”,如写邮件、管理日程、制作报告等。
微软发布自研推理模型MAI-Thinking-1
微软发布了一款名叫MAI-Thinking-1的推理模型——不是“Copilot更新”、不是“OpenAI新能力集成”,而是微软“自家的”模型。微软向OpenAI投入了超过130亿美元,但到了2026年,这种深度绑定开始显示出两面性:微软在AI技术栈的关键层面上对OpenAI形成了高度依赖。MAI-Thinking-1的定位很明确:在Azure内部工具链、Office的本地AI功能、以及GitHub Copilot的部分代码推理任务中,逐步切换到自己MAI模型家族。
OpenAI推理成本削减50%,发动价格战
OpenAI工程师将部分现有模型的推理成本降低了50%以上,使该公司能够以Anthropic竞品Claude Fable 5一半的价格为旗舰产品GPT-5.6 Sol定价,同时在基准测试中表现更优。Sol在Terminal-Bench 2.1基准测试中得分高于Anthropic的Claude Mythos 5,但成本比Claude Fable 5低50%。OpenAI正接近完成一轮1200亿美元融资,投前估值为7300亿美元。
微软与Anthropic达成关键合作,Claude登陆Azure
微软通过投资Anthropic 50亿美元并采购300亿美元Azure算力的合作,构建多模型AI生态(OpenAI旗舰店+Anthropic精品店+xAI特色店),降低企业接入成本并分散对单一供应商的依赖。
美团LongCat-2.0大模型调用量跻身全球前三
6月30日,美团正式发布采用MoE架构的LongCat-2.0大模型,总参数1.6万亿,原生支持1M超长上下文。Preview版本在OpenRouter平台调用量跻身全球前三。
字节跳动计划明年初推出自研CPU
字节跳动计划最晚明年初完成下一代自研CPU设计,2027年下半年大规模部署。早期版本已从去年底开始在内部使用。
中国银联联合腾讯云推出“AI智算卡”
中国银联联合平安银行、腾讯云推出“AI智算卡”,面向AI算力个人消费用户提供借记卡产品,核心权益包括大模型Token套餐、GPU推理时长和AI办公学习工具使用权益,7月陆续开放申请。
招商证券发布研报称,2026年AI产业主线正从“扩CapEx”转向“Token生产与商业化”,市场关注点由谁建设更多GPU和数据中心,转为谁能用更低成本、更低延迟生产并变现更多Token。大模型侧,技术竞争从参数扩张转向推理、Coding、Agent,企业级Coding场景率先验证商业化。算力侧,Token经济推高算租需求,国产芯片与算电协同构成中长期底座。
行业观察指出,2026年AI圈像极了当年视频网站的“付费前夜”。2025年OpenAI全年营收约130亿美元,总成本和支出却高达340亿美元,全年净亏损390亿美元——用户越多,亏得越多,这个反直觉的公式正在成为AI行业的集体噩梦。豆包单次推理成本中硬件折旧占58%,电力消耗占29%。这不是厂商想收钱,而是算力账单实在扛不住了。
国泰海通证券维持计算机板块“增持”评级,推荐标的包括寒武纪、海光信息、浪潮信息等。
直接利好
寒武纪、海光信息(国产算力):国务院部署推进大规模智能计算集群建设,叠加Token经济推高算租需求,国产算力作为AI自主可控的战略底座持续受益。
浪潮信息、中科曙光(算力基础设施):AI算力需求爆发推动数据中心建设进入黄金期,单柜功率突破30kW。
间接利好
Anthropic发布Claude Sonnet 5低价模型
7月1日,Anthropic推出Claude Sonnet 5,定位为“便宜版Opus”,能力接近Opus 4.8但价格更低,API首发窗口期至8月31日。新模型强化Agent能力,支持浏览器和终端工具调用,同时发布面向科研场景的Claude Science平台。
OpenAI开启高端企业AI咨询业务
7月1日,OpenAI开始提供起步价1000万美元的企业AI咨询服务,从卖模型转向陪客户干活,直接与麦肯锡等咨询公司竞争。
DeepSeek联合北大发布DSpark推理加速框架
6月30日,DeepSeek团队联合北京大学发布DSpark论文,提出半自回归推测解码新方法,在DeepSeek-V4线上系统中推理速度提升60%至85%。创始人梁文锋亲自参与研发,框架已开源并适配阿里Qwen3等主流模型。
跨维智能完成10亿元B轮融资,估值超百亿
6月30日,物理AI、具身智能企业跨维智能完成B轮融资,融资金额10亿元,投后估值超百亿元。投资方包括深创投、贵阳数字经济基金、前海母基金、蓝思科技、工银资本等。跨维智能选择了“世界模型+物理仿真+真机落地”的技术路径,产品主要落地应用于智能制造、商业服务等领域。创始人贾奎表示,行业已充分认识到VLA路线的局限性,面向具身智能的世界模型需要理解三维物理世界。
求之科技完成超1亿美元天使轮融资
7月1日,求之科技宣布完成超1亿美元首轮融资,创下消费级具身机器人赛道单笔天使轮融资最高纪录,参投方包括君联资本等。
自变量机器人估值突破200亿元
自变量机器人连续完成B+、B++和C轮融资,估值突破200亿元,投资方包括小米战投。
英伟达机器人团队在京沪深招人
7月1日,英伟达机器人团队在北京、上海、深圳三地启动招聘。
招商证券指出,AI产业技术竞争正从参数扩张转向推理、Coding、Agent。企业级Coding场景率先验证商业化,B端因付费能力和结果可验证性更强,成为AI应用规模化落地的主战场。
具身智能领域,世界模型正从学术概念走向一级市场融资热门方向,短时间内催生出多家估值超百亿的独角兽企业。跨维智能、极佳视界、千寻智能、自变量、智平方等均获得大额融资。行业共识正在形成:VLA路线存在局限性,难以解决具身智能模型的通用泛化性问题,面向具身智能的世界模型成为新方向。
直接利好
跨维智能(未上市):10亿元B轮融资完成,投后估值超百亿,具身智能“大脑”赛道再添独角兽。
自变量机器人(未上市):估值突破200亿元,小米战投入局。
间接利好
国务院常务会议:推进大规模智能计算集群建设
6月29日召开的国务院常务会议听取人工智能发展情况汇报,指出要加快关键技术攻关和大规模智能计算集群建设,强化高质量数据供给,加强人才、资金等要素保障,支持企业开展基础研究和前沿探索。会议强调,要守牢人工智能安全底线,完善科技伦理、测试认证等制度规则,建立灵活调整、分类分级安全监管机制。2025年,我国人工智能核心产业规模已超过1.2万亿元,企业数量超过6200家。
AI应用迈入强监管时代
随着治理举措密集落地,行业生态正在发生实质改变。强制标注制度让AI内容亮明身份,举报专区降低了用户维权门槛。《网络安全标识管理办法》自2026年7月1日起正式施行,旨在提升产品的网络安全能力。
亚马逊投入10亿美元组建AI前部署工程师部门
亚马逊投入10亿美元组建AI前部署工程师部门,标志AI商业模式从模型销售向交付服务转型。
英伟达Rubin平台秋季量产,全液冷方案落地
英伟达Vera Rubin平台将于2026年秋季量产出货,作为全球首款100%全液冷AI计算平台,整套散热方案被纳入英伟达DSX AI工厂参考设计。
OpenAI自研推理芯片Jalapeño年底部署
OpenAI联合博通、Celestica推出自研AI芯片Jalapeño,专为大语言模型推理设计,从零研发仅耗时9个月,创下高性能ASIC最快研发纪录,样片已适配GPT系列模型,整套算力平台2026年底启动部署。
交换机接棒GPU成AI集群新瓶颈
随着AI集群规模扩大,交换机成为新的性能瓶颈,工业富联凭借CPO订单受到市场高度关注。
国务院常务会议部署AI发展,标志着AI产业获得最高级别政策加持。招商证券指出,算力侧Token经济推高算租需求,国产芯片与算电协同构成中长期底座。国产算力作为我国AI自主可控的战略底座,2026年以来呈现硬件性能迭代、模型适配加速和商业化扩容三大发展趋势。
行业观察指出,AI服务器MLCC用量激增推动价格暴涨——英伟达GB200 NVL72单机MLCC用量达44.1万颗,相比普通服务器增长220倍。2026年1-6月高端AI服务器MLCC价格累计上涨50%-60%,部分现货型号涨幅达5-10倍。
直接利好
寒武纪、海光信息(国产算力):国务院部署大规模智能计算集群建设,国产算力战略地位进一步强化。
工业富联(交换机/算力基础设施):交换机成AI集群新瓶颈,CPO订单预期推动估值重估。
间接利好
说明:基于GitHub Trending第26周数据(6月24日-7月1日)综合整理。