2026年AI Agent行业专题研究:Token消耗高速增长,国产大模型跃居国际领先阵营
概要:Agent推动AI模型调用迎来加速节点,全球活跃Agent数量将从2025年2860万攀升至2030年22.16亿,Token消耗呈现爆发式增长。2025年全球AI产业规模达1.8万亿美元,AI模型市场CAGR达74%。OpenAI与Anthropic领先,国产大模型依托开源、成本及性能优势进入第一梯队,MiniMax、千问、智谱等表现亮眼。行业由“规模扩张”转向“精细运营”,B端与C端同步崛起。投资重点关注模型端(阿里、百度、MiniMax、智谱)、AIInfra(第四范式、百融云)、算力端(金山
AI,新时代的“鸦片战争”
坚守原创 坚持深度钻研Musa随着智能体时代的序幕拉开,众人纷纷深陷其中,每日为 Token 的消耗而忧心忡忡。 当人们习惯了智能体的聪慧与便捷,工作再也离不开它时,便每日忧虑着:额度还有多少?速度限制如何?流量上限在哪?哪家模型更精纯、品质更优?特别是程序员这一圈层,这种焦灼感尤为突出。 从“传统编程”过渡到智能体编程,人人似乎都成了编程高手,也与此深度捆绑。 若是几分钟内 Token 供应不上(例如遭遇限速、限流或额度耗尽),这群人便会集体陷入恐慌:坐立难安,心乱如麻,如饥似渴,六神无主。 许多人坦言
AI服务的两种计费模式深度解析
当前AI领域主要存在两种计费机制:按Token计费(市场主流)与按成果计费(发展新趋势)。按成果计费更适用于企业级、高价值应用场景,其核心在于将费用与实际产生的业务价值紧密关联,有效弥补了按Token计费模式的不足。一、深入理解:两种计费模式解析1. 按Token计费(目前主流方案)Token是AI处理文本的最小计量单位(词汇碎片)。- 计费规则:费用 = 输入Token数量 × 单价 + 输出Token数量 × 单价- 核心特点:- 费用透明、精确可算- 消耗多少支付多少,更适合通用API接口、个人及轻
迅策早盘升幅近8% 日前与国家级深圳数据交易所达成战略合作
“Token第一股”迅策(03317)早盘升幅近8%,截至发稿,股价上升7.74%,现报337港元,成交额9.52亿港元。 值得一提的是,迅策日前与国家级深圳数据交易所达成战略合作协议,标志着中国Token出海从“野蛮生长”迈向“合规化出口”。深数所作为国家级数据交易基础设施,正构建数据跨境流通的合规通道。此次合作将为迅策提供不可复制的“数据护照”,让Token出海有据可循、有路可走。
AI算力全链价格攀升 产业进入"能效比拼"新阶段
算力,正成为人工智能时代最为紧缺的“硬通货”,当前全产业链价格持续上扬。 海外英伟达H100一年期租赁价格涨幅接近40%;国内云服务商集体调整定价——腾讯云Tencent HY 2.0 Instruct模型输入价上涨463%后再次整体提价5%,阿里云平头哥真武810E等算力卡产品上调5%~34%,百度智能云相关服务上调5%~30%,科大讯飞智算平台AI推理服务涨价8%,商汤科技SenseCore大模型训练费用平均上浮12%,智谱2月以来3次提价……近期算力产品全链涨价,持续两年多的人工智能“价格战”骤然逆
AI行业的激烈竞争
观察AI从业者们的拼搏精神, 若实现tokens自由让大模型相互交流必定十分精彩
苹果采购部门 AI 使用率与招聘挂钩引争议
根据一位前苹果全球采购员工在 X 平台公布的内部信息,苹果正在显著加速 AI 在业务部门的部署应用。苹果全球采购(Global Sourcing)团队近期已获得 Anthropic 旗下 Claude 的使用权限,并被设定了每日约 300 美元的 Token 配额。说明:一位在 Apple 工作的朋友透露,近几周来,其团队已取得 Claude 的使用权限,每天的 token 配额大约为 300 美元。这里指的是业务方面的全球采购团队,而非工程团队。另外还了解到,现阶段当总监申请补充人员时,管理层会先审视该
算力定价回归理性
算力可以走普惠路线,可以追求性价比。但没有厂商,能一直为爱发电。/文|罗小媚编|杨肖若 张弘一出品|商业秀“月均调用API超15万次每月”,盯着团队开发的AI客服SaaS工具后台近三个月的API调用量和账单,李然的眉头紧锁。4月13日,阿里云官网的一纸公告,更让李然的心一沉。公告显示,调整DataWorks标准版、专业版用户的API(应用程序编程接口)免费额度并支持按量付费。DataWorks标准版,调用API的免费额度调整为10万次/月,超出部分采用OpenAPI按量付费的方式。这意味着,从4月14日
人工智能要闻 TOP13 | 2026年4月15日
日期:2026年4月15日1. GPT-6将于4月14日发布:200万Token上下文,性能暴涨40%OpenAI代号"Spud"的GPT-6已完成预训练,支持200万Token超长上下文,采用原生多模态统一架构,强化长期任务执行能力。性能较前代提升约40%,被视为对竞争对手进展的直接回应。2. Alphabet计划2026年AI资本支出翻倍至1850亿美元谷歌母公司宣布大幅增加AI基础设施投资,主要用于数据中心扩建和定制化AI芯片研发。四大科技巨头2026年AI总投资预计达6500亿美元
AI共学营Day2:AI焦虑刚愈,Token烦恼又生!
作为FemAI全女性AI学习营的助理导师,我日常与编程和系统漏洞为伍。开营首日,我还用通俗话语宽慰众人:"别担心,AI并非可怕怪兽,我们循序渐进。" 不料首日直播刚落幕,社群就几近沸腾!AI学习消解了众人的AI恐慌。然而... 大家的担忧并未消散,只是转移了阵地?!众人开始对那个名为Token的数值忧心忡忡:尽管飞书claw自带免费Token配额,共学营也为学员的Token账户充了值。但目睹AI不时停摆的时刻众人仍陷入"用不完揪心,用完了更心慌"的Token忧虑状态。Token焦虑,究竟如何化解呢?Tok
企业AI告别试水期:Token经济时代正式开启
核心要点:巨头们不再热衷于AI演示,开始精算投入产出——每个Agent消耗多少Token、解决何种业务、谁负责运维。这并非技术迭代,而是管理范式变革。Box掌门人Aaron Levie近期发布长文,剖析企业AI落地现状。他指出当前企业AI正从“遍地开花”迈向“精准自动化”。含义何在?即不再广泛试验AI,而是精细测算每个场景适用模型、投入预算、创造何种价值。这背后涌现新术语“Tokenmaxxing”——企业如同管理云开支般管控Token预算。过去是“先探索AI能力边界”,如今是“这项任务值得多少Token
智能算力时代的生态重构:云网融合至算力互联网全面解析与1+M+N架构
人工智能的深度渗透,彻底改写了云计算的发展轨迹与体系架构,传统通用计算主导的时代宣告终结,智能算力成为绝对主角。当前,我国算力总规模已达 280EFLOPS,其中智能算力占比超 32%,年增速高达 74.1%,远高于通算与超算。大模型参数从百亿、千亿迈向万亿级,训练推理对算力、网络、存储的协同需求呈几何级膨胀,供需差距超 200 倍,传统云架构面临高密度、高弹性的结构性挑战。在此背景下,云计算正经历三大核心变革:AI 云体系架构的核心,是构建 “算力池化 — 智能调度 — 高效训推 — 生态开放” 的全栈
王帅论道:从万类智联到万智互联,虚商开启Token计量新纪元
近期,联想集团副总裁、联想懂的通信CEO王帅博士于移动转售产业生态发展大会作主旨发言,并表示行业正处于从“万类智联”向“万智互联”跨越的重要转折点,智能正由功能、工具、方法升维为数字空间的核心实体,新一代联接网络将是亿兆级人工智能体协作网络。 十年前,在联想懂的通信创立周年全球战略发布会上,王帅曾以“从万物互联到万类智联”为题作演讲,首倡“智能互联网”“智联网”理念,并预测“虚拟运营商的机遇,将诞生于智能互联网、共享经济与全球化的交汇点”。 十年后的当下,万类智联已从蓝图变为实景,万智互联纪元正快步逼近。
海富通基金吴昊:AI行业发展势头持续,重点关注算力与半导体设备领域
吴昊海富通基金经理3月,全球市场主要围绕中东局势变化反复定价,中小盘资产表现相对优于大盘资产(或主要受到机构资金行为影响)。随着中东局势出现缓和迹象,美伊达成临时停火协议,全球市场风险偏好回升,光通信、算力、PCB等成长资产强势反弹。目前看来,美伊冲突短期彻底平息的可能性较小,谈判博弈与局部摩擦大概率将持续存在。在此大背景下,地缘政治不确定性犹存,油价或将维持高位,全球市场高波动特征或将延续。在AI产业宏大叙事持续演绎的背景下,当前主要关注海外算力、国产算力、半导体设备等方向。阶段A股成长板块投资受海外映
百日涨幅超六倍,迅策能否支撑千亿市值?
来源:雷达Finance 雷达财经出品 文|彭程 编|孟帅 从上市前一日暗盘交易一度暴跌35%,到市值强势冲破千亿港元大关,迅策(03317.HK)仅用100天时间,就完成了一场令人侧目的资本逆袭。 截至4月13日收盘,这家被冠以"Token第一股"名号的公司,股价定格在358.4港元/股。自上市以来,其股价累计涨幅已超600%。 而驱动迅策这轮股价狂飙的催化剂,正是Token调用量的指数级攀升和席卷整个AI行业的Token涨价潮。 作为"数据燃料提供商",迅策正加速推进从项目制、订阅制向探索按Token