标签

字节跳动:打造高效Token工厂

发布时间:2026-04-03 18:30来源:新浪新闻阅读:11

Token的竞争焦点已从规模消耗转向高质量消耗。Agent是否能支撑企业级服务的能力边界,正受到考验。

曾经被称为‘App工厂’的字节跳动,现在正致力于成为高效的‘Token工厂’。

4月2日,在‘2026年AI创新巡展’上,火山引擎总裁谭待提到,截至今年3月,豆包大模型的日均Token使用量已突破120万亿,在过去三个月内增长了一倍。从规模来看,Token使用量仅次于谷歌和OpenAI。

火山引擎将这一成就归功于两大产品的推动:Seedance2.0的领先地位以及OpenClaw(龙虾)的流行。Seedance2.0的SOTA能力使AI创作产业化和商业化成为可能。过去,生产AI漫剧每分钟的成本高达万元以上,但在Seedance的帮助下,成本降低了50%。龙虾则完成了对Agent的普及教育,使Token成为行业的‘AI货币’。

谭待在会后对《中国企业家》等媒体表示,两年前提出的Token概念并未得到行业认可,认为Token粘性差、毛利低,只是赔本赚吆喝。

直到2025年下半年,关于Token的计费和统计口径的争论仍然激烈。火山引擎强调真实的Token消耗,而阿里云则更注重有效的API调用,双方因此展开了‘谁是云厂商第一’的争论。

年初,一切都有了答案。Token被视为衡量大模型使用效率和企业AI转型的核心指标。3月16日,阿里成立了ATH(Alibaba Token Hub)事业群,由阿里巴巴集团CEO吴泳铭直接负责,目标是‘创造Token、输送Token、应用Token’。

火山引擎也因此赢得了MaaS的第一场胜利——尽管未来的竞争可能会更加激烈。

随着MaaS和Token成为行业共识,头部厂商纷纷加入,赛道全面升温。竞争焦点从规模化的Token消耗转向高质量、高效率、高价值的消耗。与此同时,Agent能否支撑企业级服务的能力边界,也面临挑战。

一方面,各家公司需要加强Agent的技术能力和服务效率,提升长文本理解和多源信息调取能力。另一方面,火山引擎也越来越依赖豆包大模型和飞书等生态体系的深度协同。

字节也在积极变革。一方面,Seed团队持续攻克技术极限,打造视频生成、图像创作、代码编程、文本理解等领域的SOTA标杆模型,不断刷新模型能力上限;另一方面,火山引擎加快了技术能力的产品化和工具化,高效推向市场。

4月2日,火山引擎宣布Seedance2.0正式面向企业用户开放公测,同时推出自己的龙虾产品‘ArkClaw’。此外,火山引擎还采取了几项措施,迎接Token浪潮。

首先,要提升Token能力并确保定价优势。谭待表示,新一代模型将有不同的尺寸,如Pro、Lite、Mini。Token价格需与模型能力及产出价值绑定,即使单Token的理论成本更高,但创造的经济价值也要同步提升。

其次,产品和工具应具备‘Skill化’和插件化,便于龙虾集成。针对企业高频场景,火山引擎推出了营销视频、数据处理、联网搜索、市场洞察、ClawSentry安全防护等多种Skill。字节还上线了ClawHub中国镜像站,提供优质的Skill供开发者一键下载安装。

再次,深度协同抖音等超级App。一位抖音电商商家透露,抖音已对商家发布的带货、营销视频提出原创要求,不能是混剪或二次创作。但对于AI原生视频,抖音持宽容态度,“AI生成视频标原创完全没有问题”。

随着Token资源消耗量的急剧增加,算力资源紧张和供需失衡的问题显现,不少大模型厂商开始涨价。

例如,腾讯的混元部分模型输入和输出价格均上涨了超过5倍。阿里云对AI算力、存储等产品进行了调价,采用自研芯片的‘平头哥真武810E’等算力卡产品价格上涨了5%至34%。百度智能云也宣布,AI算力相关产品服务上调5%至30%,并行文件存储等上调约30%,两家的新价格均从4月18日起生效。

面对涨价潮,谭待的观点是:看Token价格,不能忽略模型能力,否则没有意义。“就像买手机、芯片要看单算力成本一样,to B也是同样的逻辑。模型智力水平提高自然会涨价,也能创造更大价值。”

谭待建议,要回归第一性原理。在同等级模型中,通过工程和调度优化,做到成本最低。

他以近期被频繁吐槽的龙虾耗费Token费用过高为例,“不是Token本身贵,而是无效Token消耗过多。其中一大半是无谓的探索,这可以通过优化Skill配合和压缩来解决。”

为鼓励员工更多使用龙虾/Coding等AI工具,许多公司加大了Token补贴。一些科技公司甚至通知,使用Token少的公司将面临末位淘汰的风险。

这也引发了一个重要问题:当员工借助龙虾、Claude Code等AI工具实现个人能力提升后,企业的整体组织生产力是否也会同步提升?

谭待在演讲中建议,企业管理者应建立专属的Token看板,每天查看企业内部和外部使用的Token量,鼓励员工通过AI提升效率。

同时,他也提出了一个启发性的观点:企业构建Agent体系可分为敏态和稳态两种思路,可以同步进行。

敏态Agent更强调探索,重点解决个人生产力问题,是企业的‘创新试验场’。例如帮助HR优化招聘、辅助市场人员进行深度分析、支持员工提升专业效率等,都可以大胆尝试、快速迭代。

稳态Agent则是找到‘最佳实践’后,将AI能力流程化,管理好Token的成本、效率和风险。例如合同交易、流程生产等,需要固化Agent流程,降低幻觉,做好规模化服务,重点解决组织生产力问题。

虽然字节已经凭借领先的Token消耗规模领跑,但科技公司围绕龙虾的竞争依然激烈。腾讯上线的龙虾系产品主打直连微信和QQ,抢占用户心智。火山引擎则以技术和生态为武器,推出字节版ArkClaw,以及各种Skill和插件适配。

火山引擎云基础产品负责人田涛涛表示,如果一件事重复做三次,就应该写成一个Skill。Skill是最小可复用的Agent能力单元,它将‘人会做的事’转化为‘Agent会做的事’。

一个标准的Skill包括三个方面:第一,能力定义,精准描述业务能力;第二,调用方式,提供具体的技术执行路径和参数约束,如API或CLI(命令行界面);第三,安全管控,确保能力调用的合规和安全,如API Key。

火山引擎正在将过往的能力和产品Skill化。例如,将视频内容理解、分辨率调整以及视频修复打包成Skill,方便用户将其安装到龙虾中,特点是开箱即用。

在生态建设上,字节跳动不仅上线了ClawHub中国镜像站,解决了国内开发者访问延迟问题,还打造了企业级SkillHub平台,提供Skill开发、审核、发布、运营、下架全生命周期管理。相关负责人透露,未来Skill将实现资产化,第三方企业可将自研Skill上架至平台,火山引擎将提供完整的商业化路径。

谭待在接受采访时也表示,在Skill技能层面,一是坚持开放,二是整合自身已有的能力和资源。“不用太担心竞争问题,目前中国龙虾类产品的用户量大概只有百万量级,而中国的工作人员数量庞大,若人人手里有一两只龙虾,市场潜力非常大。”

《中国企业家》观察到,火山引擎也试图将龙虾能力装进硬件,它们委托第三方公司制作了一款硬件产品‘显眼包’,帮助ArkClaw的龙虾能力落地。其试用的场景包括个人助手、养娃陪伴以及飞书办公等。

2025年底,火山引擎曾推出玩具AI框架、音频AI框架等开发套件。如今,为了释放龙虾能力,火山引擎还将‘AI音视频互动’作为插件供龙虾调用,让龙虾‘开口说话’。

一家AI影视公司在演讲中说,他们正在使用火山的AI应用开发工具‘AI MediaKit’打造‘视听数字员工’。MediaKit内置了多个原子能力的Skill,如剪辑工具、音频工具、AI处理工具等,配合本地部署的ArkClaw,可覆盖制片、剪辑、宣发等环节,显著提升全流程效率。

全力推进自身布局的同时,火山引擎面临的外部竞争愈发激烈。

科技企业围绕Token的争夺,已从业务层面的布局比拼,深入渗透至组织架构、产品体系、生态协同等核心维度。一场关乎未来算力分配、生态主导权与商业化制高点的行业竞速,已然全面打响。