标签

“龙虾”算力挑战:需求激增与供给瓶颈

发布时间:2026-04-02 09:21来源:科技日报阅读:9

在“龙虾”挥舞的双钳之下,一个巨大的算力黑洞逐渐显现。

有机构计算发现,相较于传统聊天机器人,智能体的Token(词元)消耗可增加数十倍,即使是稍复杂的任务,其背后的算力消耗也可能达到普通对话的百倍甚至千倍。科技博主实测显示,若将“龙虾”作为生产工具广泛使用,一周的费用可能接近万元。

数据清晰地反映了这一趋势。“养虾”热潮兴起后,模型调用量迅速攀升。全球API聚合平台OpenRouter的数据显示:3月16日至22日,全球大模型调用量已达20.4万亿Token,一周内增长超过两成。其中,中国大模型的周调用量涨幅更是超过五成,并已连续三周超越美国。当周全球调用量排名前四的模型,均来自中国。

国家数据局的数据表明,今年3月,中国日均Token调用量已突破140万亿,两年间增长了上千倍。

许多业内人士认为,这种增长既令人振奋,也潜藏隐忧。

3月27日中关村论坛年会上的一场AI主题论坛上,算力缺口成为热议话题。“OpenClaw引发了算力需求的急剧增长。”无问芯穹CEO夏立雪指出,“类似的情况,上次出现在3G手机普及时,当时手机流量不足。未来,我们的手机可能会配备两张卡,一张是SIM卡,另一张则是‘Token卡’。”

然而,需求的增长曲线已经非常陡峭,而供给却尚未完全跟上。“让更智能的模型执行更复杂的任务,资源消耗巨大。如果算力不足,一个问题提交后长时间没有响应,用户体验将大打折扣。”智谱华章CEO张鹏直言不讳。在他看来,推理需求正以百倍速度爆发,算力很可能成为制约行业发展的关键瓶颈。

夏立雪认为,在当前阶段,单纯扩大算力规模并非最佳选择,而是应充分利用现有资源。他提出,应加快构建高效、标准化的“Token工厂”,提供稳定且规模化的Token服务,使顶尖模型能力更好地赋能各类下游场景,提升每个Token的转化效率,确保算力的高效利用。

展望未来,基础设施本身也将迈向智能化,能够自我调度、自主优化,甚至内置Agent作为“管理者”,实现算法与算力系统的深度协同。

面对“算力焦虑”,也有声音强调架构创新的重要性。

小米MiMo大模型负责人罗福莉回忆,两年前,在算力受限的情况下,中国团队通过模型架构创新,成功提升了效率,例如DeepSeek的探索,这为他们带来了信心和动力。

如今,尽管硬件条件已显著改善,国产芯片不再受限制,但对更低推理成本和更高算力效率的追求,仍将在智能体时代成为未来竞争的核心要素。(记者 崔 爽)