“龙虾”算力挑战：需求激增与供给瓶颈

发布时间：2026-04-02 09:21阅读：14

在“龙虾”挥舞的双钳之下，一个巨大的算力黑洞逐渐显现。

有机构计算发现，相较于传统聊天机器人，智能体的Token（词元）消耗可增加数十倍，即使是稍复杂的任务，其背后的算力消耗也可能达到普通对话的百倍甚至千倍。科技博主实测显示，若将“龙虾”作为生产工具广泛使用，一周的费用可能接近万元。

数据清晰地反映了这一趋势。“养虾”热潮兴起后，模型调用量迅速攀升。全球API聚合平台OpenRouter的数据显示：3月16日至22日，全球大模型调用量已达20.4万亿Token，一周内增长超过两成。其中，中国大模型的周调用量涨幅更是超过五成，并已连续三周超越美国。当周全球调用量排名前四的模型，均来自中国。

国家数据局的数据表明，今年3月，中国日均Token调用量已突破140万亿，两年间增长了上千倍。

许多业内人士认为，这种增长既令人振奋，也潜藏隐忧。

3月27日中关村论坛年会上的一场AI主题论坛上，算力缺口成为热议话题。“OpenClaw引发了算力需求的急剧增长。”无问芯穹CEO夏立雪指出，“类似的情况，上次出现在3G手机普及时，当时手机流量不足。未来，我们的手机可能会配备两张卡，一张是SIM卡，另一张则是‘Token卡’。”

然而，需求的增长曲线已经非常陡峭，而供给却尚未完全跟上。“让更智能的模型执行更复杂的任务，资源消耗巨大。如果算力不足，一个问题提交后长时间没有响应，用户体验将大打折扣。”智谱华章CEO张鹏直言不讳。在他看来，推理需求正以百倍速度爆发，算力很可能成为制约行业发展的关键瓶颈。

夏立雪认为，在当前阶段，单纯扩大算力规模并非最佳选择，而是应充分利用现有资源。他提出，应加快构建高效、标准化的“Token工厂”，提供稳定且规模化的Token服务，使顶尖模型能力更好地赋能各类下游场景，提升每个Token的转化效率，确保算力的高效利用。

展望未来，基础设施本身也将迈向智能化，能够自我调度、自主优化，甚至内置Agent作为“管理者”，实现算法与算力系统的深度协同。

面对“算力焦虑”，也有声音强调架构创新的重要性。

小米MiMo大模型负责人罗福莉回忆，两年前，在算力受限的情况下，中国团队通过模型架构创新，成功提升了效率，例如DeepSeek的探索，这为他们带来了信心和动力。

如今，尽管硬件条件已显著改善，国产芯片不再受限制，但对更低推理成本和更高算力效率的追求，仍将在智能体时代成为未来竞争的核心要素。（记者崔爽）

← 上一篇：全球首座纳米微振实验室启用下一篇：低空经济新生态｜卫星通信构建智慧通道 →