AI时代，「共享算力」成了新一代开发者的出行工具

发布时间：2026-04-07 18:19阅读：31

「Token 的价格正在快速下探。」

如果这句话放在两年前，几乎足以让所有 AI 创业者为之振奋。从 2023 年到 2025 年，AI 推理成本累计下滑了 99.7%。要知道，在 GPT-4 刚发布时，每百万 Token 的成本高达 37.5 美元，而到了 2025 年，这一数字已经降到 0.14 美元。照理说，沿着这样的趋势发展，算力开销本不该再成为创业者的难题。

可现实情况却完全不是这样。

在同一时间段里，全球企业在 AI 云服务上的支出，从 115 亿美元猛增至 370 亿美元，足足扩大了三倍。随着 AI 迈入 A2A 时代，数十个智能体不断彼此协同与交互，Token 的调用量也随之呈指数式增长。这意味着，尽管单个 Token 更便宜了，但每项任务实际消耗的 Token 数量却在急剧攀升。

显而易见，算力正在变成这个时代最特别的一种资源。它的单位成本越来越低，可企业在它身上的总支出，却只会不断走高。

对头部大厂而言，这个问题还能通过自建算力中心来缓解。但对于绝大多数创业公司来说，他们只能停留在公共算力市场中，被动接受云厂商的报价，眼看每月的算力账单持续上涨，却没有多少谈判空间。

而共绩科技创始人付智，看到的正是这种供需错位背后所孕育出的机会。

在他看来，降低算力成本并不只是等待硬件或模型价格继续下跌，换一种获取和使用算力的方式，同样能够让成本下降。让算力像电力一样实现随取随用、按需付费，把那些原本闲置、被浪费的资源重新调动起来。

不久前，共绩科技完成了 Pre-A 轮融资，投后估值达到 3.5 亿元人民币，并计划近期启动 A 轮融资。在 2025 年整个算力赛道普遍承压的背景下，这家利用人工智能技术解决资源调度问题的公司，已经悄然做到数千万级营收，客户留存率接近 100%。

共绩科技，正把算力调度做成一门真正成立的生意。

共绩科技创始人付智图源：共绩科技

当 AI 公司突然爆发，

算力成本开始有了新的解题方式

新品即将上线时，Remy 的团队几乎彻夜未眠，随时准备应对各种突发状况。

而当公司网站在 48 小时内涌入 50 万用户时，对于一家刚从内测迈向公测的 AI 创业公司而言，他们必须在极短时间里把整套基础设施扩容数十倍。虽然此前已有准备，上线前，Remy 先后测试了 Ucloud、阿里云、华为云等多家云服务平台，但当海量流量真正袭来时，他们最终采用的解决方案却来自共绩科技。

简单来说，共绩科技做的事情就是把分散闲置的算力资源调度起来，再按需分发给存在弹性需求的 AI 企业。无论是夜间空闲的网吧机器、个人用户手里的 4090，还是小型机房里的闲置设备，都可以进入共绩科技可统一调配的算力池。当客户资源不足时，就能随时从算力池中继续调用，做到即取即用。

在那 48 小时里，共绩科技紧急为 Remy 调配了接近 1900 张 GPU 卡。用户每发起一次请求，就会生成一个新的订单；当一次计算结束，订单就会立即关闭。仅那一天，平台就处理了超过百万笔订单。

「在流量峰值时，一般算力服务商临时能拿出 20 张卡已经非常不容易了，更多时候企业只能排队等待，但等待本身就意味着流量损失，这是企业最不愿看到的结果。」付智提到，也正是在那次事件之后，Remy 后续使用的大部分算力都转向了共绩科技。

Remy 对算力的需求其实并不复杂，每当流量爆发时，用户点击都要及时得到响应，算力调用必须足够迅速、足够及时，同时成本还不能太高。这些恰恰是刚起步的 AI 创企对算力最基本的要求。

相比之下，还有一类 AI 应用客户，他们面对的算力需求更加细分，但也更加贴近现实。

去年春节期间，一家在景区提供 AI 换装拍照服务的公司找到了共绩科技。他们并不是不知道流量高峰会在何时到来，但依旧很难把算力账算明白。

他们的 AI 设备大多部署在景区，一到节假日便人流密集，算力需求迅速冲高。但假期结束之后，算力需求又几乎降到零。「春节是全年最大的高峰，剩下大半年景区里都没什么人。」他们这样告诉付智。

这种剧烈的波动意味着，如果按照峰值去租算力，那平日里 90% 的时间都等于在为闲置卡持续付费；可如果按平均值配置算力，那么春节期间一定会出现供给崩溃，直接影响用户体验。「像这种需求起伏特别大的情况，在传统算力服务方案里，很难拿到合适的产品。因为这种极端峰谷差，在标准化产品的定价体系中几乎没有对应逻辑。」付智表示。

但这样的使用场景，恰恰很适合共绩科技的共享算力平台。

在那一个月里，服务节点共切换了 1963 台个人电脑，整个春节期间，服务没有发生过一次稳定性问题。「相较于客户自己按照峰值部署算力，我们帮他们节省了接近 70% 的费用。」付智补充道。

这种时间波动型需求，不只是出现在一些垂直且小众的场景里，对不少 AI 新兴公司来说，同样十分常见。

liblib 是国内用户规模最大的 AI 图片生成平台之一，他们过去曾在云厂商平台上租用了大量 GPU 卡。但如果进一步拆解数据，他们发现这些 GPU 的整体平均利用率只有 45%。

这也意味着，超过一半的显卡，每天都在无效消耗成本。

据付智介绍，像 liblib 这样的企业其实并不少见，几乎所有以职场人为核心用户的 AI 应用工具都会遇到同样的问题。白天用户密集使用，夜里用户数量显著下降。如果按峰值配置算力，夜间空置率就会很高；但如果按平均值配置，白天又很难满足全部用户需求。

AI 赛道表面上看起来热火朝天，但真正卡住企业生命线的，很可能正是算力成本这笔账。有些企业高估了算力需求，最终让算力成本拖垮现金流；也有一些企业低估了需求，在使用高峰时服务直接崩掉，用户流失后再难挽回。

「AI 应用的流量本身就是波动的，但算力市场的定价逻辑却是按稳定需求来设计的，算力成本的分摊方式也一直停留在较传统的模式里。」付智说道。这也正是为什么，一旦一家 AI 公司真的爆发，算力这笔账就必须用新的方式来计算。

过去，传统算力服务模式主要依靠长期租赁合同。企业一租往往就是一年，不管是否真正使用，都要提前支付算力费用，闲置成本只能由企业自己承担。而共绩科技做的事情，本质上是把这部分成本转移到另外一端，也就是那些本就拥有闲置算力、却无法满负荷使用的人群，比如个人用户、网吧等。这些资源原本就在空转，把它们调度起来，不会新增额外的算力建设成本，也能盘活已经存在的闲置资源。

「算力不是越多越好，」付智说，「真正重要的是它能流动，能随时被调用。」

弹性算力这门生意，

真正考验的是能源调度能力

对付智来说，决定做算力调度这门生意的起点，其实来自一次偶然的尝试。

2023 年 5 月假期，那时 AI 浪潮刚刚兴起，付智在一个 AI 创业者社群里发出了一条消息。内容非常简单：我有一台 A100，租期越短价格越低，有需要的可以联系我。

当时他其实并没有抱太大期待，毕竟自己手里只有一张显卡。可结果却完全出乎意料，最后竟然有 30 个人前来咨询，而且付费意愿都非常明确。

「我当时说，谁付款快我就给谁。」最终他挑了 5 个人来服务。一张卡、5 个客户，这件事验证了他思考已久的一个判断：普通人开始真正需要算力了。

但他也明白，这门生意之所以能在那个时间点成立，并不是因为运气，而是因为在更早之前，这件事根本不具备实现条件。

毕竟，早在 1999 年，就已经有人提出过算力共享的思路，并搭建了 BOINC 平台，吸引数十万人贡献算力，但那时它主要服务于公益性质的科学计算，所有人都可以免费使用。后来比特币火爆时，也有人想借助挖矿热潮来调度闲置算力，但这条路并不合规。

这个想法一直存在，只是始终缺少合适的土壤。

毕竟，真正拥有高性能 GPU 的普通用户，主要是 90 后、00 后。在更早之前，个人电脑上很少有人会装 4090 这样的设备。而让个人电脑能够安全运行 Linux 虚拟环境的 WSL1.0.0，也是到 2022 年才正式推出；至于跨地域远程调用个人设备、实现内网穿透的相关技术，也是在 2021 年前后才逐步成熟。

供给端、需求端以及技术条件三者同时到位，才让这门生意在今天真正具备了成立的基础。

不过在付智看来，真正让他意识到「时机已经成熟」的，并不是 DeepSeek，也不是一体机，而是 AI 的消费场景正在从小众工具，逐渐渗透到普通人的日常娱乐生活。

「一旦这个过程提速，对算力的需求就不再只是几家大公司去集中采购，而是要像电力一样，被大规模、跨节点地调度与分发。」付智说道。

这也是为什么共绩科技正在推动与国家算力中心展开合作。目前，他们已经参与了京津冀、长三角、深圳、青海等地的省级算力调度平台建设，各地已搭建的调度系统，在技术层面几乎都有共绩科技的参与。

不过，「算力调度」这件事本身，远比外界看到的要复杂得多。

算力调度与算力管理并不是同一件事。付智对二者做了明确区分：大厂更多做的是管理，把大量机器纳入统一系统，知道哪些设备在运行、哪些处于空闲状态，但要做到跨地区、跨设备的动态分发，其实很难。

而算力调度则是另一套逻辑，它需要把某地出现的峰值需求，交给其他地方闲置的算力去填补。在计算机工程领域，这其实没有成熟现成的标准答案，反而更像能源行业中的经典问题。「削峰填谷」这个词，本来就是电力系统里的概念。

付智本科就读于清华大学建筑环境与能源应用工程专业，导师是能源领域院士。他把能源调度中的算法思路迁移过来，解决的正是算力领域里相似的问题，这也构成了共绩科技最核心的技术壁垒。

当然，在工程落地过程中，这套跨地域调度系统也会碰到很多棘手问题。比如进入调度池的个人电脑，随时可能因为用户本地使用而被占走，一旦用户打开游戏，这台机器就必须退出；但下游客户要求服务又不能中断。

对此，付智采用的是热备份加预测机制，也就是为每个任务预先准备冗余节点，同时基于长期积累的历史数据，预测不同供给方的在线规律，再动态调整备份比例。数据量越大，备份就越精准，成本也会越低。「以前可能要给你备两台机器，但随着数据积累，现在很多时候备一台就够了。」至于网络传输层的不稳定，共绩的做法则是同时接入三家头部云厂商，付智表示，「不可能三家同时出问题」。

那为什么云厂商自己不去做弹性算力？

付智给出的回答是，大厂并不是没看到这个需求，只是他们在产品定位和定价策略上有自己的考虑，而共绩科技的优势则主要体现在价格和调度效率上。

弹性算力最大的矛盾在于，你必须提前准备好一批「随时可调用」的资源，但在没人使用的时候，这些资源本身就是纯粹的闲置成本。通常情况下，算力服务商给出的弹性扩容价格大约是常规价格的 5 倍，或者要求客户签一年长约，把闲置风险转嫁给客户自己承担。

共绩之所以能够提供真正意义上的弹性服务，原因在于它调用的本身就是闲置资源。这些资源并不是提前采购进来等待摊薄成本的，它们原本就处于空闲状态，因此共绩可以给出更具竞争力的价格。

据付智判断，整个市场中，大约 80% 的算力需求仍然会走向大厂的长租整包模式，剩下 20% 才属于弹性需求。付智并不打算去争夺那 80%，他更专注于那 20% 的空间，而且随着 AI 应用持续增长，这部分市场还会越来越大。「在别人那里，租得越久越便宜；在我这里，租得越短越便宜。」付智补充说。如今，共绩科技的共享算力平台「suanli.cn」已经可以让普通消费者按毫秒租用相关算力。

共绩科技团队合影图源：共绩科技

这种共享模式，其实早已在其他行业得到过验证。

付智把这门生意的本质比作 Airbnb：当城市举办大型展会、周边酒店全部住满时，Airbnb 会把有闲置房间的居民与找不到住处的参会者连接起来。算力版的逻辑也是同样的路径，AI 应用在新版本发布、流量暴涨时，需要大量额外算力，但平时又远远用不到这么多；而另一边，个人用户、网吧、小机房的算力在夜晚和工作日则有大量闲置，把这两端连接起来，就是共绩科技所做的事情。

只不过，这里共享的不是房间，而是算力资源。

算力像能源一样被调度，

AI 时代的「软件定义基础设施」

这条路径，在海外也已经有人实践。比如 RunPod，也在通过分散闲置算力提供弹性推理服务，2024 年获得了由英特尔资本与戴尔科技资本联合领投的 2000 万美元种子轮融资，客户包括 Cursor、OpenAI、Perplexity。

但在付智看来，在美国做这件事和在中国做，完全是两种不同的逻辑。

AWS 从诞生之初就提供弹性算力服务，一开始就强调按需取用，并通过高价弹性产品去服务成熟市场。但国内云计算厂商更偏向长租模式，相关政策与优惠机制也普遍向这种模式倾斜，对弹性服务的重视程度不高，用户愿意为弹性算力支付溢价的意愿也远低于美国。因此，如果把 RunPod 那套商业逻辑直接照搬到国内，价格体系很难成立。

不过，付智认为，算力调度并不是一门只靠出租算力挣钱的生意。「共享算力可能只是一个入口。」他说这句话时非常确定。在他的判断中，这门生意大概只有两三年的窗口期，只要算力供需错位还存在，这个机会就还在，但它并不会永远存在。

这种清醒的认知，在创业者中并不多见。但也正因为如此，他很早就在思考一个更底层的问题：下一个真正会爆发的 AI 应用，究竟会从哪里长出来？这个判断将直接决定未来算力需求流向。对此，付智提出了两个面向未来的判断。

第一个判断是，在他看来，中国的超级应用不会诞生于 PC 端的生产力工具，中国真正有机会跑出来的方向，是移动端社交娱乐、结合供应链能力的跨境硬件，以及那些能够融入真实生活场景的 AI 应用。

中国互联网并没有经历特别深厚的 PC 生产力工具时代，用户基本是从功能机直接跨入移动互联网。那些在美国跑出来的 AI 文档、AI 幻灯片、AI 编码助手，背后依赖的是数千万习惯用 PC 办公、且愿意为 SaaS 工具付费的用户群体，而中国并不具备同样的土壤。「全中国真有超过 1 亿人需要天天写 Word 吗？我觉得未必。」更现实的问题是，就算存在这类需求，大厂也会很快把相关能力做成免费插件。

相较之下，他在社交娱乐方向看到了更强的增长潜力。他和很多从事短剧、影视行业的人交流过，问他们为什么如此积极拥抱 AI，对方给出的反馈让他产生了新的判断：「我已经没有什么可失去的了，现在几乎没人再看电影和电视剧，我们都快活不下去了。」在他看来，这批人是中国市场里最积极拥抱 AI 的群体之一，并不是因为他们最懂技术，而是因为他们已经退无可退。「现在，愿意看电视、电影的人已经越来越少了。」

而对于 AI 硬件的发展方向，付智也有不同看法。

过去几年，AI 硬件领域最主流的思路是「万物加对话框」，也就是给各种设备都塞进一个聊天窗口。但付智并不认同这个方向。「消费者并不需要一台会写诗的冰箱。」

真正有生命力的 AI 硬件，应该进入用户本来就高频使用的场景，让 AI 在后台默默完成任务，而不是强行把用户拉到设备前和它对话。

比如说，宠物摄像头应该能自动识别猫咪是否生病，景区相机应该能自动完成换装拍照。用户不需要改变自己的行为，AI 在背后悄悄把事情处理好。「如果这类硬件未来能够基于开源模型部署，那么当流量暴涨的时候，它们同样会成为弹性算力的客户。」在付智看来，这也是共绩科技未来的重要增长点之一。

他的第二个判断，则更深一层。这个想法在 2024 年底其实就已经形成，只是直到今年，他才等到验证机会的出现。

他认为，让人直接去和 AI 逐轮对话，本身就是一种效率损耗。人类在信息输入和输出上的速度有天然上限，一次只能提出一个问题，还要等待答案返回后再继续下一轮。但 AI 却可以同时并行处理成千上万个线程，在毫秒级完成机器之间的信息传递。「让人去驱动 AI，相当于让最慢的那个环节拖住整个系统的速度。」

真正应该发生的，是 AI 与 AI 之间直接协作，也就是 A2A。一个任务发出之后，触发的是一整组 AI 的连锁运转，而人只需要定义目标，不必再介入中间每一步。这也正是为什么 OpenClaw 在今天受到关注。在付智看来，OpenClaw 真正重要的地方，不是产品本身，而是它证明了一件事：AI 与 AI 之间完全可以形成自己的协作网络，A2A 是有人愿意付费的，这条路径是成立的。

一旦 A2A 成为主流，算力消耗会是今天的数倍甚至数十倍。黄仁勋在 GTC 2026 上提到，由于 Agentic AI 和推理能力爆发，当下所需的计算量相比一年前的预期至少多出 100 倍，而这还只是开端。到了那时，算力真的会像电力一样存在，人们要考虑的不再是囤多少张卡，而是整张「算力电网」能否按需分发，算力资源管理也将真正进入调度时代。

当 A2A 真正全面到来时，算力会像电力一样，成为每个人、每个任务、每一个 AI 节点背后的基础设施。到那时，谁能够跨地域、跨设备、跨时段地把算力精准调度起来，谁就真正拥有这张网络的运营能力。

在付智看来，共绩科技如今所做的一切，都是在为那个时刻提前铺路。利用眼下这两三年的窗口期，把调度能力、节点网络以及客户关系搭建起来。等到 A2A 需求真正爆发时，这整套体系才会成为共绩科技最深的护城河。

他最近在公司内部发过一句话。采访临近结束时，他又重复了一遍：

「即便如此，这一切也才刚刚开始。」

放在弹性算力的语境里，这句话也许只是一个创业者对市场前景的乐观判断。但若放到 A2A 的大背景下，他所说的「开始」，或许并不是这门生意的开端，而是算力作为基础设施这个命题，真正迎来起点的时刻。

← 上一篇：中国移动九天AI成果获评北京人工智能先导区优秀范例下一篇：美AI公司遭五角大楼封杀，英国却全力争抢：英校CS/AI录取更难，家长别再踩坑 →