AI时代,「共享算力」成了新一代开发者的出行工具
「Token 的价格正在快速下探。」
如果这句话放在两年前,几乎足以让所有 AI 创业者为之振奋。从 2023 年到 2025 年,AI 推理成本累计下滑了 99.7%。要知道,在 GPT-4 刚发布时,每百万 Token 的成本高达 37.5 美元,而到了 2025 年,这一数字已经降到 0.14 美元。照理说,沿着这样的趋势发展,算力开销本不该再成为创业者的难题。
可现实情况却完全不是这样。
在同一时间段里,全球企业在 AI 云服务上的支出,从 115 亿美元猛增至 370 亿美元,足足扩大了三倍。随着 AI 迈入 A2A 时代,数十个智能体不断彼此协同与交互,Token 的调用量也随之呈指数式增长。这意味着,尽管单个 Token 更便宜了,但每项任务实际消耗的 Token 数量却在急剧攀升。
显而易见,算力正在变成这个时代最特别的一种资源。它的单位成本越来越低,可企业在它身上的总支出,却只会不断走高。
对头部大厂而言,这个问题还能通过自建算力中心来缓解。但对于绝大多数创业公司来说,他们只能停留在公共算力市场中,被动接受云厂商的报价,眼看每月的算力账单持续上涨,却没有多少谈判空间。
而共绩科技创始人付智,看到的正是这种供需错位背后所孕育出的机会。
在他看来,降低算力成本并不只是等待硬件或模型价格继续下跌,换一种获取和使用算力的方式,同样能够让成本下降。让算力像电力一样实现随取随用、按需付费,把那些原本闲置、被浪费的资源重新调动起来。
不久前,共绩科技完成了 Pre-A 轮融资,投后估值达到 3.5 亿元人民币,并计划近期启动 A 轮融资。在 2025 年整个算力赛道普遍承压的背景下,这家利用人工智能技术解决资源调度问题的公司,已经悄然做到数千万级营收,客户留存率接近 100%。
共绩科技,正把算力调度做成一门真正成立的生意。
共绩科技创始人付智 图源:共绩科技
01
当 AI 公司突然爆发,
算力成本开始有了新的解题方式
新品即将上线时,Remy 的团队几乎彻夜未眠,随时准备应对各种突发状况。
而当公司网站在 48 小时内涌入 50 万用户时,对于一家刚从内测迈向公测的 AI 创业公司而言,他们必须在极短时间里把整套基础设施扩容数十倍。虽然此前已有准备,上线前,Remy 先后测试了 Ucloud、阿里云、华为云等多家云服务平台,但当海量流量真正袭来时,他们最终采用的解决方案却来自共绩科技。
简单来说,共绩科技做的事情就是把分散闲置的算力资源调度起来,再按需分发给存在弹性需求的 AI 企业。无论是夜间空闲的网吧机器、个人用户手里的 4090,还是小型机房里的闲置设备,都可以进入共绩科技可统一调配的算力池。当客户资源不足时,就能随时从算力池中继续调用,做到即取即用。
在那 48 小时里,共绩科技紧急为 Remy 调配了接近 1900 张 GPU 卡。用户每发起一次请求,就会生成一个新的订单;当一次计算结束,订单就会立即关闭。仅那一天,平台就处理了超过百万笔订单。
「在流量峰值时,一般算力服务商临时能拿出 20 张卡已经非常不容易了,更多时候企业只能排队等待,但等待本身就意味着流量损失,这是企业最不愿看到的结果。」付智提到,也正是在那次事件之后,Remy 后续使用的大部分算力都转向了共绩科技。
Remy 对算力的需求其实并不复杂,每当流量爆发时,用户点击都要及时得到响应,算力调用必须足够迅速、足够及时,同时成本还不能太高。这些恰恰是刚起步的 AI 创企对算力最基本的要求。
相比之下,还有一类 AI 应用客户,他们面对的算力需求更加细分,但也更加贴近现实。
去年春节期间,一家在景区提供 AI 换装拍照服务的公司找到了共绩科技。他们并不是不知道流量高峰会在何时到来,但依旧很难把算力账算明白。
他们的 AI 设备大多部署在景区,一到节假日便人流密集,算力需求迅速冲高。但假期结束之后,算力需求又几乎降到零。「春节是全年最大的高峰,剩下大半年景区里都没什么人。」他们这样告诉付智。
这种剧烈的波动意味着,如果按照峰值去租算力,那平日里 90% 的时间都等于在为闲置卡持续付费;可如果按平均值配置算力,那么春节期间一定会出现供给崩溃,直接影响用户体验。「像这种需求起伏特别大的情况,在传统算力服务方案里,很难拿到合适的产品。因为这种极端峰谷差,在标准化产品的定价体系中几乎没有对应逻辑。」付智表示。
但这样的使用场景,恰恰很适合共绩科技的共享算力平台。
在那一个月里,服务节点共切换了 1963 台个人电脑,整个春节期间,服务没有发生过一次稳定性问题。「相较于客户自己按照峰值部署算力,我们帮他们节省了接近 70% 的费用。」付智补充道。
这种时间波动型需求,不只是出现在一些垂直且小众的场景里,对不少 AI 新兴公司来说,同样十分常见。
liblib 是国内用户规模最大的 AI 图片生成平台之一,他们过去曾在云厂商平台上租用了大量 GPU 卡。但如果进一步拆解数据,他们发现这些 GPU 的整体平均利用率只有 45%。
这也意味着,超过一半的显卡,每天都在无效消耗成本。
据付智介绍,像 liblib 这样的企业其实并不少见,几乎所有以职场人为核心用户的 AI 应用工具都会遇到同样的问题。白天用户密集使用,夜里用户数量显著下降。如果按峰值配置算力,夜间空置率就会很高;但如果按平均值配置,白天又很难满足全部用户需求。
AI 赛道表面上看起来热火朝天,但真正卡住企业生命线的,很可能正是算力成本这笔账。有些企业高估了算力需求,最终让算力成本拖垮现金流;也有一些企业低估了需求,在使用高峰时服务直接崩掉,用户流失后再难挽回。
「AI 应用的流量本身就是波动的,但算力市场的定价逻辑却是按稳定需求来设计的,算力成本的分摊方式也一直停留在较传统的模式里。」付智说道。这也正是为什么,一旦一家 AI 公司真的爆发,算力这笔账就必须用新的方式来计算。
过去,传统算力服务模式主要依靠长期租赁合同。企业一租往往就是一年,不管是否真正使用,都要提前支付算力费用,闲置成本只能由企业自己承担。而共绩科技做的事情,本质上是把这部分成本转移到另外一端,也就是那些本就拥有闲置算力、却无法满负荷使用的人群,比如个人用户、网吧等。这些资源原本就在空转,把它们调度起来,不会新增额外的算力建设成本,也能盘活已经存在的闲置资源。
「算力不是越多越好,」付智说,「真正重要的是它能流动,能随时被调用。」
02
弹性算力这门生意,
真正考验的是能源调度能力
对付智来说,决定做算力调度这门生意的起点,其实来自一次偶然的尝试。
2023 年 5 月假期,那时 AI 浪潮刚刚兴起,付智在一个 AI 创业者社群里发出了一条消息。内容非常简单:我有一台 A100,租期越短价格越低,有需要的可以联系我。
当时他其实并没有抱太大期待,毕竟自己手里只有一张显卡。可结果却完全出乎意料,最后竟然有 30 个人前来咨询,而且付费意愿都非常明确。
「我当时说,谁付款快我就给谁。」最终他挑了 5 个人来服务。一张卡、5 个客户,这件事验证了他思考已久的一个判断:普通人开始真正需要算力了。
但他也明白,这门生意之所以能在那个时间点成立,并不是因为运气,而是因为在更早之前,这件事根本不具备实现条件。
毕竟,早在 1999 年,就已经有人提出过算力共享的思路,并搭建了 BOINC 平台,吸引数十万人贡献算力,但那时它主要服务于公益性质的科学计算,所有人都可以免费使用。后来比特币火爆时,也有人想借助挖矿热潮来调度闲置算力,但这条路并不合规。
这个想法一直存在,只是始终缺少合适的土壤。
毕竟,真正拥有高性能 GPU 的普通用户,主要是 90 后、00 后。在更早之前,个人电脑上很少有人会装 4090 这样的设备。而让个人电脑能够安全运行 Linux 虚拟环境的 WSL1.0.0,也是到 2022 年才正式推出;至于跨地域远程调用个人设备、实现内网穿透的相关技术,也是在 2021 年前后才逐步成熟。
供给端、需求端以及技术条件三者同时到位,才让这门生意在今天真正具备了成立的基础。
不过在付智看来,真正让他意识到「时机已经成熟」的,并不是 DeepSeek,也不是一体机,而是 AI 的消费场景正在从小众工具,逐渐渗透到普通人的日常娱乐生活。
「一旦这个过程提速,对算力的需求就不再只是几家大公司去集中采购,而是要像电力一样,被大规模、跨节点地调度与分发。」付智说道。
这也是为什么共绩科技正在推动与国家算力中心展开合作。目前,他们已经参与了京津冀、长三角、深圳、青海等地的省级算力调度平台建设,各地已搭建的调度系统,在技术层面几乎都有共绩科技的参与。
不过,「算力调度」这件事本身,远比外界看到的要复杂得多。
算力调度与算力管理并不是同一件事。付智对二者做了明确区分:大厂更多做的是管理,把大量机器纳入统一系统,知道哪些设备在运行、哪些处于空闲状态,但要做到跨地区、跨设备的动态分发,其实很难。
而算力调度则是另一套逻辑,它需要把某地出现的峰值需求,交给其他地方闲置的算力去填补。在计算机工程领域,这其实没有成熟现成的标准答案,反而更像能源行业中的经典问题。「削峰填谷」这个词,本来就是电力系统里的概念。
付智本科就读于清华大学建筑环境与能源应用工程专业,导师是能源领域院士。他把能源调度中的算法思路迁移过来,解决的正是算力领域里相似的问题,这也构成了共绩科技最核心的技术壁垒。
当然,在工程落地过程中,这套跨地域调度系统也会碰到很多棘手问题。比如进入调度池的个人电脑,随时可能因为用户本地使用而被占走,一旦用户打开游戏,这台机器就必须退出;但下游客户要求服务又不能中断。
对此,付智采用的是热备份加预测机制,也就是为每个任务预先准备冗余节点,同时基于长期积累的历史数据,预测不同供给方的在线规律,再动态调整备份比例。数据量越大,备份就越精准,成本也会越低。「以前可能要给你备两台机器,但随着数据积累,现在很多时候备一台就够了。」至于网络传输层的不稳定,共绩的做法则是同时接入三家头部云厂商,付智表示,「不可能三家同时出问题」。
那为什么云厂商自己不去做弹性算力?
付智给出的回答是,大厂并不是没看到这个需求,只是他们在产品定位和定价策略上有自己的考虑,而共绩科技的优势则主要体现在价格和调度效率上。
弹性算力最大的矛盾在于,你必须提前准备好一批「随时可调用」的资源,但在没人使用的时候,这些资源本身就是纯粹的闲置成本。通常情况下,算力服务商给出的弹性扩容价格大约是常规价格的 5 倍,或者要求客户签一年长约,把闲置风险转嫁给客户自己承担。
共绩之所以能够提供真正意义上的弹性服务,原因在于它调用的本身就是闲置资源。这些资源并不是提前采购进来等待摊薄成本的,它们原本就处于空闲状态,因此共绩可以给出更具竞争力的价格。
据付智判断,整个市场中,大约 80% 的算力需求仍然会走向大厂的长租整包模式,剩下 20% 才属于弹性需求。付智并不打算去争夺那 80%,他更专注于那 20% 的空间,而且随着 AI 应用持续增长,这部分市场还会越来越大。「在别人那里,租得越久越便宜;在我这里,租得越短越便宜。」付智补充说。如今,共绩科技的共享算力平台「suanli.cn」已经可以让普通消费者按毫秒租用相关算力。
共绩科技团队合影 图源:共绩科技
这种共享模式,其实早已在其他行业得到过验证。
付智把这门生意的本质比作 Airbnb:当城市举办大型展会、周边酒店全部住满时,Airbnb 会把有闲置房间的居民与找不到住处的参会者连接起来。算力版的逻辑也是同样的路径,AI 应用在新版本发布、流量暴涨时,需要大量额外算力,但平时又远远用不到这么多;而另一边,个人用户、网吧、小机房的算力在夜晚和工作日则有大量闲置,把这两端连接起来,就是共绩科技所做的事情。
只不过,这里共享的不是房间,而是算力资源。
03
算力像能源一样被调度,
AI 时代的「软件定义基础设施」
这条路径,在海外也已经有人实践。比如 RunPod,也在通过分散闲置算力提供弹性推理服务,2024 年获得了由英特尔资本与戴尔科技资本联合领投的 2000 万美元种子轮融资,客户包括 Cursor、OpenAI、Perplexity。
但在付智看来,在美国做这件事和在中国做,完全是两种不同的逻辑。
AWS 从诞生之初就提供弹性算力服务,一开始就强调按需取用,并通过高价弹性产品去服务成熟市场。但国内云计算厂商更偏向长租模式,相关政策与优惠机制也普遍向这种模式倾斜,对弹性服务的重视程度不高,用户愿意为弹性算力支付溢价的意愿也远低于美国。因此,如果把 RunPod 那套商业逻辑直接照搬到国内,价格体系很难成立。
不过,付智认为,算力调度并不是一门只靠出租算力挣钱的生意。「共享算力可能只是一个入口。」他说这句话时非常确定。在他的判断中,这门生意大概只有两三年的窗口期,只要算力供需错位还存在,这个机会就还在,但它并不会永远存在。
这种清醒的认知,在创业者中并不多见。但也正因为如此,他很早就在思考一个更底层的问题:下一个真正会爆发的 AI 应用,究竟会从哪里长出来?这个判断将直接决定未来算力需求流向。对此,付智提出了两个面向未来的判断。
第一个判断是,在他看来,中国的超级应用不会诞生于 PC 端的生产力工具,中国真正有机会跑出来的方向,是移动端社交娱乐、结合供应链能力的跨境硬件,以及那些能够融入真实生活场景的 AI 应用。
中国互联网并没有经历特别深厚的 PC 生产力工具时代,用户基本是从功能机直接跨入移动互联网。那些在美国跑出来的 AI 文档、AI 幻灯片、AI 编码助手,背后依赖的是数千万习惯用 PC 办公、且愿意为 SaaS 工具付费的用户群体,而中国并不具备同样的土壤。「全中国真有超过 1 亿人需要天天写 Word 吗?我觉得未必。」更现实的问题是,就算存在这类需求,大厂也会很快把相关能力做成免费插件。
相较之下,他在社交娱乐方向看到了更强的增长潜力。他和很多从事短剧、影视行业的人交流过,问他们为什么如此积极拥抱 AI,对方给出的反馈让他产生了新的判断:「我已经没有什么可失去的了,现在几乎没人再看电影和电视剧,我们都快活不下去了。」在他看来,这批人是中国市场里最积极拥抱 AI 的群体之一,并不是因为他们最懂技术,而是因为他们已经退无可退。「现在,愿意看电视、电影的人已经越来越少了。」
而对于 AI 硬件的发展方向,付智也有不同看法。
过去几年,AI 硬件领域最主流的思路是「万物加对话框」,也就是给各种设备都塞进一个聊天窗口。但付智并不认同这个方向。「消费者并不需要一台会写诗的冰箱。」
真正有生命力的 AI 硬件,应该进入用户本来就高频使用的场景,让 AI 在后台默默完成任务,而不是强行把用户拉到设备前和它对话。
比如说,宠物摄像头应该能自动识别猫咪是否生病,景区相机应该能自动完成换装拍照。用户不需要改变自己的行为,AI 在背后悄悄把事情处理好。「如果这类硬件未来能够基于开源模型部署,那么当流量暴涨的时候,它们同样会成为弹性算力的客户。」在付智看来,这也是共绩科技未来的重要增长点之一。
他的第二个判断,则更深一层。这个想法在 2024 年底其实就已经形成,只是直到今年,他才等到验证机会的出现。
他认为,让人直接去和 AI 逐轮对话,本身就是一种效率损耗。人类在信息输入和输出上的速度有天然上限,一次只能提出一个问题,还要等待答案返回后再继续下一轮。但 AI 却可以同时并行处理成千上万个线程,在毫秒级完成机器之间的信息传递。「让人去驱动 AI,相当于让最慢的那个环节拖住整个系统的速度。」
真正应该发生的,是 AI 与 AI 之间直接协作,也就是 A2A。一个任务发出之后,触发的是一整组 AI 的连锁运转,而人只需要定义目标,不必再介入中间每一步。这也正是为什么 OpenClaw 在今天受到关注。在付智看来,OpenClaw 真正重要的地方,不是产品本身,而是它证明了一件事:AI 与 AI 之间完全可以形成自己的协作网络,A2A 是有人愿意付费的,这条路径是成立的。
一旦 A2A 成为主流,算力消耗会是今天的数倍甚至数十倍。黄仁勋在 GTC 2026 上提到,由于 Agentic AI 和推理能力爆发,当下所需的计算量相比一年前的预期至少多出 100 倍,而这还只是开端。到了那时,算力真的会像电力一样存在,人们要考虑的不再是囤多少张卡,而是整张「算力电网」能否按需分发,算力资源管理也将真正进入调度时代。
当 A2A 真正全面到来时,算力会像电力一样,成为每个人、每个任务、每一个 AI 节点背后的基础设施。到那时,谁能够跨地域、跨设备、跨时段地把算力精准调度起来,谁就真正拥有这张网络的运营能力。
在付智看来,共绩科技如今所做的一切,都是在为那个时刻提前铺路。利用眼下这两三年的窗口期,把调度能力、节点网络以及客户关系搭建起来。等到 A2A 需求真正爆发时,这整套体系才会成为共绩科技最深的护城河。
他最近在公司内部发过一句话。采访临近结束时,他又重复了一遍:
「即便如此,这一切也才刚刚开始。」
放在弹性算力的语境里,这句话也许只是一个创业者对市场前景的乐观判断。但若放到 A2A 的大背景下,他所说的「开始」,或许并不是这门生意的开端,而是算力作为基础设施这个命题,真正迎来起点的时刻。