杨攀离职,硅基流动的AI Infra路更窄了
4月27日消息,智能纪元AGI独家获悉,阿里云和美团联合创始人王慧文曾投资的AI Infra公司硅基流动,其联合创始人、增长业务副总裁杨攀近日已从公司离开,下一步正在考虑再次创业。
截至目前,这一消息尚未对外正式发布。
不过,杨攀个人微信名上方仍保留着#硅基流动字样,外界推测他可能会等到硅基流动下月新一轮融资落定后再对外官宣。通常情况下,投资方与被投企业在联合创始人等核心高管的稳定性上会有约定,往往要等新融资或股改完成后,相关人士才能正式卸任。
据智能纪元AGI进一步获悉,硅基流动眼下已非常接近完成新一轮融资。
事实上,不只是杨攀,近期AI和具身智能赛道的高管流动已经越来越普遍。比如,星海图联合创始人许华哲离职后转而创业做破壳机器人,DeepSeek核心作者郭达雅也加入了字节Seed团队。
但杨攀之所以格外重要,在于他负责的是硅基流动面向用户的增长业务,而且在今年AI龙虾热潮中,他也多次代表公司对外发声、参与传播,因此他的离开,或许会对硅基流动后续推进产生一定影响。
公开资料显示,杨攀写代码已经32年,长期深耕即时通讯,曾参与微软MSN、中国移动飞信等产品,还担任过极客邦科技副总裁、TGO鲲鹏会总经理,以及涛思数据(TDengine)战略合作与开发者关系副总裁。2014年,他联合创办融云并出任CTO,从零开始搭建全球即时通讯云服务。
2023年8月,前微软亚洲研究院研究员、OneFlow创始人袁进辉主动找到杨攀,两人共同创立了硅基流动(SiliconFlow),主要聚焦AI Infra赛道,并顺势踩中了DeepSeek V3/R1热度以及与华为合作提供服务的窗口。
如今,硅基流动已经获得阿里云、华为哈勃、智谱AI、奇绩创坛等机构,以及美团联合创始人王慧文等人的支持。
不过,过去一年里,AI Infra市场的变化非常大。
随着OpenClaw和DeepSeek-V4发布,国内大厂、模型层、国产芯片层以及AI应用侧企业都已拥有自己的Infra能力和团队,这让原本处在‘中间层’的AI Infra赛道显得更加微妙,或许这也是杨攀离职的原因之一。
与此同时,硅基流动以及其重要竞争对手之一的无问芯穹,近期都宣布要转向出售Tokens算力的公司模式。
但无问芯穹已经完成股改并开始冲刺IPO,而硅基流动、清程极智等同类AI Infra企业,仍然长期停留在初创阶段。
整体来看,AI Infra作为独立创业方向的存在感正在不断下降,如今不少公司只能重新讲故事,被迫转型,寻找新的增长路径。
算力‘中间层’竞争加剧
4月24日,备受关注的DeepSeek-V4-Pro和V4-Flash系列模型正式开源发布。
这一次,它们在架构、底层算力、训练、后训练、数据、推演以及安全沙箱等各个维度都做了迭代升级。
其中在AI算力和Infra层面,DeepSeek把Agent训练视作解决Infra问题的一部分,引入了DSec沙箱、混合注意力、分布式推理、工具调用链路等技术,核心目标就是压缩算力成本、提升资源利用率,从而整体增强大模型能力。
实际上,对AI算力和模型技术而言,最大的‘不可能三角’就是模型性能、训练成本和硬件规模很难同时兼顾。面对这种矛盾,很多公司不是选择轻量化模型去牺牲性能,就是在高昂算力支出下艰难维持,最后被资金压力拖垮。
而DeepSeek的出现,让AI Infra成为模型训练与推理演进中的关键环节,也让模型性能、训练成本和硬件规模之间终于有了新的平衡点。
这就是AI Infra。
简单说,Infra全称是Infrastructure,也就是AI基础设施,它承担的是大模型全生命周期所需的算力、软件和服务底座,位于芯片和AI应用之间,主要解决‘算力不够、太贵、用不起’的问题,让模型更具性价比。
在美国,AI模型和算力研发基本掌握在微软、谷歌、Meta等大厂手中,它们本身又依赖英伟达和自有ASIC硬件团队的Infra能力,所以真正独立的AI Infra公司并不多。创业者最爱提到的案例是Together AI,目前估值约75亿美元。
不过,Together AI做的也不只是Infra,它还会出租英伟达芯片服务器做超算云租赁,同时研发开源模型,甚至考虑切入AI芯片设计,因此并不能算是纯粹的AI Infra公司。至于其他Infra公司,则多已被收购、整合或缩小规模,比如贾扬清创立的Lepton AI就已被英伟达收购。
而在国内,2023年ChatGPT热潮带动很多模型创业公司入场,但底层还有国产云端AI芯片、云服务和智算中心等产业链,中间其实存在一定空档。
随着算力券等政策工具落地,AI算力行业急需成熟的中间服务商来补齐产业链缺口;与此同时,模型厂商当时也还没有充分意识到推理算力的长期增长需求。
对很多CEO来说,Infra创业无疑是一条值得下注的重要赛道。
因此,2023年前后,国内涌现出无问芯穹、硅基流动、清程极智、趋境科技、潞晨科技等一批清华系AI Infra公司。
在2023年底的奇绩创坛路演日上,袁进辉首次公开提到自己创办了硅基流动,并宣布公司完成5000万元天使轮融资,由创新工场、耀途资本、奇绩创坛等机构联合投资,初步搭建起模型云服务平台SiliconCloud。
当时袁进辉表示,大模型最大的瓶颈就是推理和部署成本过高。就像微软 Copilot虽然已有100多万付费用户,但外界依然普遍认为它整体仍处于亏损状态,OpenAI的业务扩张也受到GPU供给能力限制,因此Infra的价值就在于降低大模型推理成本。
袁进辉最先思考的是,硅基流动要面向海外或出海的AI模型与算力公司获取收入,后来又上线了如今名为BizyAir的在线创作平台;在国内,则通过与部分模型公司合作、获取算力券等方式推进业务,因此在海外市场层面,它与潞晨科技等Infra公司形成了竞争关系。
2025年初,DeepSeek V3和R1引发全球关注,硅基流动也成为最早适配这些模型的厂商之一,并通过低价等方式吸引用户,提供infra层的API调用服务,因而迅速获得外界关注。
但没过多久,硅基流动与潞晨之间就正面碰撞了。
2025年3月,潞晨科技创始人尤洋公开发文质疑硅基流动,直指其借助国产芯片和DeepSeek API这些容易触发关注的‘敏感点’,再用邀请好友送代金券的方式拉新,称其像‘传销式’获客;同时又开始限制用户每天调用量,并表示‘API速度像蜗牛一样慢,感觉很坑’。他甚至说:‘我真不觉得硅基流动的API性能有多好,因为我不太相信硅基流动工程师的水平会高过英伟达和SGLang/vLLM顶尖工程师。’
随后,硅基流动创始人、CEO袁进辉在朋友圈公开回应称:‘无语,我们团队努力抓住机会有什么错?邀请用户送一点免费券有什么错?很多应用都这么做,海外也是如此。春节那几天,大家都想访问DeepSeek却进不去时,我们提供了当时少有的稳定服务,用户愿意来有什么问题?因为访问量太大,网站被挤爆了,连付费用户都受影响,只好单独划出资源做Pro版来保障付费体验。现在免费版体验也已经改善,Pro版一直是业内最稳定的服务之一。’
袁进辉还提到,硅基流动工程师早在几年前做OneFlow时,就开源过一批比英伟达官方实现还快的算子,‘当时还被潞晨科技抄袭,只是为了给对方面子没有公开,没想到现在反而被这样诋毁。’
据了解,最终是投资人和中间人士出面调停,尤洋删除了相关文章,这场行业舆论风波才算暂时平息。
最近半年多,硅基流动开始明显转向国内市场,而且推进速度很快。一方面,公司搭上了智谱、华为、阿里、字节的合作订单,推出企业级私有化部署方案SiliconBrain,并围绕模型迭代持续优化产品。
目前硅基流动的投资方包括智谱、华为、阿里、字节等机构。
硅基流动曾在2025年底披露过一组数据:其用户数超过900万,服务企业客户超过10000家,平台日均Token生成量超过1000亿tokens。
袁进辉还表示,硅基流动日均输出Token约500亿,折算价值大约2万美元(这个估值口径我也不清楚如何计算)。
此外,据我了解,硅基流动的营收大致已经达到亿元级别。
尴尬的中间层,难啃的商业化
如今放眼整个AI Infra行业,一个绕不开的问题是:
虽然大家都看见了AI推理算力和异构算力的Infra需求,但Infra技术本身的天花板也很明显。像Anthropic、OpenAI这类模型公司都在自己做Infra,而企业级AIMaaS的收入也没有想象中那么高,行业内卷反而越来越严重。
如今,不管是阿里、腾讯、百度、字节、智谱等大厂和模型层企业,还是摩尔、沐曦、商汤、壁仞等芯片算力和智算中心设施层玩家,都在推进infra算力技术和模型适配,独立AI Infra的商业空间正在不断收缩。
比如,百度的百舸·AI计算平台(AI Heterogeneous Compute,简称AIHC)就是面向大规模深度学习场景的高性能云原生AI计算平台,本质上就是百度内部的Infra团队,主要负责智算中心和推理模型的infra加速。
百度方面曾透露,其万卡单任务的有效训练时长可以达到98%以上,显著提升了算力使用效率。
阿里云则设有专门的服务器和基础设施部门,负责磐久AI Infra服务器相关工作,把硬件、软件、互联和液冷等整套物理AI算力方案都做了起来。
腾讯云则是在去年12月姚顺雨入职后,才正式拆分出AI Infra部门、AIdata部门和数据计算平台部门;在此之前,内部还包括自研‘水杉’‘银杉’智能网卡、DPU业务以及IaaS部门等infra能力。
腾讯云近期披露的一组数据也很亮眼:借助自研AI Infra,模型启动速度提升了17倍,大规模服务扩容时间从10分钟压缩到34秒;多模态推理提速4倍,自研推理引擎覆盖生文、生图、生视频等模型;同时通过内存优化和通信协议升级等手段,明显降低了计算开销。
字节跳动的AI Infra能力则被业内普遍认为是国内第一梯队,其能力分散在Seed、火山引擎、抖音等多个事业群中,Infra和基础设施团队规模预计超过千人。
此前,字节还拆分了AML相关业务,单独组建Seed底层算力研发团队。
目前,字节模型研发层的Seed-Infrastructures团队负责大模型分布式训练、强化学习框架、高性能推理、异构硬件编译器等工作,整体承担字节训练infra大团队的管理。
而字节豆包大模型推理侧的Infra则放在火山引擎,之前将IaaS、服务器等多个技术部门合并进基础设施部门,由字节老兵项亮等人负责,为火山引擎和豆包大模型提供infra支持。
此外,字节还有Web Infra、机器学习中台Infra、抖音的infra团队等,基础设施相关人员规模非常庞大。
在业内人士看来,目前国内AI Infra大致可以分成这样几档:
第一梯队:DeepSeek、Seed、阿里通义、阿里云PAI
第二梯队:百度(文心、paddle、百舸)、昆仑芯软件infra团队、腾讯(混元infra)、美团、快手、字节(AML+火山引擎)、阿里夸克、阿里控股、小红书、华为(盘古、MindSpore、原华为云infra团队)、蚂蚁 Asys/Areal团队、阶跃星辰、月之暗面、MiniMax等。
因此,对于无问芯穹、硅基流动这类独立AI Infra创业公司来说,市场空间已经越来越有限。
无问芯穹的汪玉曾在去年一场活动上说过,这两年AI公司在To B和ToG方向上越来越难赚钱。
所以很多AI Infra公司最初是靠地方算力券和垂直模型、AI应用企业合作起家,后来随着业务发展,商业化路径也出现了不同‘分流’。
其中,无问芯穹开始向智算中心订单提供服务;硅基流动则转向与华为等国产AI大厂合作;更多Infra公司则把目光投向海外市场,或者面向中小开发者群体,形成小规模运转。
但随着DeepSeek V4发布,模型层自身已经补齐了Infra能力,算力公司也开始绕过Infra公司,直接与模型公司展开更紧密的合作——比如摩尔线程和智谱、DeepSeek和华为昇腾、阶跃和壁仞、华为燧原等。
AI Infra的市场只会越来越窄。
壁仞科技创始人张文去年7月也曾表示,国产GPU芯片从设计到流片量产通常要提前两年规划,而模型迭代几乎是按周推进,因此模型层与GPU芯片公司之间必须建立越来越紧密的协同。
总结
最近有不少人问我:AI Infra到底有什么作用?
以前我可能会认为,Infra能够为数据中心和模型侧提供算力加速,能做算力云,还可以把英伟达、AMD以及摩尔、沐曦等30多种国产计算卡做异构计算和芯片软件栈平台上的‘解耦’,从而提升国产芯片利用率,让它们在更多场景里发挥价值。
但现在,我已经不这么看了。
随着推理算力需求上升、CPU和存储成本提高、国内智算中心建设放缓甚至基本停滞,底层AI芯片公司又开始直接与模型层合作,AI Infra公司的生存空间正在持续缩小。
还是以无问芯穹为例。他们最初是一家专门做AI infra和超算云的公司,后来又想切入LPU这类端侧AI算力厂商。去年下半年,无问芯穹的故事一度变成‘Agent Infra’公司,如今又进一步转向tokens工厂式的算力公司。
在今年中关村论坛上,无问芯穹联合创始人兼CEO夏立雪说,从1月底开始,公司Token量几乎每两周就翻一番,到现在累计增幅已经接近10倍。上一次见到这种增长速度,还是3G时代看手机流量的时候。
夏立雪还表示,面向Agent时代,要打造Agentic Infra,打造更智能的Token工厂。‘在Made in China时代,中国凭借制造优势把优质商品输出到全球;而现在,中国也可以借助能源优势,通过高能效的Token工厂,把高质量Token输出到全球,实现AI-Made in China,成为世界的Token工厂。’
袁进辉也开始把硅基流动的‘故事’往tokens工厂方向调整。
他在今年中关村论坛期间表示:硅基流动就像一家全球美食自助餐厅,支持的模型数量是全网最多的。无论用户想要哪家第三方大模型,它都能通过‘管道’迅速把Token送过来;它不在意这水是什么品牌,只在意用户想喝什么。
‘硅基流动之所以能在Token工厂这条赛道站稳,关键就是让Token足够便宜、足够好用、足够不挑食。无论用户想用什么模型、无论底层是什么芯片、无论算力来自哪里,硅基流动都能把这些能力整合起来,统一输出成高质量Token。’
怎么评价这些呢。
我只能说,很多CEO都想成为黄仁勋,试图复制行业龙头的成长路线,但人家已经是五万亿美元公司级别的CEO,你只是一个小公司CEO,体量和行业地位完全不是一个层次。
但从行业观察者的角度看,如今的AI Infra创业公司要么被大厂收购,要么尽快寻找退出路径,否则只会陷入‘技术领先但盈利困难’的长期困局。
现在AI领域里不少创业CEO,表面上总觉得‘自己技术很强、商业化也领先同行’、‘舆论一定要一路领先’,可实际上,他心里非常清楚自己在赛道里的位置,尤其是处在初创阶段的头部公司。
说白了,就是CEO‘飘了’。
我认为,无论是稀疏计算技术,还是AI推理算力加速、算子库研发和底层设施建设,抑或是商业渠道,这些都只是Infra公司活下去的理由之一,但并不是真正意义上的护城河。
我并不是不看好AI Infra公司的发展,只是觉得它们必须尽快转型、找准定位,否则就会持续遭遇大厂的全面挤压和降维竞争。
毕竟,ChatGPT热潮都已经持续了三年,除了三大顶刊之外的很多科技媒体,其实也并没有在这轮AI浪潮里赚到太多钱,更不用说创业公司了。
中国的AI公司想真正把商业化做成、把钱赚到,真的太难太难了。