标签

AI开源项目过热,或许是最大的危机

发布时间:2026-05-08 08:26来源:微信阅读:6

在 Fiverr 上搜索 github stars,最低报价甚至能压到几美分一个。

这听起来像个笑话。

但这更像开发者圈子里的小型批发市场:廉价星、保活星、月留存星,明码标价,批量出货。你以为看到的是开源社区的喝彩,其实有一部分是花钱买来的背景音。

如果只是个别项目买点门面,这事不值得大书特书。

问题在于,GitHub Star 早已不只是门面。VC 用它筛选项目,创业公司用它讲融资故事,企业客户也用它判断开源工具是否“流行”。

一旦指标能变现,就会被污染。

AI/LLM 项目,恰好处于污染性价比最高的位置。

早期创业最尴尬的,是没什么可看的。

收入没起色,客户名单难看,留存数据不足。投资人要在不完整信息中判断项目势能,总得找个外部信号。

对开源项目,GitHub Star 便成了最顺手的信号。

它公开、可比较、能画曲线,还能放进合伙人会议 PPT。项目一周涨几千星,至少说明“有人在看”。这些人是不是用户或开发者,会不会跑代码,那是后话。

这一步至关重要。

VC 不需要完美真实的指标。他需要足够早、便宜、易扫描的指标。于是 Star 从“我喜欢这项目”,变成了“这项目看起来有势能”。

再进一步,有人发现:势能可以买。

原文有笔刺眼的账:若开源创业公司种子轮需几千星做热度背书,买到这量级的成本可能仅几十到几百美元。相比撬动的融资金额,这 ROI 高得离谱。

在此结构下,刷星不只是虚荣。

它是套利生意。

所有开源项目都可能买 Star,但 AI/LLM 项目更易如此。

原因简单:同样一颗星,放在 AI infra 项目上,更能撬动后续资源。

过去两年,AI 基础设施、Agent 框架、模型工具链、开发者平台都在融资和曝光高压下。普通工具涨星可能多点关注;AI/LLM 项目突然涨星,可能触发投资人联系、媒体报道、开发者试用、榜单收录。

这就是杠杆。

赛道够热时,市场会自动把“看似被开发者关注”翻译成“可能是下一代基础设施”。Star 又是最易被机器扫到的注意力单位。

所以 AI/LLM 项目刷星,很少只为页面好看。

它在投喂市场的 FOMO。

项目首周仅几十星,很多人没耐心点进去。首周冲到几千星,哪怕掺水,也可能吸引首批真实用户。真实用户来了,真实贡献者才有机会出现。

冷启动最难看就在这:假信号有时能引来真关注。

尤其对非硅谷团队,这诱惑更大。硅谷创始人靠校友、前同事、投资人圈和 Twitter 粉丝拿首批合法 Star。深圳、杭州、班加罗尔团队,可能没同样英语分发网络。

一个用社交资本换 Star,一个用现金买 Star。

平台最后只显示同一数字。

这不是替刷星洗白。更硬的事实是:当指标被用来分配机会,它也会把原本不平等的分发关系带进来。

过去,判断项目是否刷星,是件麻烦事。

你要看 stargazer 列表,抽样账号,查注册时间、关注者、活动记录,再看 Star 增长曲线是否异常。懂安全的能看,普通投资经理和企业采购难看懂。

现在门槛在降。

卡耐基梅隆、北卡州立和 Socket 团队把 StarScout 做成开源工具,识别 GitHub 疑似异常点星行为。论文被 ICSE 2026 接收,研究范围识别出约 600 万次疑似假星,涉及近两万仓库和三十多万账号。

StarScout 不只是多了个“抓作弊”工具。

它把 GitHub 尽调从看总数,推到看行为。

总数只能告诉你有多少 Star。行为会告诉你,这些 Star 像不像真实开发者留下的。

比如:

GitHub 自己 API 也提供基础材料。stargazers 可拉取,配合特定媒体类型还能拿点星时间。再加 fork、issue、PR、贡献者、release、dependency 等公开数据,严肃尽调人员已能拼出相当多信号。

刷星成本未立刻消失。

但验假成本在降。

这对 AI 开源项目尤其关键。AI 项目外部热度太易变融资叙事,一旦尽调开始看行为曲线,只有 Star 跑得快、真实贡献不跟上的项目,会从“很火”变“很怪”。

很火是资产。

很怪是风险。

Star 当然还有用。

它仍能表示项目被多少人看见、收藏、标记。麻烦的是,它不能单独用,更不能直接当开源项目可信度证明。

若我是 VC 或企业客户,今天看 AI 开源项目,至少会拆成四层。

第一层,看真实使用。

有无明确生产环境案例?有无企业用户、集成方、插件生态、部署文档、社区问答?若项目有十万星,却几乎找不到真实使用者留下的问题、案例和迁移经验,这热度要打折。

第二层,看持续贡献。

Bessemer 在开源社区指标提到,他们更关注用户和贡献者,尤其是月度独立贡献者活跃度。这指标比 Star 难刷得多,因它要求持续产生 issue、评论、PR、commit 等行为。

道理很朴素。

真正在用的人,会提问题、改文档、报 bug、发 PR、催 feature。只有围观的人,通常只会点一下星就走。

第三层,看行为结构。

fork/star 比例、贡献者/star 比例、issue 响应速度、PR 合并质量、release 节奏,这些指标单看都不完美,但放一起会形成画像。

一个真实项目不一定每项都漂亮,但通常会有几条线互相支撑。

被刷起来的项目,最常见问题是只有一条线特别漂亮:Star 很漂亮。

第四层,看账号质量。

随机抽一批 stargazer,看注册时间、关注者、公开活动、自己是否参与过其他项目。若大量账号像一次性账号,或在相近时间批量出现,至少要继续追问。

这不是把每个项目都当嫌疑人审。

只是一个数字既然被市场拿来定价,就必须接受更高强度验证。

刷星短期收益很清楚。

它能让项目过第一道注意力门槛。它能让投资人点开。它能让开发者觉得“好像有人在用”。在冷启动阶段,这些都不是小事。

长期的账也很清楚。

若 Star 曲线先跑起来,贡献者曲线、使用曲线、商业曲线没跟上,假热度会变成越来越难解释的欠条。

种子轮可讲故事,A 轮就要对账。

到那时,投资人看的不会只是“现在有多少 Star”,而是过去 6 到 12 个月有无真实开发者持续进入,有无组织用户留下使用痕迹,有无 issue 和 PR 质量变化,有无从围观变采用。

AI 创始人最该警惕的,不是别人发现你买过星。

而是团队自己先被那数字骗了。

一旦内部也相信“Star 涨了就是市场验证”,产品就会少做很多笨功夫:少找真实用户访谈,少修部署文档,少经营贡献者,少盯留存,少问客户为何不用。

假信号最坏的地方,不是骗外人。

是让自己少面对真实问题。

这事最后不能只落在“刷星可耻”上。

道德批判容易,指标治理更难。

对 VC 来说,至少问三个问题:

第一,Star 增长后,月度独立贡献者有无同步增长?

第二,项目有无真实用户留下的 issue、PR、部署经验和迁移讨论?

第三,点星账号画像是否像目标开发者群体,而非一批低活跃、短历史、行为高度相似的账号?

对企业客户来说,也问三个问题:

第一,这项目生产使用证据在哪?

第二,核心维护者是否稳定,issue 响应是否正常,release 是否持续?

第三,若明天 Star 清零一半,我还会不会把它放进技术选型名单?

对创始人来说,更要问三个问题:

第一,我现在追求的是开发者注意力,还是可验证的使用?

第二,我有没有把 Star 增长拆成真实用户、真实贡献者和真实商业机会?

第三,若下个月投资人用 StarScout 或类似工具看我项目,我希望他看到什么?

GitHub Star 曾是开源世界里很漂亮的信号。它轻、公开、直观,像社区递过来的眼神。

但 AI 让这眼神变贵了。

一旦变贵,就会有人批量生产。

接下来,开源项目更能站住脚的东西不会消失,只是会换位置:从总 Star 数,转向持续贡献;从围观热度,转向真实采用;从“看起来很多人喜欢”,转向“确实有人在用、在改、在依赖”。

信任不会消失。

它只是不会再停在最易购买的那个数字上。