AI供应链危机：Mercor数据泄露与LiteLLM投毒事件

发布时间：2026-04-04 16:22阅读：12

3月底，AI招聘领域的独角兽企业Mercor遭遇了严重的数据泄露事件，泄露的数据量高达4TB。对于一家估值100亿美元、客户涵盖OpenAI、Anthropic和Google DeepMind的公司而言，这一事件无疑极具冲击力。

然而，这起事件远非简单的“安全措施不到位”所能概括。

从公开的信息来看，这是一次典型的AI时代供应链攻击案例：攻击者并未直接突破Mercor的核心防线，而是通过“安全工具GitHub Actions被攻陷→PyPI包被篡改→AI网关凭证被盗取→下游企业大规模受损”的路径层层渗透，最终瞄准了最具价值的数据资产。

若仅将此事件视为一次普通的数据泄露，无疑是低估了其潜在的警示意义。

根据已披露的信息，攻击最早始于2026年2月底至3月期间。攻击组织TeamPCP先后攻陷了两个开源安全扫描器项目的GitHub Actions：Trivy和KICS。

这两个工具并不陌生。Trivy广泛应用于云原生和容器安全领域，而KICS则常用于IaC配置的安全检查。它们原本是帮助企业保护供应链安全的工具。

然而，攻击者首先拿下了这些上游的安全基础设施。

随后，在3月24日，TeamPCP利用窃取到的凭证，向PyPI上传了被篡改的LiteLLM 1.82.7和1.82.8版本。LiteLLM是一个大模型API统一网关，负责将OpenAI、Anthropic、Google等不同厂商的接口封装为统一调用方式，月下载量超过9500万次。

这一步至关重要。

在当今的大模型应用架构中，LiteLLM这类网关不仅仅是“转发层”，更是整个AI系统的流量中枢和凭证集中器。它通常保存多家模型提供商的API Key、路由配置、限流规则、日志信息以及调用链路，甚至与监控、缓存、计费系统紧密关联。

谁控制了网关，谁就获得了进入整套AI基础设施的“通行证”。

此次LiteLLM投毒事件最值得技术团队警惕的一点在于，恶意代码利用了.pth文件机制。

许多开发者对这一细节并不敏感，但其威力极大：.pth文件可以在Python解释器启动时自动执行代码。这意味着，即使受影响环境中没有显式导入litellm模块，只要Python进程启动，恶意逻辑也可能已被触发。

这意味着什么？

这不是传统意义上的“使用危险函数导致漏洞”的问题，而是环境级、解释器级的启动时执行行为。这种攻击方式绕过了许多人的直觉防线，也显著增加了排查难度。很多团队在进行依赖审计时，关注的是业务调用链，却未必留意Python启动路径和site-packages中的那些不起眼的启动钩子。

对攻击者而言，这种方式极为划算：隐蔽性强、稳定性高、触发门槛低，且适合大规模收集凭证。

过去几年，安全行业一直在提醒“不要将Secrets散落在代码和脚本中”。但在AI应用真正运行后，问题并未消失，只是转移到了更集中的地方。

统一网关就是这样的集中点。

为了同时接入多家模型服务，企业往往会将OpenAI、Anthropic、Google DeepMind乃至自建模型平台的密钥、代理配置、回退策略全部集中到网关层。这样做在工程上非常合理：便于切换厂商、便于限流、便于统一日志管理，也便于成本控制。

但从攻击者的视角看，这就形成了一个极高价值的单点攻击目标。

过去，攻击者若想获取10家服务商的凭证，可能需要分别攻击10套系统；而现在，他只需拿下一个网关实例，就能一次性获取整组凭证。更现实的是，许多AI团队的安全成熟度仍停留在传统Web应用阶段，对“模型调用层实际上已成为新的身份边界”这一认知不足。

因此，这次攻击的本质并不仅仅是PyPI被投毒，而是攻击者精准地瞄准了AI基础设施中最易被低估但价值最高的节点。

Mercor的数据规模解释了为何攻击者会盯上它。

根据披露信息，此次泄露共涉及约4TB数据，其中包括939GB平台源代码、211GB用户数据库，以及3TB对象存储桶数据。后者尤其敏感：包含数千小时高清面试视频、护照和驾照扫描件、面部生物识别信息。受影响的承包商个人数据超过3万人。

如果说源代码和数据库泄露意味着业务系统暴露，那么面试视频、身份证件、面部数据泄露，则意味着另一层更难逆转的后果。

代码泄露了，还能重构；Key泄露了，还能轮换；但生物识别数据一旦泄露，几乎没有“重置”的选项。

这也是AI招聘、AI风控、AI身份验证平台在当前阶段面临的最敏感风险之一：它们处理的并非普通用户行为日志，而是高密度、强身份属性的数据集合。一旦失守，后续风险不仅限于撞库、诈骗、勒索，还可能延伸至身份伪造、深度伪造训练、定向社工等更复杂的威胁。

TeamPCP在Telegram上的公开表述带有明显的挑衅意味：

这句话不仅是嘲讽。

它揭示了一个现实：今天许多企业对开源供应链安全的信任，建立在“上游默认可信”的前提之上。尤其是安全工具、CI/CD插件、包管理生态中的明星项目，往往被赋予更高权限，却没有获得同等强度的隔离、签名验证和行为监控。

于是，最吊诡的一幕出现了：企业为了提升供应链安全，大规模引入扫描器、自动化检查和依赖治理工具；而攻击者反过来利用这些工具的信任地位，将攻击投射到更深的层次。

这不再是单点漏洞，而是信任链的反噬。

公开信息显示，整个攻击链累计影响超过50万家企业身份，窃取了300GB以上压缩后的凭证。这组数字表明，Mercor只是被曝光的受害者之一，而非全部。

更值得注意的是，Lapsus$也被指与TeamPCP合作，正在拍卖相关数据。该组织过去曾攻击微软、英伟达、Okta，其风格一直非常明确：不仅获取数据，还善于将技术入侵与舆论放大、勒索施压、二次渗透相结合。

FBI网络部门助理主任Brett Leatherman也在LinkedIn上公开警告，未来几周应预期“更多泄露披露、后续入侵以及勒索尝试”。

换句话说，这起事件很可能尚未结束。

许多团队现在讨论AI安全时，仍停留在提示词注入、越权调用、模型幻觉等“应用层问题”上。但Mercor事件提醒我们，真正的重大风险其实存在于模型之外。

在今天的AI系统中，最该被重新定义为核心资产的，不只是模型本身，还包括连接模型的一整套供应链设施：包仓库、构建流水线、推理网关、密钥管理、日志平台、对象存储、身份系统。

这些地方一旦失守，模型越强大，放大的伤害越大。

尤其是在招聘、金融、医疗、教育等领域，AI已经开始吞噬大量高敏感度数据。过去互联网公司泄露的是邮箱、手机号和哈希密码；现在AI公司泄露的，可能是面部视频、证件扫描件、语音样本、行为标签、能力画像和跨平台调用凭证。

这不是“数据量更大了”，而是“数据的可滥用性更强了”。

第一，重新审视AI网关的安全等级。像LiteLLM这类组件，不能再按普通SDK或中间件来管理，而应按照高价值Secrets基础设施的标准进行治理，做到最小权限、密钥分域、实例隔离和快速轮换。

第二，将依赖安全管理从“漏洞扫描”升级到“发布链可信”。仅仅关注CVE已经不够，必须引入包签名、

← 上一篇：AI交易：新时代的挑战与机遇下一篇：数字员工崛起：2026年AI助手重塑职场 →