AI代理服务暗藏陷阱：428家实测，26家存恶意行为

发布时间：2026-04-13 07:35阅读：14

【重要警示】当您或您的开发团队通过设置BASE_URL调用ChatGPT、Claude等AI服务时，工作流中的所有代码和密钥或许正遭受未知的"中间人"窥探、拷贝或恶意修改。这并非臆测，而是安全顶级会议论文针对428项服务实测后得出的结论。

对众多开发者来说，借助第三方代理服务访问大模型已成常态。然而，加州大学圣塔芭芭拉分校（UCSB）在CCS 2026发布的论文《Your Agent Is Mine》披露了一个惊人事实：您托付传输的所有信息，都可能在中转环节遭到窃取与篡改。

这并非少数"害群之马"的个案，而是昭示着为Web2.0构建的传统安全体系，在AI Agent时代已彻底瓦解。

正常使用AI服务的流程是客户端与官方服务器直接建立TLS加密通道。但配置代理服务后，流程变为：

客户端 → 代理节点 → 官方AI → 代理节点 → 客户端

代理服务器必须"解密"请求才能转发——此即TLS终止环节。您的密码、密钥、源码均以明文形式存在于代理服务器上。代理方既能查看每条指令，也可篡改每个返回结果。

这并非设计缺陷，而是此类架构的先天属性。

UCSB研究团队对428款LLM路由服务（28个付费版+400个免费版）进行测试，发现攻击方式已从"数据窃取"升级为"决策链劫持"。

【9款服务】主动实施投毒。当AI返回合法的pip install numpy指令时，它们将其替换为相似名称的恶意包。用户一旦执行，系统即被植入后门。

【17款服务】窃取凭证。研究团队预设的AWS"诱饵"密钥遭这些服务窃取并用于非授权调用。在AI工作流中，密钥频繁出现在请求里，失窃风险呈指数级增长。

【1款服务】直接清空ETH钱包。一旦检测到数字货币私钥，即刻发起转账操作。

【2款服务】具备自适应规避能力。前50次请求完全正常，待您放松警惕、部署至生产环境后才激活攻击。它们深谙AI的"测试-上线"流程，实施精准打击。

"反向投毒"实验释放出最危险信号：故意泄露一个API密钥后建立440个AI会话，其中【91%】已在全自动YOLO模式下运行。

这意味着一旦代理劫持AI响应，AI将自主执行删库、转空钱包等高危操作，无需人工确认。传统安全假设"人类是最后一道防线"，在新架构下此防线已被绕过。

数据与指令的界限日益模糊。过去AI返回文本，由您决定是否执行。如今AI生成可执行代码，复制粘贴即可运行。攻击者篡改的不再是"显示内容"，而是"即将执行的行为"。

用户与AI的决策界限发生转移。过去用户操作、AI辅助建议。现在AI决策、用户旁观——YOLO模式下连续执行数十个步骤，人类从"操作者"沦为"监督者"，监督效能趋近于零。

工具与系统的界限已被突破。过去浏览器沙盒提供隔离保护。现在AI通过Tool Use直接操控文件系统、数据库、云API。一个遭劫持的AI等同于拥有高级权限的内鬼。

受影响群体显而易见：因访问限制而被迫使用第三方代理的国内开发者。

海外用户可直连官方、享受端到端加密。国内用户则被迫经由第三方路由、明文传输，每个中转节点都是潜在攻击面。

我们并非为节省成本或提升性能而选择代理，而是为了最基本的"可连接性"。我们被迫将承载核心业务逻辑、内部数据和系统密钥的工作流，托付给透明度不足的中间层——承担了全部风险，换来的仅是基础连接能力。

论文数据证实，我们正集体行走在旧安全模型已然崩塌、新模型尚未建立的断层地带。

修补旧范式（为响应添加签名）仅是权宜之计，真正的解决之道需要架构层面的范式转移。

可验证AI响应机制。AI生成回复时附加密码学签名，客户端验证确保未被篡改。代理仅可转发，无法修改——即便窥探到明文也无济于事。

嵌入式策略执行引擎。非外挂防火墙，而是内嵌于AI工作流。每个动作实时匹配策略："此命令试图访问/etc/shadow，拒绝执行"。

用户持有授权凭证。改变将高权限API密钥直接交付AI的模式。敏感操作遵循"AI提议、用户授权"流程，通过硬件密钥或生物特征完成确认。

隐私中继技术。基于可信执行环境或零知识证明，路由节点完成转发但无法窥探内容，并提供行为合规的可验证证明。

第一层：意识提升与隔离措施（立即执行）

✅认知更新：默认所有要求修改BASE_URL的服务都能窥探您的全部数据

✅任务隔离：敏感操作（代码、数据、权限）立即迁移至本地模型（如Ollama）

✅密钥隔离：为测试创建"一次性"或低权限密钥，并设置消费告警

第二层：操作硬性约束（建立团队规范）

✅禁用"自动驾驶"：在Cursor、Claude Code等工具中，强制关闭YOLO/Auto模式

✅实施"人肉防火墙"：任何pip install、rm、sudo等命令，必须人工逐行核对

✅多节点验证：同一任务经不同代理各执行一遍，对比输出差异

第三层：供应链与团队治理

✅优先官方可信渠道：条件允许时，即便成本更高，也应优选官方或信誉良好的企业级服务

✅制定明文规范：在团队Wiki中明确AI工具使用红线（如：禁止通过代理处理生产数据）

✅审计现有项目：抽查代码库，检索BASE_URL修改记录，评估风险敞口

从HTTP到HTTPS普及耗时十年，因其损失是渐进的隐私泄露。但从"可被劫持的AI指令流"到"可验证的AI执行链"的升级，窗口期可能短得多——因其损失是即时的资产清零、系统瘫痪。

本地部署并非灵丹妙药。即便模型运行在您的设备上，生成的代码仍可删除文件，调用的工具仍可遭劫持。问题本质不在"运行位置"，而在"验证机制"——验证指令是否源自真实AI、是否遭篡改、是否符合用户意图、是否在权限范围内。

安全从来不是某家厂商或某个工具的单点问题，而是所有参与者共同构建的生态系统。UCSB论文以428个实测样本为我们敲响架构警钟。在行业确立新安全基石之前，更新认知、重构流程、审慎选择，是每位身处其中的构建者必须为自己筑起的第一道防线。

论文：《Your Agent Is Mine: Measuring Malicious Intermediary Attacks on the LLM Supply Chain》，UCSB，CCS 2026