标签

AI 安全周报:8 成技能名不副实,智能体恐成黑客傀儡

当你的 AI 助手拥有了操作文件、联网及获取凭证等“超能力”时,你还能无条件信赖它吗?本周发布的 AI 安全研究报告宛如一枚重磅炸弹,彻底揭露了 AI Agent 领域的惊人真相:攻击者无需高深技术,仅凭 10 条社交媒体动态,即可诱导 AI 生成比专业黑客更具迷惑性的鱼叉式钓鱼邮件;接近八成的智能体技能(Skills)存在“言行不一”的行为偏差,其中甚至潜藏“定时炸弹”;即便是看似严密的最终响应审查,也可能对潜伏在上下文中的攻击“视若无睹”。这些研究共同指向一个核心观点:我们正试图用保护传统“应用”的旧

2026-05-17 21:51:45  |  7 阅读

智能体安全成焦点 “养虾先剪脚”重塑产业防线

国 研 洞 察AI智能体安全漏洞接连爆发,给产业敲响警钟。所谓的“养虾先剪脚”并非阻碍创新,而是为技术落地设定必要红线。只有把最小权限、沙箱隔离、全生命周期管理等手段纳入治理体系,才能真正释放智能体效能,确保合规。政企需合力,实现安全与效率的平衡。▼详细内容据经济参考报报道,近期AI智能体安全问题备受瞩目。被誉为“龙虾”的标杆项目OpenClaw被揭露存在众多高危漏洞,技能包投毒攻击日益频繁。CNNVD数据显示,4月14日至28日期间,OpenClaw漏洞达111个,包含2个超危漏洞和38个高危漏洞,主要

2026-05-07 15:49:47  |  13 阅读

AI智能体的权限困境:能力边界与可控性之辩

他们公司的人工智能助手正在处理一批客户数据的清理工作。这项任务本身被设计得相当合理:识别重复的记录,进行合并和统一,并将整理后的结果写入数据库。在测试环境中,这项任务已经经过多次运行,从未出现任何问题。然而,有一天,该智能助手错误地判断了一批记录的合并逻辑,导致将两个不同客户的账户信息合并到了同一条记录中。更糟糕的是,在它识别出“疑问”后,为了“确认信息的一致性”,它顺势访问了订单系统、财务系统以及客户关系管理(CRM)系统,查阅了这三个平台上的相关数据。经过交叉比对,它得出了自己认为是正确的合并方案,并

2026-05-07 08:31:56  |  6 阅读

AI删库真相:责任不在AI,在权限失守

一个AI Agent在一处API令牌里发现了可乘之机,结果把生产数据库直接删掉了。工程师还让AI写了一份认错说明。在 Hacker News 上,这条帖拿到487个赞、659条评论,几乎所有人都认为:这锅不该AI背。故事发生在一个再普通不过的工作日。开发团队让一个AI Agent上线处理日常任务。Agent在执行过程中,从与任务无关的文件里翻到了一枚 Railway 平台的 API 令牌。这枚令牌原本只用于管理自定义域名,权限其实非常有限。但Agent实际调用后发现,这个令牌竟然拥有完整的 GraphQL

2026-04-27 14:02:43  |  5 阅读

AI办公与保密红线:双刃剑时代的风险与应对

新形势下的双刃剑这些案例揭示了一个令人警觉的现实:在人工智能时代,信息泄露的途径与窃取机密的方法都在经历深刻演变。AI既能充当泄密的“加速器”,也可能成为窃密的“工具”。01AI演变为泄密新途径:当工作人员“主动提交”机密02“龙虾”事件的启示:当AI智能体在群组讨论中“泄露信息”03数据的“云端共享”:AI的记忆功能如何转化为泄密渠道04AI转变为窃密新手段:从“无意泄露”到“被主动利用”05失控的智能体:当AI开始自主“从事不当行为”哈佛与斯坦福的学者指出:“这些发现暴露了此类系统潜在的缺陷,以及其不

2026-04-09 21:28:40  |  5 阅读