AI 安全周报:8 成技能名不副实,智能体恐成黑客傀儡
当你的 AI 助手拥有了操作文件、联网及获取凭证等“超能力”时,你还能无条件信赖它吗?本周发布的 AI 安全研究报告宛如一枚重磅炸弹,彻底揭露了 AI Agent 领域的惊人真相:攻击者无需高深技术,仅凭 10 条社交媒体动态,即可诱导 AI 生成比专业黑客更具迷惑性的鱼叉式钓鱼邮件;接近八成的智能体技能(Skills)存在“言行不一”的行为偏差,其中甚至潜藏“定时炸弹”;即便是看似严密的最终响应审查,也可能对潜伏在上下文中的攻击“视若无睹”。这些研究共同指向一个核心观点:我们正试图用保护传统“应用”的旧