标签

AI Agent能力跃升,安全边界不能忽视

发布时间:2026-06-07 09:27来源:微信阅读:2

幻境智算 · AI 创业观察

AI Agent 的执行能力越强,越不能只谈效率。真正能长期运行的智能体,必须先把权限、确认和风险边界设计清楚。

这几天还有一个热点,值得做 AI Agent 的人认真看一眼。Anthropic 6 月 3 日发布了一份 AI 网络威胁分析,研究了 2025 年 3 月到 2026 年 3 月之间,832 个因恶意网络活动被封禁的账号。里面有个数据很刺眼:560 个账号,也就是 67.3%,用 AI 辅助编写恶意软件。更重要的是,攻击者开始把 AI 用到更复杂环节。这说明一件事:AI Agent 越能执行任务,越不能只谈效率。

01

很多人做 Agent 产品时,第一反应是让它更自动。

自动读网页,自动写邮件,自动调接口,自动下单,自动改表格,自动发消息。

但问题也在这里。过去聊天机器人说错话,最多是答案不准。现在智能体如果拿到了权限,它不是说错一句话,而是可能执行错一个动作。

这两个风险完全不同。

Anthropic 的报告里提到,攻击者不只是用 AI 做初始钓鱼,还开始用它做账号发现、横向移动等动作。简单说,AI 正在从“帮坏人写材料”,变成“帮坏人推进流程”。

放到创业产品里也一样。

当 Agent 能操作后台、连接客户、调用支付、修改数据,它就不再只是内容工具,而是有行动能力的系统。

02

很多 Agent 演示,都喜欢展示“一句话完成全部任务”。

用户说一句,系统自动搜资料、写方案、发邮件、生成报价、同步 CRM。

演示很好看,真实使用未必安全。

因为真实业务里,很多动作不是能不能自动的问题,而是该不该自动。

比如客服回复可以先自动生成,但涉及退款、投诉、合同变更,就必须有人确认。

比如公众号可以自动生成草稿,但标题、封面、事实引用和最终发布,最好人工审核。

比如销售 Agent 可以整理客户信息,但如果自动承诺价格、折扣、交付周期,就很容易出事。

智能体产品最危险的地方,不是不会做事,而是太敢做事。

03

做 AI Agent,不能只设计“它能干什么”,还要设计“它不能干什么”。

一个靠谱的 Agent,应该有权限分层。低风险动作可以自动执行,比如整理资料、生成草稿、做摘要。中风险动作需要确认,比如发送消息、修改表格。高风险动作要默认禁止,比如付款、删除数据、改合同、承诺价格。

微软在 6 月 2 日的 Build 相关博客里也提到,Agent 系统需要安全评估、控制规范和治理能力。大厂讲这些,是因为 Agent 一旦进入生产环境,就必须能被管理。

小团队更应该早点做这个设计。

不要等用户出事了,才想起加确认弹窗。

04

很多创业者会觉得,风控是大公司才需要考虑的事。

其实不是。

越是小团队,越要靠可靠建立信任。

你做公众号写作 Agent,如果它能明确告诉用户:这一步只是草稿,不会自动发布;图片无文字,不会乱生成 logo;引用