AI赋能安全:从工具到思维革命
两个月前,AI 对我而言仅能借助豆包翻译接口文档,我始终认为其距离真正参与渗透测试尚远。直到后来接触 Claude,才惊觉 AI 进化迅猛,正悄然重塑各行。这两月间,我尝试将 Agent 引入漏洞挖掘、渗透测试及攻防演练。起初选用 Claude 和 GPT,但因需特殊手段且限制重重,效果未达预期。随后转向国产模型,DS4 横空出世,价格极具优势,成为首选测试对象。此后又陆续尝试 GLM5、Kimi2.6 等。综合体验,模型在安全领域的个人排名为:GLM5 > DS4 > Kimi2.6 > 小米。
起初我尝试蒸馏自有漏洞报告来编写 skill,初期感觉尚可,但挖掘出的均为原有能力范围内的漏洞,并未感受到 AI 带来的惊艳突破。后来我做出一个决定——删除所有 skill,纯粹测试模型的原生形态。MCP 仅安装浏览器组件,Agent 在多数场景下直接通过 Python 执行。仅依靠提示词进行挖掘分析,最常用指令包括:分析接口业务、梳理系统架构、理解开发者逻辑、信息收集、漏洞挖掘。仅保留约束类 skill,但此类约束亦不可全信。一旦上下文过长,模型仍会突破限制。目前的约束手段是每句提示词后人工审查是否执行操作,虽略显繁琐,但在实战中它能确保 99 次成功,却容不得一次失败。
删除所有 skill 后,利用大模型原生能力反而挖掘出不少非预期漏洞,涵盖公开 SRC、金融众测项目及攻防演练场景。
公开 src:
金融众测:
常年国 hvv 单位攻防演练:
在使用自写 skill 时,Agent 的渗透路径过于僵化,如同第二个自己在测试。虽非全无用处,可查漏补缺,但这恰恰限制了模型的推理潜能。移除 skill 后,结合人工提示词与 Agent 推理分析,反而能拓展更多攻击面。将自身测试思路交由 AI 放大,效果更佳。
那么 skill 是否完全无用?并非如此。它适用于流程化、机械性工作,例如在攻防场景下编写 skill:信息收集、指纹识别、通用系统探测、执行通用 POC。虽已有不少优秀工具可完成这些任务,但由 Agent 执行往往能产生不同效果。Skill 适合流水线作业,但在实战业务中,每家公司、开发习惯、接口写法各异,黑盒场景下并无完全通用的 skills。
当前方案仍以人工加 AI 半自动为主,较适配现阶段模型能力。或许未来能实现全自动化渗透测试,但目前看来尚不成熟。
AI 犹如放大镜。过去因不懂代码逻辑、JS 逆向,许多测试构想难以落地。如今 AI 可助你查漏补缺,结合个人思路与模型推理拓展测试维度,收集更多攻击面。AI 带来的便利在于降低了学习成本,拓宽了攻击面。
在攻防演练场景中,AI 的直观价值在于拓展攻击面。从 A 站的信息泄露,直接扩展至 B、C、D 站的攻击面,完美闭合攻击链,不遗漏任何细节,直至攻入内网。
上述测试案例均基于黑盒视角进行挖掘。让 AI 审计 JS、推理微服务架构,使其像做白盒审计一样处理黑盒任务。
并未采用多 Agent 工作流,全程仅开启一个对话框,从信息收集延伸至漏洞挖掘。
利用 AI 攻击靶场意义不大,因靶场漏洞本为设计好的预期内目标。但靶场可用于测试模型能力,无需担心对实战生产环境造成破坏。
可编写几个场景化漏洞评判 skill,例如在攻防场景下挖掘权限漏洞,在 SRC 场景下挖掘业务逻辑漏洞,在安服项目中挖掘各类漏洞,以避免在攻防中出现不当操作。
亦可建立长期项目库,每次渗透挖掘后总结成果、梳理暴露面,便于下次针对同一目标进行深度挖掘。当然,项目库是针对特定项目的后续渗透,并非通用。
AI 对安全行业最深远的影响,并非替代人类,而是拉平了信息差。以往挖漏洞比拼的是谁见过的系统多、谁的绕过技巧全、谁能读懂混淆后的 JS。新手入门常被劝退。如今 AI 可助补齐短板——代码审计、JS 逆向、接口梳理、架构推理,门槛显著降低。
但门槛降低并不意味着竞争减弱。相反,会用 AI 者与不会用者之间的差距将越拉越大。过去比拼经验池深度,如今比拼指挥 AI 的思路。你的上限决定了 AI 的上限。
AI 不会淘汰渗透测试工程师,但会用 AI 的工程师将淘汰不会用的。
无需一上来就搭建多 Agent 工作流,也不必追逐各种 skill 或 MCP。只需开启对话框,传入接口,让 AI 帮你梳理业务逻辑、翻阅 JS、寻找隐藏参数。从这一最简单动作开始。
引用 one_1 师傅的话:过去大家争抢字典、插件、工具,如今大家都在索要 skill。
但在索要 skill 之前,先学会真正使用 AI 本身。
目前最令人头疼的仍是约束与上下文管理。但也正因这些问题,人类的判断依然不可替代。待这两大问题彻底解决之日,坐在键盘前的那个人,最好是你。
欢迎各位师傅就 AI 安全领域交流学习: