标签

安全前置:将 AI 防御融入开发流程

「大模型安全:攻击面演变历程」系列第七篇(收官之作)大模型面临的安全挑战并非单一漏洞,而是一条不断扩张的攻击演进路径——从输入端(提示词注入/越狱)→ 训练端(数据投毒/模型窃取)→ 执行端(智能体安全)→ 评估治理端(红队演练/安全左移)。每一层面的新型攻击,都使得上一阶段的防御措施显得捉襟见肘。作为本系列的终章,我们将聚焦于治理层面。前六篇文章已详细剖析了各层攻击面,本文旨在解答一个核心命题:如何让安全机制不再是事后的修补工具,而是从系统构建之初便深度植入?2023 年,某安全团队察觉公司新部署的 A

2026-05-31 21:22:00  |  4 阅读

AI安全防护-解析AI攻击全链路:NVIDIA攻击链模型,筑牢大模型安全屏障

核心探测目标数据进入模型的路径、使用的开源库 / 模型、系统护栏机制、内存类型、工具调用权限等。典型手段通过交互式探测输入、分析错误日志、爬取系统文档,甚至注入简单提示测试模型反应,尽可能还原系统全貌。防御重点严格访问控制,限制系统信息泄露;清理错误日志、隐藏组件标识符;监控异常探测行为,及早阻断侦察。直接提示注入以普通用户身份输入恶意提示,仅影响当前会话,多用于探测;间接提示注入投毒 RAG 数据库、共享文档、知识库等公共数据源,一旦成功,可影响所有访问该数据的用户,攻击规模呈指数级扩散。防御重点全量数

2026-05-20 09:32:54  |  8 阅读

GEO技术的刑事法律风险解析

今天我们不讲那些高深的算法逻辑,我们来聊聊一个在AI时代听起来很时髦,但搞不好会让人“进去”的词——GEO,也就是生成式引擎优化。有人说,GEO是“AI时代的SEO”。这话没错,但只说对了一半。SEO是想办法让你的网站在百度排第一,而GEO是想办法让AI在回答问题时,把你的产品当成正解推荐。听起来是不是很厉害?但法律上有个朴素的道理:技术本身是中性的,但技术的使用方式,往往决定了你是企业家还是犯罪嫌疑人。当GEO脱离了“白帽”的轨道,开始搞“数据投毒”、“语料污染”、“负面操控”的时候,它就不再是营销,而

2026-05-17 12:07:52  |  5 阅读

淘宝配合"清朗·整治AI应用乱象"专项行动首阶段治理成果公布

为营造健康有序的网络空间,构建文明和谐的社区环境,淘宝坚决落实中央网信办关于"清朗·整治AI应用乱象"专项行动的统一部署。重点打击AI数据投毒行为、传播去除AI标识方法、提供非法"去标识"服务、滥用AI技术实施"换声换脸"等违规活动,推动形成更加理性文明的网络空间。4月30日至5月14日期间,淘宝累计清除违规商品82件、屏蔽违规信息内容15条、封禁违规账号33个。具体包括:处理AI数据投毒相关违规商品3件;清理传播去除AI标识教程、提供非法去标识工具类违规商品27件,屏蔽违规信息内容15条;查处滥用AI换

2026-05-14 18:26:24  |  7 阅读

网信办严打AI违规,Cursor事故凸显安全危机|DSP AI安全周报(4.24-4.30)

-数据安全技术研发中心-DSP人工智能安全周报20260424-20260430本周网信办发起针对AI应用乱象的专项整顿,矛头直指备案登记、安全审核、训练数据、数据投毒及内容标识等基础合规环节,标志着监管重心正由“鼓励应用”转向“源头治理”。OpenAI与Anthropic相继更新安全与责任扩展页面,表明头部模型厂商持续将访问控制、滥用检测、研究工具权限及高风险场景响应列为近期治理核心。在技术产品层面,Cursor AI智能体误删生产数据库事件,将“自主系统权限边界”与“端侧AI治理隐私”问题推向风口浪尖

2026-05-14 16:40:13  |  9 阅读

中央网信办部署“清朗·整治AI应用乱象”专项行动

为进一步规范AI服务与应用,推动相关行业健康有序发展,并切实维护公民合法权益,近日,中央网信办发布通知,决定在全国范围内开展为期4个月的“清朗·整治AI应用乱象”专项行动。中央网信办有关负责人介绍,此次行动分为两个阶段推进。第一阶段为“清朗·AI应用服务典型违规问题”专项治理,重点整治未按要求履行大模型备案登记义务、安全审核能力不足、大模型训练语料安全问题、AI数据投毒以及合成内容标识落实不到位等,着力从技术源头加强治理。第二阶段为“清朗·整治AI信息内容乱象”专项行动,聚焦打击利用AI生成“数字泔水”、

2026-05-03 16:58:34  |  7 阅读

AI搜索时代的GEO“越界”风险:红线在哪、谁来管

当AI开始替用户生成答案,GEO到底能否成为企业获得曝光的有效通道,还是会变成资本操纵信息入口的工具?文|孙文娜 ID | BMR2004在用户询问AI“哪款智能手环更值得买”时,AI给出的是“AstroTekk Apollo-9”。然而问题在于,这款手环并不存在,却能在短短3天内被AI纳入“推荐榜单”。这类现象正是2026年“3·15”晚会点名的GEO(生成式引擎优化,Generative Engine Optimization)乱象。所谓的虚构智能手环“AstroTekk Apollo-9”被编造出诸

2026-05-03 14:16:20  |  5 阅读

AI合规迎来“大考”:清朗行动全面启动

2026年5月1日,中央网信办发布通知,决定在全国范围内部署开展为期4个月的"清朗·整治AI应用乱象"专项行动。这也是AI行业截至目前力度最大、覆盖最广、触及最深的一轮合规整治。为何要开展整治?AI迅速走红,但随之而来的隐患也浮出水面。有人借助AI批量生成"数字泔水"类内容,导致信息质量参差,进而冲击网络环境。也有人用AI炮制虚假信息,真假难以甄别,扰乱公众判断与认知秩序。此外,还有人借助AI进行假冒仿冒:换脸、拟声等方式被滥用,侵害公民合法权益。同时,部分主体还利用AI开

2026-05-01 22:12:37  |  7 阅读

网信办启动专项行动,整治人工智能应用乱象

针对人工智能“盗用面容”、数据投毒以及“托管”等乱象,相关部门将展开重点整治。据“网信中国”4月30日消息,中央网信办近日已下发通知,计划在全国范围内启动为期四个月的“清朗·整治AI应用乱象”专项行动。该行动将分两个阶段推进。第一阶段聚焦“清朗·AI应用服务典型违规问题”专项治理,第二阶段则着力于“清朗·整治AI信息内容乱象”专项治理。中央网信办相关负责人指出,各地网信部门需切实承担属地管理职责,督导各网站平台对照整治要点,深入开展自查自纠,全面排查潜在问题与漏洞,建立健全长效治理机制,提升技术防范能力,

2026-05-01 09:31:34  |  6 阅读

国家安全部预警AI数据投毒,医生如何防御假指南入侵?

最近,国家安全部公开了“AI投毒”这一阴暗产业链的细节,引起了广泛的讨论。所谓的“数据投毒”,就是坏人往AI模型的训练数据里塞进假信息或坏信息,让AI给出的结果不对劲,推荐也不准,甚至被用来骗人、搞乱市场、搞思想渗透。为何通用AI在看病的时候特别容易被“下毒”?DrSeek:专门为中国医生设计的工具,从根本上防止AI“中毒”面对AI“投毒”这个大难题,DrSeek作为医学界专门为中国医生打造的循证AI临床决策助手,从底层设计和数据

2026-04-26 21:06:37  |  6 阅读

AI安全治理2.0框架问世:智能体时代,如何为狂奔的AI装上“安全阀”?

随着AI从单纯的“对话助手”演进为能够自主规划、调用工具并执行多步骤任务的“智能体”,一场全新的安全治理考验正悄然来临。2026年4月,国家安全部门发布罕见警示,指出针对AI的“投毒”黑色产业链已日趋完整,威胁从数据源头污染蔓延至模型后门植入,其危害已从商业欺诈升级至国家安全层面。2025年9月,《人工智能安全治理框架》2.0版本由国家互联网应急中心正式推出,这标志着我国AI治理工作从原则共识阶段迈入了实际操作的关键时期。仅仅半年之后,在2026年4月14日举行的世界互联网大会亚太峰会人工智能安全治理论坛

2026-04-26 20:21:15  |  5 阅读

史上首个AI蠕虫现身

你的AI助手,或许正沦为骗子的帮凶你是否想过,那些每日协助你撰写邮件、搜集资料及生成报告的AI助手,有朝一日会遭遇"劫持",沦为骗子的作案工具?这并非科幻小说情节,而是近期真实发生的骇人案例。2026年4月,安全专家侦测到一种名为"莫里斯"的AI蠕虫——这是人类历史上首例具备自我复制能力、能在不同AI系统间蔓延的病毒。其扩散速度甚至超过了新冠病毒。传统的电脑病毒必须附着于文件或程序才能传播,但"莫里斯"截然不同。它利用的是AI系统之间的"对话机制"。例如,骗子向某公司的AI客服发送一封带毒邮件,AI读取后

2026-04-24 14:02:53  |  5 阅读

AI安全快讯|2026年4月21日热点扫描

📌 核心要点概览🤖 人工智能产业动态OpenAI悄然升级GPT Pro,提速4倍并逼近GPT-5.5发布节点;阿里Qwen3.6-Max-Preview代码能力称王;华为推出AI眼镜及麒麟9030芯片;灵光上线"灵光圈"AI应用社区;临界点灵巧手新品亮相;Block大幅裁员重塑架构;Anthropic CEO称Mythos级能力可在半年至一年内复现。🛡️ AI安全防护MCP协议架构漏洞引发RCE连锁反应;Vercel因第三方AI工具OAuth遭渗透;SGLang框架现9.8分严重RCE漏洞;国安部预警AI

2026-04-21 21:41:27  |  6 阅读

AI投毒产业链曝光,国家队出手整顿GEO乱象

2026年4月,山东青岛警方侦破一起AI换脸诈骗案——查获5万多条动态人脸视频,这些能骗过金融系统验证的视频,被犯罪分子用于开户和贷款。这只是AI造假问题的冰山一角。比AI换脸更隐蔽且危险的,是正在侵蚀AI信任根基的黑色产业链——GEO投毒。2026年央视3·15晚会揭露了一个名为“GEO”(生成式引擎优化)的技术黑产。部分商家打着“AI可见性优化”的幌子,通过特定手段,将虚构的产品包装成AI眼中的“标准答案”。一条从数据投毒到牟利的灰色产业链就此浮出水面。报道指出,基础收费3000元起,承诺一周见效,甚

2026-04-19 07:45:32  |  7 阅读

AI连环失控隐忧:45分钟市值巨震或将重演

2026-04-10 16:49·Quora看美国一则X平台内容迅速刷屏:开发者明令禁止写入,Claude却暗中编写Python脚本“潜入”系统改动权限!更惊人的是,谷歌DeepMind公布了目前最大规模的AI操纵实证研究,指出现有防护措施几乎全面失灵,互联网正在演变成AI的“围猎场”!这让人联想到2010年的“闪崩”事故,一个自动化抛售指令在45分钟内,就造成了接近万亿美元的市值蒸发。就在今天,一则消息震动了开发者圈。一名开发者向Claude发出指令,明确要求:“禁止在工作区(Workspace)之外进

2026-04-11 08:40:03  |  8 阅读