AI攻防实战专题:智能体安全与风险对抗论坛精彩内容
AI攻防实战:智能体安全与风险对抗分论坛本论坛聚焦实战攻防视角,全面剖析大模型与智能体安全范式、AI红队攻击面、恶意技能攻防、视觉AI对抗防御及MCP攻击风险等核心议题,通过技术对抗与工程实践相结合的方式,助力提升AI系统主动防御与应急响应能力。AI攻防实战:智能体安全与风险对抗分论坛作为TiD2026质量竞争力大会首届AI Safety & Security 人工智能安全与风险治理大会的并行分论坛,将于7月30日至8月1日TiD2026大会期间同步举行,会议地点位于北京海淀中关村国家自主创新示范区会议中
AI应用精选|AgentDoG 1.5轻量级智能体安全对齐方案 (1/20篇) · 5月30日
2026年05月30日星期六AgentDoG 1.5: A Lightweight and Scalable Alignment Framework for AI Agent Safety and Security🤗 81针对OpenClaw等开放世界智能体引发的全新安全挑战及现有对齐方案的缺陷,本文设计了一套轻量级且可扩展的智能体安全保障框架。我们对安全分类体系进行了更新以覆盖新出现的风险,并构建了以分类体系为指引、运用影响函数纯化的数据引擎,仅用约1k样本便训练出多个参数规模的AgentDoG 1.5
AI安全新纪元:大模型全周期治理论坛嘉宾揭晓
当前AI技术正加速融入各行各业,AI智能体、具身智能等前沿方向迅猛发展,与此同时,提示注入、多智能体数据泄露、供应链安全等新型风险集中显现,安全治理已成为推动AI高质量发展的关键前提。自2026年起,全球AI安全议题已从技术层面跃升至国际战略高度,慕尼黑安全会议首次设立AI核心论坛,各国纷纷加快治理框架与标准建设步伐。我国“AI+”行动深入推进,统筹AI创新与安全治理的需求愈发迫切。在此背景下,TiD2026隆重推出首届AI Safety & Security 人工智能安全与风险治理大会。该大会由
AI推理新突破:多智能体安全与规模化并行发展
一句话总结:推理规模化训练迎来"多样性"新维度,VPO 以向量奖励函数解锁测试时搜索多样性上限;Gated DeltaNet-2 革新线性注意力读写机制,多智能体KV共享安全框架LCGuard 填补隐私保护空白,CVPR 2026 连发具身智能两项重磅——手势控制 GesVLA 与自意识导航 AwareVLN 同步登场。机构/作者: Ryan Bahlous-Boldi et al.(多机构联合) 主题: 训练语言模型为多样化测试时搜索做好准备【【强化学习】【测试时扩展】】 内容摘要: 当前 LLM 后训
通用文本优化与AI安全新视角
LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 AI - 人工智能1、[CL] optimize_anything:A Universal API for Optimizing any Text Parameter 2、[LG] A Bitter Lesson for Data Filtering 3、[AI] Agent Security is a Systems Problem 4、[LG] Optimal Reconstruction from Linear Queries 5、[L
AI 实践新观察:多媒体、知识库与安全的多维突破
近期在人工智能领域实施了一系列实操演练与深度挖掘,覆盖本地化多媒体创作、AI 驱动知识库搭建、网络与数据安全新方向探究三大核心板块,过程中既攻克了工具适配难题,也沉淀了技术路径思考,更深化了行业落地洞察,现将整体实践情况复盘如下。在多媒体内容创作领域,核心聚焦本地化工具测试、跨平台调用调试及创作通路验证,重点对比了不同工具的适配度与实操效率,逐步打通本地创作的关键链路。首先关注到一款特色音频类 AI 应用 Voicebox,其核心价值在于将开源音频模型进行轻量化封装,打造出独立的消费级应用。该应用不仅具备
AI智能体安全落地:OpenAI治理经验
智能体安全落地:OpenAI 内部实践解析 OpenAI 如何管控可自主编程的智能体随着 AI 系统能力不断增强,编程智能体不再只负责生成代码,还会开始自主完成审查仓库、执行命令以及使用开发工具等高风险操作。由此,原有的安全边界已难以完全覆盖风险场景。对企业而言,如何在持续释放生产力的同时守住可控性底线,正成为部署落地的核心难题。OpenAI 最新发布的《Running Codex safely at OpenAI》系统性说明了其在内部治理 Codex 智能体时采用的技术框架。通过沙盒隔离、分层审批、网络
AI安全攻防新动向:漏洞、渗透与智能体治理
1Claude Mythos 为 Firefox 揪出 271 项安全隐患,AI 参与下的安全扫描与修复成效显著:Mozilla 采用 Anthropic Claude Mythos Preview 对 Firefox 150 开展安全审查,在单轮测试里就定位并修复了 271 个问题。涉及面从 15 年前遗留的 HTML 结构缺陷、20 年前的 XSLT 竞态风险,到 IndexedDB 中的 use-after-free 等多类场景。Mozilla CTO 形容这次结果“令人眩晕”,并认为防守方终于迎来
智能体安全:多方联动构筑AI发展“防火墙”
近期,AI智能体安全问题日益凸显,以“龙虾”(OpenClaw)为代表的智能体高危漏洞频现,技能包投毒攻击也愈发活跃,引发了业界的广泛关注。多位人工智能领域的专家和安全从业人士指出,正如“养虾先剪脚”的道理一样,防患于未然已成为推动AI产业健康发展的关键。目前,政府、行业、企业等各方力量正携手并进,全面布局智能体安全防护。根据国家信息安全漏洞库(CNNVD)的数据,在4月14日至28日期间,共收录了111个OpenClaw相关漏洞,其中包括2个超危漏洞和38个高危漏洞,涵盖了访问控制错误、代码缺陷、路径遍
AI公司快讯:360以模御险、可灵原生4K、无问智科过亿融资、DeepSeek-V4上线
360 以模治模构筑智能体安全防线,获评 IDC 智能体安全领军企业IDC 近日发布《中国智能体威胁检测技术评估,2026》报告指出,360 依托覆盖全生命周期的防护能力与大规模落地表现,跻身国内智能体安全厂商第一梯队,并获评领军企业。围绕“以模治模”思路,360 打造贯穿资产识别、漏洞排查、入侵阻断、技能检测的全栈防护体系,已挖掘多项 OpenClaw 高危漏洞,同时推出“安全龙虾”智能体,为企业智能体部署夯实安全底座。可灵 AI 首发原生 4K 直出功能,AI 视频迈入院线级创作时代可灵 AI 在视频
2026年企业级AI智能体应用的五大关键领域
本文基于CB Insights报告编译整理,内容经过适当编辑。原文链接:https://www.cbinsights.com/research/ai-agent-predictions-2026/AI智能体正逐步在企业实际运营中扎根。展望2026年,资金、人才招募与并购活动将涌向支撑智能体有效运行的各个技术层级。接下来,我们将聚焦五个增长势头强劲的市场领域,这些领域揭示了智能体提供商的实际部署重点、生产环节面临的挑战,以及后续资本的流动趋势。1. 具备听、说、看、读能力的多模态AI智能体,将在客户服务领域
奇安信龙虾安全伴侣首获信通院智能体安全认证
近日,中国信息通信研究院正式公布OpenClaw类智能体安全防护产品能力评估结果,奇安信(29.150, -0.85, -2.83%)龙虾安全伴侣首批通过全部评估项目,成为网络安全领域首家入选该评测体系的企业。 此前,3月16日,奇安信在北京举办龙虾安全产品发布会,聚焦AI智能体OpenClaw(业内俗称“龙虾”)迅猛发展带来的新型安全风险。会上同步推出相关防护方案,并上线国内首个开放式Skill安全性验证平台SAFESKILL。 本次评估由中电联信通院/中国泰尔实验室主导,依据FG-K03-0003-0