标签

北邮携手极智信共建AI安全实验室 打造大模型安全创新高地

北京邮电大学 & 极智信人工智能安全联合实验室正式启航重 磅近日,北京极智信科技有限公司与北京邮电大学共同创建的人工智能安全联合实验室正式签约揭牌极智信公司总经理孙明亮博士出任联合实验室主任。01双方以产教深度融合为纽带,瞄准大模型安全核心领域,贯通前沿科研与产业应用全链条,为我国人工智能的健康发展筑牢安全防线。该实验室遵循“安全筑基、智能赋能”宗旨,致力于构建集科研、标准、人才、产业于一体的创新型平台。实验室专注于大模型全生命周期安全技术研究,推动人工智能应用安全产品迭代升级,打造更具领先性、合

2026-06-01 22:58:43  |  5 阅读

AI攻防实战专题:智能体安全与风险对抗论坛精彩内容

AI攻防实战:智能体安全与风险对抗分论坛本论坛聚焦实战攻防视角,全面剖析大模型与智能体安全范式、AI红队攻击面、恶意技能攻防、视觉AI对抗防御及MCP攻击风险等核心议题,通过技术对抗与工程实践相结合的方式,助力提升AI系统主动防御与应急响应能力。AI攻防实战:智能体安全与风险对抗分论坛作为TiD2026质量竞争力大会首届AI Safety & Security 人工智能安全与风险治理大会的并行分论坛,将于7月30日至8月1日TiD2026大会期间同步举行,会议地点位于北京海淀中关村国家自主创新示范区会议中

2026-06-01 19:20:55  |  4 阅读

安全前置:将 AI 防御融入开发流程

「大模型安全:攻击面演变历程」系列第七篇(收官之作)大模型面临的安全挑战并非单一漏洞,而是一条不断扩张的攻击演进路径——从输入端(提示词注入/越狱)→ 训练端(数据投毒/模型窃取)→ 执行端(智能体安全)→ 评估治理端(红队演练/安全左移)。每一层面的新型攻击,都使得上一阶段的防御措施显得捉襟见肘。作为本系列的终章,我们将聚焦于治理层面。前六篇文章已详细剖析了各层攻击面,本文旨在解答一个核心命题:如何让安全机制不再是事后的修补工具,而是从系统构建之初便深度植入?2023 年,某安全团队察觉公司新部署的 A

2026-05-31 21:22:00  |  3 阅读

AI+泛安全|观安构建全栈智能体体系,重塑安全运营新范式

近期,权威网络安全研究机构数说安全发布了《AI重塑网络安全:网络安全智能化产品与市场报告》。观安信息成功入选该报告中的《2026中国AI赋能网络安全全景图》AI赋能数据安全核心场景簇,并跻身国内代表性厂商行列。纵观行业整体走向,谷歌发布的《2026年AI智能体趋势报告》(以下简称:谷歌报告)同样证实了智能化转型的必然趋势。数据显示,46%已部署AI智能体的企业将其应用于安全运营及网络安全领域。目前,AI智能体正从单纯的“辅助工具”进化为“核心生产力引擎”,并深度融入安全运营与网络安全的各个核心场景。从安全

2026-05-26 19:25:52  |  4 阅读

防越狱能力评估:超越成功率的新维度

AI正在重塑安全边界,与其被动应对,不如主动出击!大模型为何会遭遇越狱?简而言之,大模型本质上是一个“接话续写”的概率引擎,它被训练得“乐于助人”。尽管安全对齐给它套上了缰绳,但只要手段够巧妙,它依然会防线崩塌。当前流行的越狱技术主要分为七大类别:在这七大门派中,概率探测流、策略优化流和对抗学习流占据了绝对主导。为何?因为它们目标明确,有的放矢,要么自动化程度极高,要么深谙大模型“顺从”的本质,构成了当前最具威胁的黑盒攻击!⚔️这些越狱手段究竟有多厉害?研究人员将全网最热门的多代大模型聚集到同一个“角斗场

2026-05-18 22:20:41  |  6 阅读

AI日报 2026/05/15 OpenAI发布移动端Codex编程助手

AI_INSIGHT_DAILYKimi网页自动化插件上线,Replit支持项目一键迁移 MindVLA架构智驾能力超越人类,何恺明ELF流匹配打破Scaling Law Recursive获科技巨头重金投资,美方放行阿里字节采购H200算力 CloakBrowser实现指纹检测突破,RuView开源项目用WiFi监测生命体征 大模型安全漏洞与感知偏差浮出水面,Claude百万上下文深陷性能困境1. Kimi 浏览器扩展正式上线。 月之暗面推出了 新款浏览器插件(AI资讯) 效率工具。 它能让AI智能体

2026-05-15 11:14:54  |  4 阅读

每日AI观察:阿里巴巴推进千问淘宝融合,格力朱磊强调AI时代真实价值

追踪前沿科技趋势知识酷Pro与你共同见证AI+显示的未来5月11日·瞰AI1. 曝阿里巴巴将整合千问与淘宝,推出AI对话购物功能 2. 「马斯克版Codex」曝光:Grok Build支持八路Agent并行 3. 美国企业开始回避「AI原生」毕业生:会用ChatGPT,但不会独立思考 4. 格力CMO朱磊:越是AI技术普及的时代,「真实」的价值越不可替代 5. 微软开源Phi-Ground模型家族:让AI准确点击屏幕,五项评测10B以下全部第一 6. 智源联合多家机构发布大模型安全平台FlagSafe1.

2026-05-11 11:57:54  |  6 阅读

可信华泰:以可信计算3.0构筑AI安全免疫新防线

关注我们AI大模型正驱动攻击链自动化,主动免疫成为AI时代安全基石。近期,Anthropic发布的Claude Mythos Preview技术评估及Project Glasswing计划引起了全球网络安全界的广泛关注。据披露,Claude Mythos Preview已具备自主发现漏洞、编写验证代码、串联攻击路径并实现漏洞利用的端到端能力,而非仅停留在代码审计或漏洞提示阶段。其对FreeBSD NFS/RPCSEC_GSS漏洞(CVE-2026-4747)的成功利用,标志着AI安全攻防格局发生了颠覆性变

2026-05-02 16:58:19  |  6 阅读

AI安全精英社群招募:共筑行业未来

大家好,我在此向大家同步一项近期的重要举措。当前AI安全领域的从业者数量偏少且分散,我计划创建一个专属的交流社群。为确保群内交流的深度与质量,我们将采取邀请制,并将人数上限设定为150人。此举旨在汇聚同行业的专业人士,促进信息共享、资源对接,并通过共同探讨来推动整体的进步。【哪些人适合加入】从事AI安全、大模型安全、数据安全相关技术工作的专业人士企业安全或技术领域的负责人在AI合规、数据合规领域工作的从业者安全厂商中专注于AI安全方向的团队成员对AI安全有深刻见解的独立研究人员或投资者简而言之,只要您在A

2026-04-28 18:10:00  |  6 阅读