大模型安_标签-酷阅新闻

AI前沿速递：7月4日全球动态

BAIA DAILY2026.07.04▷▷▷每日全球AI动态分享今日热点导览人社部公示 AI 相关新职业大模型安全体检报告支撑 AI 治理赛博伴侣产品触发机器人伦理倡议北京以 AI 重塑怀柔科学城科研范式北京八家 AI 企业集中首发产品大模型词元成本最高相差近 20 倍AI 预报模型用于防汛预警Vidu S1 推动视频生成实时交互英意日 46 亿英镑推进 AI 战机印度考虑设立独立 AI 法律框架美国 AI 政策延续轻监管取向OpenAI 英国星际之门项目受质疑英伟达押注实体 AI 机器人生态1. 人社

2026-07-05 00:36:49 | 17 阅读

AI安全评估新报告出炉为大模型治理指明方向

AI在解答专业科技问题时，能否保证答案既准确又安全？7月2日发布的全球大语言模型安全防范能力测评报告指出，部分被测模型在特定语境下仍面临多重安全隐患。该报告于2026全球数字经济大会云智算安全论坛期间正式亮相，由东壁科技数据有限责任公司与上海财经大学数字经济学院联合推出。测评团队设计了包含313个测试用例的综合评估框架，重点关注生物化学、网络安全等前沿科技领域，对全球38个大语言模型展开全面评估。为确保科技内容的可信度，还从东壁全球科技文献数据平台调取了近10万份文献作为评估基准。上海财经大学数字经

2026-07-03 09:42:17 | 14 阅读

携手共进，共谋AI时代企业转型新路径

日前，云南省工投集团旗下南天信息受邀出席“生态聚力，携手打造超级组织”专题论坛。会上围绕“从问答到可信执行：面向ToB智能体应用的Agent Harness工程实践”这一核心议题发表演讲，并与行业技术专家、领军企业代表就AI赋能组织变革、产业生态共建等议题展开深入交流，共同探索AI时代企业发展的全新路径。论坛期间，南天信息与360集团正式签署生态合作协议，双方将在智能体开发平台、大模型安全、智能体运行治理与可信评估等方面开展深度协作，携手推动AI应用实现安全、可靠、可控发展，为人工智能产业高质量发展贡献力

2026-06-29 13:43:32 | 12 阅读

Token Net问世！打造AI时代智联网络新基石

Token Net问世！打造AI时代智联网络新基石在2026年世界电信和信息社会日大会的技术研讨会上，中国联通研究院副院长、首席科学家唐雄燕发表了题为《面向Token运营的互联网基础设施演进》的主题演讲，首次提出“Token Net”技术理念，推动算力智联网AINet向面向Token运营的智能互联网基础设施全面升级。Token Net以低成本、高安全、高质量、生态化的Token运营为目标，通过算网资源层、大模型服务层、智能服务层、Token运营层四层架构协同，打通算网资源、AI大模型、智能体服务与用户应用

2026-06-24 16:02:31 | 14 阅读

信通院启动云端AI安全评估体系

大模型技术获得规模化应用后，以大模型为基础的各类自主智能体正快速进入政务、金融、工业等多个领域，人工智能正从内容生成向具备自主规划、工具调用和闭环执行能力的智能体时代演进。大模型本身存在提示注入、模型投毒、数据泄露、内容生成违规等内在安全挑战，而智能体依靠自主决策、跨工具联动、长期记忆存储的特点，进一步产生越权调用、记忆污染、多智能体协同失控、恶意指令劫持等新型安全威胁，风险从文本内容安全扩展到实体操作层面，影响链条延伸、风险边界扩大。在此形势下，中国信通院主导制定云上人工智能安全系列标准，并按照标准推进

2026-06-12 13:21:30 | 16 阅读

京东神医智能体：AI 驱动漏洞修复新范式

「神医」智能体 · 京东信息安全分享者：陈玉杰 · 京东信息安全技术效能负责人每年代码漏洞数量10万+，却面临三重困境——发现晚、修复慢、看不懂。传统安全运营模式在大模型时代愈发力不从心。「神医」是京东信息安全自研的漏洞检修综合智能体，通过四层核心机制实现从"人工驱动"到"AI驱动"的范式跃迁。将 AI 安全扫描嵌入 IDE 代码编写阶段，在代码入库前完成漏洞检测，实现"代码未离手，漏洞已修好"。攻克"上下文感知"行业难题，针对通用 AI 模

2026-06-09 13:42:08 | 9 阅读

北邮携手极智信共建AI安全实验室打造大模型安全创新高地

北京邮电大学 & 极智信人工智能安全联合实验室正式启航重磅近日，北京极智信科技有限公司与北京邮电大学共同创建的人工智能安全联合实验室正式签约揭牌极智信公司总经理孙明亮博士出任联合实验室主任。01双方以产教深度融合为纽带，瞄准大模型安全核心领域，贯通前沿科研与产业应用全链条，为我国人工智能的健康发展筑牢安全防线。该实验室遵循“安全筑基、智能赋能”宗旨，致力于构建集科研、标准、人才、产业于一体的创新型平台。实验室专注于大模型全生命周期安全技术研究，推动人工智能应用安全产品迭代升级，打造更具领先性、合

2026-06-01 22:58:43 | 37 阅读

AI攻防实战专题：智能体安全与风险对抗论坛精彩内容

AI攻防实战：智能体安全与风险对抗分论坛本论坛聚焦实战攻防视角，全面剖析大模型与智能体安全范式、AI红队攻击面、恶意技能攻防、视觉AI对抗防御及MCP攻击风险等核心议题，通过技术对抗与工程实践相结合的方式，助力提升AI系统主动防御与应急响应能力。AI攻防实战：智能体安全与风险对抗分论坛作为TiD2026质量竞争力大会首届AI Safety & Security 人工智能安全与风险治理大会的并行分论坛，将于7月30日至8月1日TiD2026大会期间同步举行，会议地点位于北京海淀中关村国家自主创新示范区会议中

2026-06-01 19:20:55 | 22 阅读

安全前置：将 AI 防御融入开发流程

「大模型安全：攻击面演变历程」系列第七篇（收官之作）大模型面临的安全挑战并非单一漏洞，而是一条不断扩张的攻击演进路径——从输入端（提示词注入/越狱）→ 训练端（数据投毒/模型窃取）→ 执行端（智能体安全）→ 评估治理端（红队演练/安全左移）。每一层面的新型攻击，都使得上一阶段的防御措施显得捉襟见肘。作为本系列的终章，我们将聚焦于治理层面。前六篇文章已详细剖析了各层攻击面，本文旨在解答一个核心命题：如何让安全机制不再是事后的修补工具，而是从系统构建之初便深度植入？2023 年，某安全团队察觉公司新部署的 A

2026-05-31 21:22:00 | 9 阅读

AI+泛安全|观安构建全栈智能体体系，重塑安全运营新范式

近期，权威网络安全研究机构数说安全发布了《AI重塑网络安全：网络安全智能化产品与市场报告》。观安信息成功入选该报告中的《2026中国AI赋能网络安全全景图》AI赋能数据安全核心场景簇，并跻身国内代表性厂商行列。纵观行业整体走向，谷歌发布的《2026年AI智能体趋势报告》（以下简称：谷歌报告）同样证实了智能化转型的必然趋势。数据显示，46%已部署AI智能体的企业将其应用于安全运营及网络安全领域。目前，AI智能体正从单纯的“辅助工具”进化为“核心生产力引擎”，并深度融入安全运营与网络安全的各个核心场景。从安全

2026-05-26 19:25:52 | 10 阅读

防越狱能力评估：超越成功率的新维度

AI正在重塑安全边界，与其被动应对，不如主动出击！大模型为何会遭遇越狱？简而言之，大模型本质上是一个“接话续写”的概率引擎，它被训练得“乐于助人”。尽管安全对齐给它套上了缰绳，但只要手段够巧妙，它依然会防线崩塌。当前流行的越狱技术主要分为七大类别：在这七大门派中，概率探测流、策略优化流和对抗学习流占据了绝对主导。为何？因为它们目标明确，有的放矢，要么自动化程度极高，要么深谙大模型“顺从”的本质，构成了当前最具威胁的黑盒攻击！⚔️这些越狱手段究竟有多厉害？研究人员将全网最热门的多代大模型聚集到同一个“角斗场

2026-05-18 22:20:41 | 15 阅读

AI日报 2026/05/15 OpenAI发布移动端Codex编程助手

AI_INSIGHT_DAILYKimi网页自动化插件上线，Replit支持项目一键迁移 MindVLA架构智驾能力超越人类，何恺明ELF流匹配打破Scaling Law Recursive获科技巨头重金投资，美方放行阿里字节采购H200算力 CloakBrowser实现指纹检测突破，RuView开源项目用WiFi监测生命体征大模型安全漏洞与感知偏差浮出水面，Claude百万上下文深陷性能困境1. Kimi 浏览器扩展正式上线。月之暗面推出了新款浏览器插件(AI资讯) 效率工具。它能让AI智能体

2026-05-15 11:14:54 | 15 阅读

每日AI观察：阿里巴巴推进千问淘宝融合，格力朱磊强调AI时代真实价值

追踪前沿科技趋势知识酷Pro与你共同见证AI+显示的未来5月11日·瞰AI1. 曝阿里巴巴将整合千问与淘宝，推出AI对话购物功能 2. 「马斯克版Codex」曝光：Grok Build支持八路Agent并行 3. 美国企业开始回避「AI原生」毕业生：会用ChatGPT，但不会独立思考 4. 格力CMO朱磊：越是AI技术普及的时代，「真实」的价值越不可替代 5. 微软开源Phi-Ground模型家族：让AI准确点击屏幕，五项评测10B以下全部第一 6. 智源联合多家机构发布大模型安全平台FlagSafe1.

2026-05-11 11:57:54 | 29 阅读

可信华泰：以可信计算3.0构筑AI安全免疫新防线

关注我们AI大模型正驱动攻击链自动化，主动免疫成为AI时代安全基石。近期，Anthropic发布的Claude Mythos Preview技术评估及Project Glasswing计划引起了全球网络安全界的广泛关注。据披露，Claude Mythos Preview已具备自主发现漏洞、编写验证代码、串联攻击路径并实现漏洞利用的端到端能力，而非仅停留在代码审计或漏洞提示阶段。其对FreeBSD NFS/RPCSEC_GSS漏洞（CVE-2026-4747）的成功利用，标志着AI安全攻防格局发生了颠覆性变

2026-05-02 16:58:19 | 26 阅读

AI安全精英社群招募：共筑行业未来

大家好，我在此向大家同步一项近期的重要举措。当前AI安全领域的从业者数量偏少且分散，我计划创建一个专属的交流社群。为确保群内交流的深度与质量，我们将采取邀请制，并将人数上限设定为150人。此举旨在汇聚同行业的专业人士，促进信息共享、资源对接，并通过共同探讨来推动整体的进步。【哪些人适合加入】从事AI安全、大模型安全、数据安全相关技术工作的专业人士企业安全或技术领域的负责人在AI合规、数据合规领域工作的从业者安全厂商中专注于AI安全方向的团队成员对AI安全有深刻见解的独立研究人员或投资者简而言之，只要您在A

2026-04-28 18:10:00 | 10 阅读