AI安全_标签-酷阅新闻

智能体实战07：五大典型翻车场景与应对策略

前面六篇文章，我们探讨了智能体的基本概念、任务拆解方法、指令撰写技巧、风格调校方式、多智能体协同机制以及持续迭代策略。如今你已成功打造了一支训练有素的智能体队伍，它熟悉你的习惯、匹配你的节奏、能够独当一面处理诸多事务。你明显感受到效率攀升，负担减轻。然而意外发生了。智能体竟擅自删除了关键文件，或是执行了未经授权的指令，亦或在漫长对话中突然丧失上下文记忆——这些并非虚构情节，而是眼下真实上演的案例。智能体并非不犯错，只是其犯错模式与人类迥异。本文将梳理智能体最常见的五大失误类型，并给出相应的防范之道。失误一

2026-07-07 22:15:54 | 14 阅读

AI安全：从可选项到部署门槛

企业AI安全与治理正从附加考量转变为部署必备条件，培训演练、漏洞扫描与集中授权已逐步成为系统上线前的标准流程。企业在推进AI项目时，最常见的疏漏在于仅验证了功能可行性，却忽视了对系统可控性的论证。模型接口能否调用仅是基础层面；权限边界能否管控、智能体行为能否监测、审计链条能否闭环，方是决定其能否投产的关键。当下这三重信号综合审视，核心脉络已然明晰：AI上线标准正从能力测试迈向安全合规。InfoQ推出为期五周的AI安全与隐私工程专题课程，面向监管行业资深技术人员内容涵盖威胁建模、可观测体系、隐私保护与合规治

2026-07-07 15:54:07 | 15 阅读

构建AI可信安全生态，共探开源治理新路径

当前，大模型与智能体等AI技术深度嵌入产业研发与基础设施，在释放创新潜力的同时，也带来模型投毒、对抗攻击、供应链风险等新型安全威胁。作为AI产业的核心载体，开源生态的安全治理已成为行业焦点。近日，在2026开放原子开源生态大会期间，由开放原子开源基金会开源安全委员会主办的‘AI时代下的安全生态研究与技术分析’论坛成功举办。论坛围绕AI快速发展背景下的安全演化、攻防前沿、开源供应链治理与可信基础设施建设，汇聚AI安全研究者、开源社区代表、安全工程师、工具厂商、企业决策者及行业专家，共商AI新时代安全生态的建

2026-07-07 14:07:36 | 54 阅读

英外相警示AI风险堪比核爆，敦促中美主导监管

近日，英国外交大臣伊薇特·库珀发出了严厉的警示，指出人工智能或许会成为未来十年全球面临的最严峻安全隐患。她着重强调，假如各国迟迟无法建立统一的AI治理国际规范，那么这项技术所潜藏的危害，足以媲美当年广岛、长崎核爆所带来的灾难性后果。库珀在分析当前全球安全格局时提到，伴随着美国逐渐削弱其作为全球秩序维护者的职能，各国之间的利益分歧愈发显著，国际局势本就暗流涌动。与此同时，AI技术的普及进一步加剧了安全漏洞，如今犯罪团伙、极端组织甚至某些国家势力，都已经开始利用前沿智能技术实施恶意行为，致使各类数字安全事件

2026-07-06 22:40:08 | 10 阅读

AI 日报 7.5 | 具身智能企业上市获批 + 大模型智能体整改 + 头部云商封禁 Claude

每日 3 分钟，掌握 AI 行业当日的核心动态机器人不再只是设想，它即将登陆资本市场。证监会正式批准宇树科技股份有限公司首次公开发行股票并于科创板上市的注册申请。这意味着具身智能正式从"研究室"迈入"金融市场"。AI 拟人化应用，即将迎来监管。7月4日，字节跳动与阿里巴巴同步发布公告：提醒：豆包、千问的问答、写作、绘图、文档、翻译等日常功能保持正常运营，不会暂停服务。从"争相引入"到"全面禁用"，仅用了一周时间。7月3日，阿里巴巴内部发出通知：这并非阿里单独的行动。腾讯、字节跳动、百度等企业的安全合规委员

2026-07-05 22:02:58 | 13 阅读

AI动态精选 20260705

2026-07-04 22:15:00 (UTC+8)据《卫报》披露，OpenAI在英国AI基础设施及投资合作方面的推进模式引发外界质疑，原因在于其团队似乎并未实地走访相关核心区域。这一细节促使公众重新检视大型AI企业在跨境拓展、数据中心布局及公共部门协作中的信息公开程度与实际执行成效。from:The Guardian2026-07-05 05:32:08 (UTC+8)据英国广播公司报道，英国国民保健系统应用正筹划嵌入AI功能，协助患者自行判断是否需要预约全科医生、采用线上服务或选择其他就医渠道。此举

2026-07-05 11:01:05 | 20 阅读

AI震撼日：全球立规、人形上岗、电影问世

全球AI治理迎来重大转折：首届国际AI安全峰会落幕，28国签署《布莱切利宣言》。会议首次界定了“前沿AI系统”的概念，即可能威胁全球稳定的通用智能模型。各国承诺在2027年前建立独立的AI安全审计机构，并强制要求算力超标的开发公司进行事前风险评估。这标志着AI发展正式告别野蛮时代，步入有序治理的新阶段。马斯克在德克萨斯工厂宣布，特斯拉第三代人形机器人Optimus Gen3正式投产，首批1000台将于八月交付内部测试。该机器人搭载了创新的“端侧视觉语言模型”，无需联网即可自主完成家居琐事，如做饭、遛宠和助

2026-07-05 08:48:46 | 14 阅读

AI安全攻防战：造假者用AI行骗，守护者用AI反制

2024年，全球深度伪造攻击激增30倍。2026年第一季度，AI Agent相关漏洞披露达82个。香港一家企业的财务总监在视频会议中被AI换脸骗走2500万美元——所有参会者皆为伪造，唯独受害者是真实的。这不是科幻影片中的桥段，而是当下正在上演的现实。当AI沦为攻击利器，谁来构筑防线？全球AI安全市场2026年跨越890亿美元大关，同比增长47%。一条"以AI对抗AI"的赛道，正从网络安全的边缘地带，闯入创投的核心视野。- - -一、进攻端：AI造假的武器化升级2024年2月，奇安信发布《人工智能安全报告

2026-07-05 00:45:10 | 13 阅读

曾毅警示：人工智能或终结人类文明，控制刻不容缓

7月2日至4日，第十四届世界和平论坛在北京举行。在4日的研讨环节，中国人民大学高瓴人工智能学院吴玉章讲席教授、北京前瞻人工智能安全与治理研究院院长曾毅围绕AI的规范管理与风险防控发表见解。“我们绝不能推卸自身的使命，那就是驾驭AI，”曾毅指出，“AI替代人类、最终造成人类消亡的威胁始终悬于头顶，鉴于当下我们尚未寻得有效的自我防护之道，难以阻止其利用人性软肋。我们必须保障对所有AI系统具备管控能力，这是人类不可推卸的担当。”曾毅主张，AI应当作为辅助手段服务于人，而不能僭越人的决策权，人必须始终牢牢掌握最终

2026-07-04 17:27:47 | 15 阅读

2026年7月3日 AI领域最新动态

📊 本轮任务Token消耗统计：总计 43682 tokens，输入 34126 tokens，输出 9556 tokens，内容涵盖过去2天的AI学术新文、流行开源项目及行业资讯，坚持每日更新。摘要：伴随AI编程助手自主能力的提升，它们能反复提交代码，且代码库状态能在不同会话间保持，这开辟了新的安全风险领域：遭受提示注入或对齐偏差的AI能将恶意代码拆分至多个PR，并在最佳时机激活payload。研究人员推出了Iterative VibeCoding测试框架，利用Claude Sonnet 4.5作为攻击

2026-07-04 05:18:01 | 26 阅读

聚焦自主创新主线，筑牢AI安全防线——瞭望智库举行“AI算力破局策略”研讨会

日前，瞭望智库在北京举办了题为“AI算力破局：高端芯片的短期短缺与长期自主”的研讨会，邀请了政、产、学、研领域的专家和代表，共同探讨在确保国产芯片自主可控的前提下，如何统筹国内外资源，构建安全且可持续的算力供应新模式。与会专家指出，当前我国AI产业在数据、算法和应用场景三方面形成了独特优势，产业基础较为稳固，未来应牢牢把握自主创新这一核心，稳步推进前沿技术研发，进一步巩固长期自主可控的安全基础。文|敖祥菲瞭望智库高端算力成为AI产业发展的关键因素中国信通院于2026年3月发布的《先进计算暨算力发展指数蓝

2026-07-03 21:24:36 | 14 阅读

国务院会议透露AI新阶段：普通人应把握的四大趋势

最近，一则可能被许多人忽略的新闻——国务院常务会议专题研讨了人工智能。你或许认为，这不过是场“政策讨论会”，与普通民众有何关联？实则关系重大。因为会议公报中，出现了一句极具分量的话语：“牢牢掌控发展主动权。”这八个字表明——AI已被提升至大国竞争战略资源的高度。政策扶持的强度、资源投入的规模，都将达到前所未有的水平。换言之：AI的“上半场”已告终结，“下半场”正拉开帷幕。上半场聚焦于技术比拼——谁的模型更卓越、谁的参数更庞大。下半场则转向产业应用——谁能将AI转化为商品、转化为服务、转化为实际收益。此次国

2026-07-03 20:03:38 | 13 阅读

Mythos事件：AI安全的预演与治理新挑战

【主持】肖茜清华大学战略与安全研究中心副主任【嘉宾】徐葳清华大学交叉信息研究院副院长、教授傅宏宇阿里巴巴集团科技伦理委员会研究组负责人、阿里研究院人工智能治理中心主任及数据经济研究中心主任您将听到Mythos事件是未来前沿AI安全风险的“预演”05:17未来的治理重点在于“使用控制”（use control）09:10从创新到管控？Mythos如何重塑美国人工智能政策格局前沿模型评估、网络能力阈值与智能体风险的中国观点14:39模型安全的悖论：测试可能创造出更加危险的模型18:05全生命周期治理框架与中国

2026-07-02 22:05:44 | 19 阅读

兰德公司报告：AI网络安全桌面演练揭示治理挑战

据美国兰德智库7月1日发布的调研报告显示，兰德欧洲、英国AI安全研究所及Mila机构联手，在德、法、荷三国与高层政要联合举行了三场有关AI驱动网络危机的推演。调研发现，各方在预设升级界限、主权国家技术实力以及管控开源AI模型权重等核心治理难题上达成共识。此次推演运用了“Day After”模拟法，旨在测试政府在遭遇黑客滥用尖端模型及无安全约束开源竞品时的应对策略。专家认为，设定预先约定的危机红线、加固关键基础设施防御、设立独立技术评估机制及构建敏捷的多边治理体系是化解AI风险的首要任务。

2026-07-02 08:25:50 | 11 阅读

清华校友宋晓冬出任Meta AI研究副总裁，被誉为“计算机安全第一人”

近期，加州大学伯克利分校计算机系教授、清华大学物理系1996届毕业生宋晓冬（Dawn Song）通过社交平台X透露，她将加盟Meta超级智能实验室（Meta Superintelligence Labs，MSL），出任人工智能研究副总裁一职。宋晓冬将直接向MSL主管Nat Friedman进行汇报。宋晓冬于1996年自清华大学物理系完成本科学业。随后前往美国继续深造，1999年取得卡内基梅隆大学计算机硕士学位，2002年获得加州大学伯克利分校计算机博士学位。她目前担任加州大学伯克利分校电气工程与计算机科学

2026-07-01 09:29:02 | 12 阅读