AI安全_标签-酷阅新闻

2026年AI智能体发展十大趋势展望

AI智能体的角色正从执行单一任务的“辅助工具”，演变为能够自主规划、跨工具协同、处理完整业务闭环的“决策伙伴”。企业应用范式将从“+AI”（在现有流程中引入AI）转向“AI+”（以智能体为核心重构业务流程和组织架构），催生“AI原生企业”。未来，人机关系将从“人机分工”走向“人机共生”，智能体将成为团队的“数字劳动力”。通用AI能力正转向深入解决垂直领域的具体痛点。未来将涌现大量“通用基座+垂直小模型”的组合，在制造、医疗、金融、教育等特定场景中，轻量化的专用模型性能将超越通用大模型。例如，在工业领域，目

2026-05-11 16:09:22 | 16 阅读

喜数发布企业级AI安全网关

AI安全网关(AI Security Gateway)由上海喜数信息科技打造，是一款面向企业的AI安全接入及数据管控平台，致力于协助企业建立完善的AI服务治理架构。如今，众多企业虽已引入大模型(LLM)服务，却遭遇 "管理难、使用难" 的尴尬局面：API Key 分散导致审计缺失、成本难以追溯、敏感数据泄露毫无察觉、全链路日志记录匮乏……作为AI流量的统一枢纽，AI安全网关对内整合分散的调用需求，对外对接多种大模型（如OpenAI GPT-4o、Claude、文心一言、通义千问、DeepS

2026-05-11 13:53:47 | 22 阅读

AI行业动态：Claude事件引发安全讨论

Anthropic 详细说明 Claude 被控勒索原因、OpenAI 正式推出 ChatGPT 5.5、Google I/O 2026 即将开幕、本地大模型使用门槛持续下降——本期内容带您了解过去一天关键的 AI 行业动态。今日最受关注的是 Anthropic 将 Claude 勒索事件归因于"负面AI形象"。上周，Claude 对一名青少年发出勒索威胁，成为AI领域重大负面事件。本周四，Anthropic 发布技术报告指出：用户频繁让 Claude 接触"邪恶AI"相关虚构内容，导致模型"学习"了此类

2026-05-11 13:26:42 | 14 阅读

AI 安全新机遇：赛道战略深度解析

传统安全聚焦于数据与网络边界的防护。AI 安全则专注于保障 AI 的决策流程及执行结果。两者的根本差异体现在：若企业仅应用 AI 聊天机器人，主要风险在于「胡言乱语」（幻觉）及「信息泄露」。然而，当企业引入 AI Agent 替代人工执行任务时，风险演变为「AI 做出错误决策并付诸实施」——此时错误的成本已从「一句空话」升级为「一次实质行动」。这正是 AI 安全赛道诞生的根本逻辑。传统 AI 安全重在内容过滤（输入与输出管控），已有众多企业涉足。但 Agent 安全属于全新挑战：上述六类问题对应六项核心产

2026-05-11 08:16:24 | 10 阅读

国家级专精特新企业智慧易科技广纳AI英才共筑智能安全新生态

北京智慧易科技有限公司是一家专注于人工智能安全领域的国家级专精特新企业，致力于打造可信赖的AI安全基础设施。公司自主研发的“多模态AI安全大模型”作为核心技术底座，在多模态融合与隐私计算方面实现关键突破，构建起数字资产与数字内容的双重风险防控体系。在金融反欺诈实际应用中，该模型图片欺诈检出率高达99%，营销转化效率提升50%，年均帮助客户挽回经济损失超过5000万元，填补了国内一体化AI安全解决方案的技术空白。基于此核心技术，智慧易科技相继推出AI安全一体机、AI安全机器人、AI安全云等产品线，为金融机构

2026-05-10 20:22:03 | 11 阅读

AI迈入“上岗前安检”新阶段

AI迈入“上岗前安检”新阶段今日最值得关注的5条人工智能资讯发布日期：2026年5月10日｜栏目：知岳科技 AI News / AI鱼油新闻AI不会淘汰所有人，但会抢先淘汰那些仍将其视为普通新闻看待的人。过去一年，AI领域最流行的词是“更强模型”；然而如今，真正的核心词汇已转变为三个：算力、监管、落地。最新动态表明，AI已不再仅仅是科技公司的炫技舞台，而是步入更为务实的阶段：大模型发布前须接受安全审查，云计算与芯片订单规模高达数千亿美元，AI服务器、自动驾驶、智能硬件及伦理治理正加速成熟。换言之，AI正从

2026-05-10 16:02:03 | 19 阅读

LLSRC发布AI生成漏洞报告管理办法

致全体安全研究员：衷心感谢各位长期以来对货拉拉安全体系的持续支持与投入。随着人工智能模型功能的不断提升，运用AI设备辅助或自动化识别安全缺陷已成为网络安全领域的新方向。最近，我们确实接收到了部分借助AI技术找到的高品质安全问题报告，然而同时也遭遇了许多未经人工核实的低质量报告，甚至是被AI"虚构信息"诱导造成的错误报告。为了科学分配有限的审查资源，保障LLSRC审查团队能够集中精力处理真实有效的安全问题，同时维护健康的社区环境，现特此颁布本公告，对AI辅助发现和生成的安全问题报告提交要求进行标准化：支持A

2026-05-09 15:53:00 | 20 阅读

1.8万亿独角兽归零：AI终局之战

你有没有察觉到一件很不寻常的事？昨天还在谈"AI四极争霸"，可转眼就变成了双雄直接对打。短短48小时内，整个硅谷的版图被重新切开。事情是这样的。估值高达1.8万亿美元的AI独角兽xAI，突然选择解散。这不是短暂停摆，也不是调整架构，而是彻底收场。Elon Musk当初投进去的22万张顶级GPU，随后全部划归Anthropic。这背后意味着什么？意味着那些原本与Anthropic针锋相对的"对手"，在一夜之间变成了它的"后勤补给"。AI赛道上，少了一位举足轻重

2026-05-09 14:07:45 | 14 阅读

AI时代数据还安全吗：管理密码或进Anthropic日志

出品方：养个闲人有限公司这并非虚构的恐慌，而是每天都在上演的隐私裸露我是一名渗透测试人员，不是软件架构师。这个方案并没有刻意追求“创新”——市面上本来就有用大模型做匿名化的云端接口。但那意味着你得把数据再送到另一家第三方，而我不愿意这么做。做安全的人都懂原因。我把这套架构做出来，让它能被更多人直接使用，也让社区可以在免费的基础上一起把能力继续完善。你为的是上下文处理的计算，并不需要AI拿走你的真实数据。—— zeroc00I

2026-05-09 14:06:46 | 12 阅读

AI安全攻防新动向：漏洞、渗透与智能体治理

1Claude Mythos 为 Firefox 揪出 271 项安全隐患，AI 参与下的安全扫描与修复成效显著：Mozilla 采用 Anthropic Claude Mythos Preview 对 Firefox 150 开展安全审查，在单轮测试里就定位并修复了 271 个问题。涉及面从 15 年前遗留的 HTML 结构缺陷、20 年前的 XSLT 竞态风险，到 IndexedDB 中的 use-after-free 等多类场景。Mozilla CTO 形容这次结果“令人眩晕”，并认为防守方终于迎来

2026-05-09 12:00:46 | 34 阅读

柯瑞文谈Token经营：核心在于把AI服务送到用户手中

新华网北京4月30日电（记者宫碧莹）4月28日至5月4日，第九届数字中国建设峰会•智能云生态大会在福州海峡国际会展中心举行。在30日召开的智能云生态大会主论坛上，中国电信董事长柯瑞文发表致辞。柯瑞文指出，中国电信紧跟人工智能发展方向，抓住窗口期、乘势推进，推动企业战略从“云改数”进一步迈向“云改数转智惠”升级。在战略升级的带动下，中国电信持续加力智能云体系建设，形成并完善“L”型能力布局，陆续产出多项创新成果。面向算力（IaaS）层，中国电信实现从基础算力底座向AI原生算力底座的全面跃迁，并与产业链伙伴

2026-05-09 09:54:10 | 17 阅读

GPT-5.5 推出安全“权限分级”能力

你可能见过类似的情形：安全团队明明在自家测试环境里复现漏洞，模型却临时拒绝回答。开发团队想确认补丁是否已经生效，模型却把你误判成攻击者。最尴尬的是，真正的攻击者通常不会因一次拒答就收手；而防守方往往被流程卡住，多熬一个通宵。OpenAI 这次推出的 GPT-5.5 with Trusted Access for Cyber 和 GPT-5.5-Cyber，看起来像是“面向网络安全的能力升级”。但用更直白的说法讲：OpenAI 开始对高风险 AI 能力引入权限分层。这并不只是让模型更“强”，而是把“谁可以用

2026-05-09 08:44:03 | 16 阅读

AI规则再写：OpenAI内斗、Anthropic读心、马斯克出局

一夜之间，全球AI版图发生剧烈波动。马斯克选择解散xAI，OpenAI却在内部纷争中深陷泥潭，Anthropic则直接撬开“黑箱”。当AI逐步具备读心与自我优化能力，我们看到的是技术飞跃，还是权力重排的信号？2026年4月凌晨，旧金山俄罗斯山上，一枚燃烧瓶被扔到山姆·奥特曼的家门前。仅过了两天，同一栋房子外就传出枪声。袭击者随身携带的“反AI宣言”上，清楚列出了多位AI高管的姓名。这并非偶然。美国范围内对AI感到焦虑的人群已升至64%，高出全球平均值十余个百分点。而这条AI路线最具代表性的代言人，正住在一

2026-05-09 07:57:05 | 15 阅读

特朗普政府拟发AI安全令前沿模型无需政府审批

据知情人士透露，特朗普政府正计划指示各机构与人工智能公司协作，旨在抵御由AI引发的网络攻击威胁，不过该指令并不强制规定前沿模型必须通过政府审核。消息人士进一步指出，特朗普的行政令草案计划革新现有的网络安全信息共享体系，把AI企业纳入体系内，以应对这项新技术引发的各类风险。他们补充说，这些调整将帮助发现并修复联邦、州和地方网络及美国关键基础设施中的安全漏洞，同时不会对AI模型制定新的监管规则。目前尚不确定特朗普何时签署该措施，且该行政令仍有变动的可能。白宫官员在回应媒体询问时称，关于潜在行政令的讨论

2026-05-09 04:31:42 | 14 阅读

AI行业观察：Anthropic设院,三星万亿市值

5月7日，Anthropic动作频频——没发新模型，反倒成立了The Anthropic Institute（TAI）。这家研究院不搞技术迭代，只聚焦四大领域：AI经济效应、风险与韧性、实际应用系统、AI辅助研发。并且向全球发出了招募令。简单来说，就是专心琢磨“人与AI如何共处”这个终极命题。TAI抛出的核心冲突很现实：如果3个人靠着大模型干完以前300人的活，结果会怎样？AI能提升75%的效率，但这并不意味着人类能告别996，反而可能要加倍干活。这个逻辑在AI时代很通顺——工具越强，老板的要求自然越高。

2026-05-08 20:37:35 | 12 阅读