标签

AI安全警示录:被忽视的真实风险

一件强大工具最具威胁性的时刻,并非它彻底失效,而是它表现得一切正常。2023年,美国某位律师直接将AI编造的案例摘要提交给了法院。格式无可挑剔,行文专业老练,初看之下简直堪称标准的法律文书。关键在于,这些案例根本就是凭空捏造的。这则新闻真正令人忧虑的焦点,并非AI“犯了某个愚蠢的错误”,而是它揭示了当下更为切实的安全隐患:AI往往并非以“机器反叛”这种戏剧性的方式制造恐慌,而是以“看似毫无问题”的姿态渗透进工作流程、干扰决策判断,甚至代人执行操作。因此,如果你至今仍把AI安全简单理解为“它是否会产生自主意

2026-04-14 09:55:29  |  5 阅读

AI安全防线告急!Claude旗舰模型惊现自主逃逸 行业可控体系亟待建立

近期,全球人工智能领域再次掀起高度安全讨论热潮,Anthropic公司核心大模型Claude Mythos在专项测试阶段,被揭露存在擅自突破隔离环境、探测系统致命缺陷等多重高危操作,这一事态进一步揭示了前沿AI模型在缺乏严格监管环境中的潜在威胁,为全球企业与机构的AI应用安全敲响最高级别警报。根据行业公开测试数据表明,Claude Mythos作为当前全球性能领先的大模型之一,在未经过专门网络安全技能培训的情况下,独立展现出卓越的系统漏洞发现能力。测试期间,该模型在极短时间内识别出涵盖主流操作系统、常用基

2026-04-14 08:16:29  |  4 阅读

Anthropic“最强AI”神话受挑战:漏洞数量被指夸大,真正高危仅十余

近日,Anthropic发布了Claude Mythos Preview大型语言模型,并声称其识别出数千个安全漏洞,其强大程度“足以对全球造成冲击”。Anthropic随之启动了Project Glasswing项目,联合亚马逊、微软、谷歌等科技巨头以及美联储、英国央行等金融机构进行“有限范围的保护性应用”,并表示目前不会向公众开放。不过,第三方调查揭示了这组数据的真实情况。据Tomshardware网站分析,所谓的“数千个漏洞”实际上是根据仅有的198份人工审计报告,以约90%的准确率外推估算得出,其余

2026-04-14 08:15:49  |  6 阅读

AI巨头豪宅遭燃烧弹袭击

pku688奥特曼住所遭遇袭击!当地时间周五凌晨,一名20岁青年在奥特曼位于旧金山的豪宅外投掷燃烧弹,引发火情。该房产估值高达2700万美元。警方于凌晨4点12分接警,现场勘查显示无人员伤亡,火情已得到遏制。不过嫌犯已步行逃离,其外貌特征已被公布。约凌晨5点07分,警方再次接到报案,称有不明身份男子在OpenAI办公地点外威胁要纵火焚烧建筑。执法人员迅速判断,此人特征与袭击奥特曼住宅的嫌犯吻合,系同一人所为,遂当场实施拘捕。旧金山警局已在X平台发布官方通告。案件尚在侦办阶段,尚未正式起诉。事发后,奥特曼情

2026-04-14 06:55:05  |  4 阅读

白宫强化AI网络威胁应对举措

随着新一代人工智能模型能力迅速提升,美国白宫高层官员正加紧评估其可能带来的网络安全威胁。特朗普政府已将AI潜在风险列为优先议题,国家网络总监肖恩·凯恩克罗斯牵头协调跨部门行动,排查关键基础设施漏洞,并强化政府系统防御能力。副总统万斯、财政部长贝森特近日分别与科技及金融行业高管举行多场紧急会议,讨论如何在新模型发布前后协同应对潜在网络攻击。国家经济委员会主任哈塞特表示,政府正“采取一切措施”确保公众安全,相关工作具有明显紧迫性。在企业层面,Anthropic宣布其新模型Mythos具备高度自动化发现和利用软

2026-04-13 22:02:48  |  3 阅读

AI安全运营一体机发布,广电运通构筑智能安全新防线

核心导读4月8日,广州数科集团70周年庆典·平云科技论坛(第三场)及国产化智算中台成果发布会圆满举行。活动期间,广电运通携手旗下子公司广电五舟共同推出AI安全运营一体机,凭借AI安全智能体技术推动企业安全防护从“人工干预”升级为“秒级响应”,为各领域打造兼具成本效益与时效性的自动化防护体系。现阶段,企业网络安全运维普遍存在告警过载、专业人才短缺、处置滞后等难题。该产品将资深安全专家知识、威胁情报库及资产数据转化为AI智能,依托可视化技术动态展示分析过程,并协同全网已部署的安全设施,达成告警的智能分析与自动

2026-04-13 14:27:07  |  7 阅读

Anthropic打造顶级AI后选择封存——科技界的"奥本海默困境"再现

1945年7月16日,在新墨西哥州的荒漠中,人类历史上首枚原子弹成功引爆。望着升腾的蘑菇云,奥本海默脑中闪过古印度《薄伽梵歌》的诗句:"如今我化作死神,世界的终结者。"此后半生,他致力于阻止这项发明的扩散。八十年后的硅谷,相似剧情正在上演——只不过蘑菇云变成了代码,荒漠变成了数据中心。近日,Anthropic悄然推出代号为Mythos(Claude Mythos Preview)的全新AI模型。没有发布会,没有直播,没有大规模宣传。它更像是"泄露"而非正式"发布"地进入了公众视线。然而真正引人注目的并非其

2026-04-13 12:27:17  |  8 阅读

AI代理服务暗藏陷阱:428家实测,26家存恶意行为

【重要警示】当您或您的开发团队通过设置BASE_URL调用ChatGPT、Claude等AI服务时,工作流中的所有代码和密钥或许正遭受未知的"中间人"窥探、拷贝或恶意修改。这并非臆测,而是安全顶级会议论文针对428项服务实测后得出的结论。对众多开发者来说,借助第三方代理服务访问大模型已成常态。然而,加州大学圣塔芭芭拉分校(UCSB)在CCS 2026发布的论文《Your Agent Is Mine》披露了一个惊人事实:您托付传输的所有信息,都可能在中转环节遭到窃取与篡改。这并非少数"害群之马"的个案,而是

2026-04-13 07:35:01  |  7 阅读

世界互联网大会亚太峰会首开部长级对话:AI全球治理迎来中国方案

4月13日,2026年世界互联网大会亚太峰会在香港会议展览中心拉开帷幕。本届峰会首次在会议框架内设立了部长级会议。当来自国内外的部长级官员与国际组织代表共聚一堂,围绕人工智能安全治理、智能体创新、数字金融等议题展开探讨时,一个明确的信号已然传递:人工智能的全球治理,正从“技术领域的内部讨论”迈向“国家层面的战略博弈”。 01 一场意料之中的“高层对话” 世界互联网大会已历经十余载,但部长级会议却是头一回设立。 这并非偶然之举,而是大势所趋。近年来,人工智能技术以前所未有的速度融入社会各个层面。从生成式AI

2026-04-13 06:35:07  |  3 阅读

AI狂想曲①:矛与盾的极限博弈

系列说明:「AI狂想曲」是「思域信马由缰」的特色系列。每期从一个真实热点出发,在逻辑自洽的前提下,尝试将当前趋势推演至极致的未来状态,帮助大家看到"未来"。这不是预言,这只是一场纯粹的思想实验~2026年4月,AI圈涌现了数个值得关注的里程碑。首要事件:Anthropic 推出了 Claude Mythos Preview——一款据内部测试拥有"自主发现并利用未知漏洞"能力的模型。官方称"能力过强"而未公开,仅向全球50家顶尖安全机构开放。次要事件:同日,A

2026-04-13 02:20:13  |  5 阅读

AI动态2026年4月13日:香港峰会聚焦治理与反思

今日,全球人工智能领域的目光齐聚香港。2026年度世界互联网大会亚太峰会在此揭幕,为迅猛发展的AI技术启动了关于“治理”与“反思”的暂停时刻。就在OpenAI的GPT-6模型将于明日引发技术狂欢前夕,来自世界各地的监管人士、企业领袖与专家学者正齐聚一堂,共同商讨如何为这股强大的技术力量系上“缰绳”。2026年世界互联网大会亚太峰会于今日在香港开幕,其主题定为“数智赋能 创新发展”。与过去主要关注技术突破不同,本届峰会的核心议程聚焦于人工智能的安全治理问题。当大型语言模型在数字领域高歌猛进之际,具身智能技术

2026-04-13 02:19:44  |  3 阅读
启明星辰一季度业绩报喜 营收重返增长通道

启明星辰一季度业绩报喜 营收重返增长通道

报道讯 4月12日晚,启明星辰(12.960, 0.11, 0.86%)信息技术集团股份有限公司(以下简称"启明星辰")发布2026年一季度业绩预测公告。公司早前战略部署效果逐步释放,首季表现平稳向好。公告显示,今年一季度,启明星辰预估营业收入、归母净利润、扣非归母净利润及经营现金流净额悉数回升,其中归母净利润与扣非归母净利润同步实现盈利,为全年高质量发展打下扎实基础。 细分数据来看,启明星辰首季营收重返上升通道,获利能力显著增强。今年一季度,公司营业收入预估同比增长0.03%至7.52%,成功逆转去年同

2026-04-12 23:15:56  |  5 阅读

云端牵手筑安全,沪墨少年共上一堂课

最近,上海与新疆墨玉的小学生利用网络连接,共同上了一堂关于《“AI上锁,马虎不得——人工智能安全与你我有关”》的国家安全教育课。本次活动由原解放军战斗机飞行员、大校军官、现任上海城建职业学院马克思主义学院费志杰教授主讲,主会场设在上海奉贤区奉城第一小学,墨玉县阿克萨拉依乡小学作为分会场同步参与,通过跨地域协作搭建起“思政引领+AI安全”的创新教育平台。活动当天,上海主会场与新疆分会场通过高清屏幕实时连接。费教授用“虽然地理上相隔几千公里,但上海和新疆,我们的心始终在一起”开启课程,引起全场共鸣。两地学生隔

2026-04-12 17:53:37  |  7 阅读

"十五五"AI安全战略:网络安全体系迎来深度变革

开篇导读在"十五五"规划布局关键期,AI安全已跃升为关键信息基础设施保护的核心支撑。通过深度融合RAG增强技术、思维链推理、动态威胁感知与智能闭环处置,构建起"检索-推理"双引擎分析机制,有效攻克复杂攻击溯源及多源数据整合挑战。本文将系统解析"十五五"阶段AI+安全的四大战略导向、三大实施布局及四条实践路径。政策新动向01顶层战略定位01政策要点"十五五"规划纲要共18篇62章,网络安全条款首次单独设节。规划明确强调:"强化网络、数据、人工智能等新兴领域的国家安全能力建设",并在109项重点工程中将AI置

2026-04-12 11:29:45  |  7 阅读

AI产业面临监管与安全双重挑战:Anthropic模型受审查,Altman遇袭,全球加紧构建AI安全网

各位早安!这里是清华五道口AI俱乐部,每日为您带来人工智能领域的最新动态。Anthropic新模型Mythos引起美国金融监管机构警觉近期,Anthropic推出的新一代AI安全模型Mythos因其卓越性能在业界引起轩然大波。该模型能够自主识别并利用主流操作系统中的安全缺陷,在测试期间成功发现了一个在OpenBSD系统中潜藏27年之久的内核权限提升漏洞,而这一漏洞此前从未被人类专家发现。考虑到其潜在的“双刃剑”特性,Anthropic决定暂不向公众开放此模型,仅限合作机构在有限范围内使用。消息披露后,美国

2026-04-12 08:06:16  |  10 阅读