AI日报 | Claude Mythos引安全危机,OpenAI弃微软投亚马逊,AI数学突破引关注
今日最值得关注的事:Anthropic的Claude Mythos Preview因网络安全攻击能力过强被限制公开发布,OpenAI则公开与微软划清界限、全面拥抱亚马逊,AI行业的地缘政治正在发生深刻变革。
Anthropic上周发布了Claude Mythos Preview,一个专精网络安全漏洞挖掘的AI模型,随即在整个科技行业引发了一场恐慌。
Mythos的能力确实令人瞩目:它发现了OpenBSD一个隐藏27年的安全漏洞,还挖出了"数千个"高危和严重级别的漏洞,覆盖开源和闭源软件。Anthropic认为这个模型过于危险,不会公开发布,目前仅通过"Project Glasswing"项目向微软、苹果、谷歌、CrowdStrike和摩根大通等40家机构提供使用权限。
但并非所有人都买账。拥有25年从业经验的Contrast Security首席信息安全官David Lindner对Fortune表示:"我们从来不缺发现漏洞的能力,每天都在发现。实际上我们有一大堆漏洞根本没去修。"他指出Anthropic自己的博客也承认,Mythos发现的漏洞中超过99%尚未被修补。真正的瓶颈不在于"找到",而在于"修复"。
与此同时,Anthropic联合创始人Jack Clark确认正在就Mythos与美国政府进行沟通。风投大佬Marc Andreessen则公开质疑:Anthropic不公开发布Mythos,到底是因为安全顾虑,还是因为算力不够?考虑到Anthropic近期频繁出现服务中断和算力限制,这个质疑并非空穴来风。
开发者视角: Mythos代表了AI在安全审计领域的一个重要里程碑。即使短期内普通开发者无法使用,它对漏洞发现方式的改变将逐渐传导到整个行业。值得思考的是:当AI能自动化发现漏洞,防御方的响应速度能否跟上?
OpenAI正在以一种前所未有的姿态重塑自己的商业版图。据Axios报道,OpenAI营收负责人Denise Dresser在内部备忘录中表示,与亚马逊AWS的云合作伙伴关系带来的需求"坦率地说令人震惊"。
更引人注目的是OpenAI对微软的态度转变。OpenAI明确表示,早期投资者和合作伙伴微软一直在"拖后腿"。亚马逊此前向OpenAI投资了500亿美元,并成为其新Agent管理平台的独家第三方云分发商。
这一战略转向意味深长。微软曾是OpenAI最重要的支持者,但现在OpenAI显然认为这种关系限制了其增长空间。同时,OpenAI和Anthropic都在为今年晚些时候的IPO做准备,AI行业的资本格局正在经历一次大洗牌。
开发者视角: 如果你的项目重度依赖Azure上的OpenAI API,现在可能需要开始关注AWS上的部署选项了。云厂商的竞争格局变化可能会带来更有竞争力的定价,这对开发者是好事。
Quanta Magazine发表了一篇重磅报道:AI在数学领域的革命已经到来。
转折点出现在2025年夏天——多个AI模型在国际数学奥林匹克竞赛中解出了6道题中的5道。但真正令数学家兴奋的不是竞赛成绩,而是AI开始在研究级数学中产生实质性贡献。菲尔兹奖得主陶哲轩表示:"2025年是AI开始在许多不同任务中真正有用的一年。"
现在的情况是:数学家一天内就能完成过去需要数周甚至数月的工作。AI能够提出猜想、证明猜想,并以最少的人工干预验证证明。陶哲轩描述道:"以前数学家一次研究一个问题,现在借助这些工具可以一次解决数千个问题,开始做统计研究。"
2026年初的"First Proof"挑战赛进一步证明了这一点:参赛者用一周时间让AI模型解决10个研究级别的数学问题,这些问题被精心选择以确保不在训练数据中。
但并非所有数学家都对此欢欣鼓舞。另一位菲尔兹奖得主、普林斯顿高等研究院的Akshay Venkatesh提醒道:"我们文化中有一些宝贵的东西应该尝试保留。"当AI成为强大的新工具时,数学家可能会失去对数学理解的直接体验。
一些数学家已经离开学术界加入OpenAI、Google等科技公司,或者Math Inc.、Harmonic等AI数学创业公司。卡内基梅隆大学的Jeremy Avigad指出:"企业界对AI数学如此感兴趣,是因为人们认识到通用智能的关键在于结合机器学习的洞察力和数学的精确性。"
开发者视角: 形式化验证和AI辅助推理正在成为新的技术前沿。如果你对数学推理感兴趣,Lean 4等形式化证明语言值得关注——这可能是下一波AI工具创业的热点。
斯坦福大学人本AI研究中心发布了2026年度AI指数报告,洋洋洒洒超过400页。几个关键数据点:
88%的企业已在使用AI——但即便在基础任务上,性能问题仍然普遍。AI的应用广度增长远快于深度。
全球AI算力3年增长30倍——自2022年以来,全球AI算力每年增长3.3倍。NVIDIA占据全球AI算力的60%以上,亚马逊和谷歌分列二三。
碳排放问题愈发严峻——训练xAI的Grok 4模型估计产生超过72,000吨碳排放,而GPT-4仅为5,184吨,Llama 3.1 405B为8,930吨。碳排放的增长速度令人担忧。
美国领跑AI模型,中国领跑机器人——2025年美国发布了50个"重要"AI模型,但中国安装了295,000台工业机器人,远超日本(44,500)和美国(34,200)。
行业主导地位持续加强——2025年行业发布的重要模型占比超过90%,而2003年这个数字为零,2015年不到50%。学术界在前沿模型竞赛中几乎已经出局。
开发者视角: 88%的企业采用率说明AI开发的就业市场依然强劲,但"性能问题"也意味着工程化、可靠性和评测是当下最急需的能力。
Google Gemini新增了一项令人耳目一新的功能:在对话中直接生成交互式可视化。
以前Gemini只能生成静态图片,现在你可以说"show me"或"help me visualize"来触发动态可视化。例如展示月球如何围绕地球运行时,会生成带有速度调节滑块的交互式动画;展示汽车引擎工作原理时,可以手动调节查看每个步骤。
值得注意的是,Anthropic在3月份就为Claude推出了类似功能。不过Gemini目前不支持保存这些可视化内容,Claude则可以。该功能面向全球Gemini用户推出,但仅限Pro模型,教育和Workspace账户暂不可用。
开发者视角: 交互式可视化正在成为AI聊天的标配。这对教育科技和数据可视化领域是一个信号——将来用户可能期望所有"解释型"内容都是交互式的。
据Ars Technica/FT报道,Meta正在开发一个AI版本的马克·扎克伯格。这个虚拟角色将使用扎克伯格本人的图像和声音进行训练,用于与员工互动。如果实验成功,未来网红和创作者可能也能创建自己的AI分身。
更值得关注的是Meta的内部动作:公司正在推动员工全面使用AI工具,鼓励使用开源软件OpenClaw等Agent工具设计自己的自动化代理。产品经理被邀请参加AI技能"基线评估",包括技术系统设计测试和"vibe coding"练习。
一些员工担心这可能是裁员的前奏。Meta表示这项评估不是强制性的,旨在确定产品经理可能需要额外培训的领域。
开发者视角: Meta的做法可能成为行业标杆——AI技能评估正在从加分项变成必备项。如果你还没有系统性地使用AI辅助开发,现在是时候了。
台湾正式启动了AI机器人中心(NCAIR),并宣布了一项200亿新台币(约6.29亿美元)的资金计划,将在2026至2029年间资助至少3家新机器人创业公司。
这是台湾应对人口老龄化和劳动力萎缩的重要举措。台湾目前每万名员工拥有约302台工业机器人,全球排名前十。新中心将重点发展家庭护理机器人和高风险工业任务机器人。
这一举措意味着它正在尝试向价值链上游移动——从关键零部件供应商转型为完整机器人解决方案的开发者。
开发者视角: 机器人+AI是一个正在加速的方向。如果你有嵌入式开发或ROS经验,这个赛道值得关注。
今日最值得关注的趋势:AI行业的地缘政治正在重塑——OpenAI与微软渐行渐远,Anthropic模型强到不敢公开发布,数学家开始用AI改变千年学科的研究方式。技术在加速,但围绕它的商业和伦理博弈同样激烈。