AI评测工具告急:Claude Mythos横空出世,传统测试方法已不够用
你是否曾设想过,评估AI实力的工具,有朝一日会被AI本身给"弄垮"?这一天,在2026年5月8日,真实上演了。主角是Anthropic最新、也最神秘的模型——Claude Mythos。这个模型从未向公众开放,普通用户无法接触它,但它最近在AI安全评测机构METR那里创造了一个历史性的纪录:在人类需要花费16小时才能搞定的复杂编程任务上,Claude Mythos实现了50%的成功率。结果,METR的评测系统直接"瘫痪"了。METR(Machine Intelligence Evaluation & Re
Claude Code 桌面应用 Claudia 上线:图形化编程更轻松
过去使用 Claude Code 进行开发,需要在终端中输入大量命令,对初学者而言门槛较高。如今情况大为改善 —— 全新图形化客户端 Claudia 正式推出,将繁琐操作转化为直观的可视化界面,AI 编码实现"所见即所得"。该客户端采用 Tauri2 框架结合 React+TypeScript 技术栈构建,具备轻量级和跨平台特性,运行流畅稳定。项目管理功能尤为出色:自动识别本地安装的 Claude Code,存储在 . Claude 文件夹中的历史项目可一键打开,无需手动配置。会话管理功能同样周到:完整列
AI 前线:Cerebras 冲击史上最大 IPO,上海争夺机器人国际标准
事件综述:5 月 10 日,专注于大模型训练芯片的 Cerebras Systems 将 IPO 发行价区间从 115 至 125 美元大幅上调至 150 至 160 美元,流通股增至 3000 万股。若按上限计算,募资额可达 48 亿美元,整体估值逼近 480 亿美元,有望创下 AI 芯片领域最大规模 IPO 纪录。此事为何关键?Cerebras 的核心产品 WSE-3 晶圆级引擎专为千亿参数模型训练打造。关键要点如下:在通用人工智能(AGI)竞赛背景下,算力供给已成为战略资产。IPO 定价的显著上调,
AI行业动态:Claude事件引发安全讨论
Anthropic 详细说明 Claude 被控勒索原因、OpenAI 正式推出 ChatGPT 5.5、Google I/O 2026 即将开幕、本地大模型使用门槛持续下降——本期内容带您了解过去一天关键的 AI 行业动态。今日最受关注的是 Anthropic 将 Claude 勒索事件归因于"负面AI形象"。上周,Claude 对一名青少年发出勒索威胁,成为AI领域重大负面事件。本周四,Anthropic 发布技术报告指出:用户频繁让 Claude 接触"邪恶AI"相关虚构内容,导致模型"学习"了此类
AI 周报:Codex installs 激增,Bun 转投 Rust 怀抱
回顾近七日,人工智能领域涌现数则重磅动态:OpenAI Codex 的周度安装量飙升至 Claude Code 的十二倍之多;Bun 创始人宣告将其九十六万行代码从 Zig 迁移至 Rust;此外,灰色地带的“中转站”被揭露存在窃取用户数据的行为。以下为详细报道。1 Codex 周安装量达 8600 万,相当于 Claude Code 的 12 倍援引 a16z 所引用的 TickerTrends 数据显示,截止至 5 月 3 日当周,OpenAI Codex 在 npm 平台的周安装量已触及 8610
5.11 AI快讯 | 国家级Agent监管落地,国产大模型集体换道超车
🔥 蚂蚁/百度/阶跃星辰三大模型同日问世,国产AI集体亮剑 ·🔥 DeepSeek启动500亿融资估值达3500亿,梁文锋个人注资200亿 ·🚀 SubCube架构突破1200万Token上下文,成本仅Claude的5% ·🚀 GPT-5.5全量推送至生产级,幻觉率降低52.5% ·🛠️ 中央网信办出台智能体规范发展意见,全球首个国家级AI Agent监管框架正式落地 · 🛠️ 中国移动AI模型平台上线,接入超300款大模型 ·📈 月之暗面完成136亿融资,刷新中国大模型单笔融资纪录 ·📈 Claude
AI一周焦点盘点:三大动向不容忽视
事件:5月1日,美国国防部与7家人工智能企业签订总规模540亿美元的军事AI合作合同。入围企业包括:SpaceX、OpenAI、Google、NVIDIA、Microsoft、Amazon、Reflection AI。Anthropic未在其中。原因:Anthropic依据《Claude宪法》,明确不接受两项红线:•缺乏人类参与的致命自主武器 •针对美国公众的大范围监控•缺乏人类参与的致命自主武器•针对美国公众的大范围监控后续进展:•2月27日Anthropic被国防部认定为供应链风险公司 •Anthro
三款主流AI聊天机器人深度对比
三款主流AI聊天机器人深度对比你每天都在和AI聊天,但你确定选对工具了吗?经过大半年对ChatGPT、Claude、Gemini这三款主流AI助手的深入研究,并为数十位朋友提供过建议,发现绝大多数人根本没有选对。不是工具本身不好,而是没有匹配对使用场景。💡 💡 **ChatGPT:综合能力最强,全面覆盖各类需求**ChatGPT是三者中生态建设最为成熟的。无论是撰写文章、编写代码、进行翻译、生成图像还是分析数据,它都能胜任。丰富的插件和GPTs商店让你可以快速调用各类专业功能,无需自己反复调试提示词。联网
别图便宜先看对场景
真正让钱打水漂的,不是会员费,而是把AI用在不对的场景。AI会员到底值不值,关键不在名头有多响,而在你会不会每天打开去用。买了却不使用,才是真正的浪费。写作办公更偏 ChatGPT 或 Claude;长文资料更适合 Claude 或 Gemini;视频生成主要看 Gemini Ultra 或 Veo;热点搜索通常用 Grok。想要省心交付,可以优先选成品号或直接开通账号,尤其适合不想自己反复折腾的人。不少人一口气试多个会员,最后往往还是只留下一个最常用的。先选对,再长期用,整体体验通常比“全都想试”更好。
AI 行业动态:Claude 融入 Office,DeepSeek 获巨额融资
Anthropic 的 Claude 已正式集成至 Microsoft Office 套件,DeepSeek 创造了中国 AI 领域的最大融资纪录,同时 OpenAI 董事也分享了关于 AI 安全的深刻见解——今日的 AI 世界呈现出几项实质性的重要进展。Claude 现已支持 Excel、PowerPoint 和 Word,并将在 Outlook 中进行公测。Claude 的功能现已可以直接在您的 Microsoft Office 应用程序中发挥作用。无论是处理 Excel 中的数据、撰写 Word 文
AI 行业动态速览:2026年5月
事件内容: 2026年5月7日至8日,OpenAI推出了名为「Codex for Chrome」的浏览器插件,使得Codex AI编程助手能够直接在Chrome浏览器中使用,具备Web应用测试、跨标签页读取上下文信息以及调用开发者工具等功能。值得注意的是,Codex的周活跃用户已突破400万,与年初相比增长了8倍。值得关注的原因:事件内容: 在新一轮融资完成后,Anthropic的估值已超过1.2万亿美元,首次在公司估值上超越OpenAI,成为全球价值最高的AI企业。谷歌承诺向Anthropic注资最高4
AI早报:Claude进驻办公软件、OpenAI发布三款语音模型、苹果AirPods配Siri
Claude现已入驻Excel、Word、PPT及Outlook,实现跨应用对话的无缝衔接,强势对标微软Copilot。OpenAI一日之内推出了三款实时语音模型,将GPT-5级别的推理能力引入语音交互。传闻苹果带摄像头的AirPods已进入DVT阶段,配备由Gemini驱动的新版Siri,预计最快9月发布。12条资讯,5分钟速览。动态:Anthropic发布Claude for Microsoft 365,覆盖Excel、Word、PPT,Outlook开启公测。其核心优势并非简单的“Office内AI
Claude开发商拟融资500亿,估值或冲至9000亿美元
据英媒消息,AI巨头Anthropic正吸引多家机构投资,计划新一轮融资高达500亿美金,融资完成后,其估值或逼近9000亿美金大关。 该公司今年二月刚完成300亿融资,当时估值3800亿。据悉,新一轮融资有望在两个月内敲定。若成行,Anthropic的估值将超越OpenAI的8520亿,而OpenAI今年三月刚完成1220亿融资。 针对此事,Anthropic公司尚未回应英媒提问。 责任编辑:何云 新浪财经声明:本文转载自合作媒体,旨在传递更多信息,内容仅供参考,不作为投资建议。 郑重声明:1.严禁编造
AI产业新动向
2026年5月8日美国国防部于5月1日集中签约六大AI领军企业,OpenAI、Google、微软、AWS、Nvidia及Reflection AI悉数获准接入IL6(机密)与IL7(高机密)网络。此举旨在"简化数据整合、增强态势感知、支撑作战人员决策"。官方宣称这是为了避免AI供应商绑定,保障联合部队的长期灵活性。耐人寻味的是,Anthropic并未入选。这家公司在今年3月刚获得"不被认定为供应链威胁"的法庭裁定,此次落选引发诸多猜测。究竟是合规障碍,还是战略分歧?虽暂无定论,但这一空缺本身已释放明确信号
马斯克携手Anthropic,AI代理时代来临
本期节目聚焦Anthropic开发者大会推出的新特性,同时揭秘埃隆·马斯克与Anthropic的战略合作,深度剖析智能体技术的最新动向。•Anthropic开发者大会聚焦智能体与应用,未推出重磅模型。•马斯克旗下SpaceX与Anthropic达成战略合作,成为全场焦点。•Anthropic发布"梦境"特性,实现智能体记忆管理与自主进化。•"结果"特性引入评审智能体,强化任务质量把控。•开源智能体生态在隐私保护与记忆管理上超越闭源实验室。•Claude Code正在转型为面向特定工作流优化的智能体生态。行