中美AI实力趋近，Anthropic客户增长超越OpenAI

发布时间：2026-05-15 13:35阅读：18

Arena.ai 最新统计表明，中美两国在AI能力上的差距已从三年前的 +278 缩减至 +29，显示出全球AI竞争格局的显著变化。同时，Anthropic的企业客户规模已经超过了OpenAI。

开源社区表现活跃，Adaptive Markdown项目可将静态文档转换为由Agent驱动的动态工作区，而StudioMI300项目实现了单GPU端到端电影生成，体现了开源工具在Agent流程和多模态内容生成方面的快速进步。

在编码Agent的实际测试中，Claude Opus 4.7在代码质量方面表现更佳，而GPT-5.5 Codex则在成本控制上更具优势，两者各有千秋。

Arena.ai 数据指出，中美AI能力差距从三年前的+278缩小到+29，Anthropic企业客户数量超过OpenAI

Adaptive Markdown开源项目可将文档转化为由编码Agent控制的动态工作区，支持嵌入代码、问答和生成示例

StudioMI300开源项目实现单GPU端到端电影生成，输入一句话即可在45分钟内生成包含角色、音乐和旁白的影片片段

Kimi K2.6在Finance Agent Benchmark V2测试中，以开源权重获得第一，展现了在金融任务中的卓越性能

Arena数据：中美AI差距显著收窄，Anthropic客户数反超OpenAI

Arena.ai数据显示，中美AI能力差距从三年前的+278缩小至+29

OpenAI发布Codex移动端预览版，新增Hooks和编程访问令牌功能

移动端Codex（iOS/Android预览）上线，支持手机端发起任务、查看输出结果，同时电脑端Codex持续运行

开源Codex替代工具发布

一款开源Codex替代工具面世，采用SwiftUI外壳+内嵌React聊天界面+kwwk代理运行时

OpenAI详解Codex在Windows沙箱中的设计

为在Windows上运行Codex代理，OpenAI推出Windows沙箱，解决开发者在安全与权限方面的挑战

实测对比：GPT-5.5 Codex vs Claude Opus 4.7

Reddit用户测试两个编码Agent：Claude Opus 4.7生成代码更干净（零错误），Codex成本低（节省18%）

开发者用Claude打造开源智能音箱boxBot

一位reddit用户使用Claude和树莓派、Hailo等硬件自制智能音箱boxBot，支持语音和WhatsApp响应，可管理家庭日历

Anthropic发布中美AI竞争白皮书

Anthropic发布论文阐述对中美AI竞争的看法，称美国及民主盟友目前在前沿AI领域保持领先，并分析了如何维持这一优势

Anthropic与PwC达成大规模企业级Claude部署合作

Anthropic与PwC宣布扩大战略合作，PwC将向全球数十万员工推行Claude Code和Cowork，并培训3万名专业人员

AI成本失控风险加剧：AWS用户遭Claude跑单致3万美元账单

AWS Bedrock上Claude失控产生3万美元账单，成本检测工具失效

Anthropic与盖茨基金会达成2亿美元AI合作

Anthropic宣布与盖茨基金会合作，承诺提供2亿美元赠款、Claude积分和技术支持，用于全球健康、生命科学、教育等领域的AI应用

Fireworks AI开放Qwen 3.6 27B微调服务

Fireworks AI已支持对Qwen 3.6 27B进行全参数微调，通过Managed Fine-Tuning和Training API提供SFT和DPO，支持128K/256K上下文

开源项目Adaptive Markdown：让文档变成由Agent控制的动态工作区

Adaptive Markdown是一个开源文档格式/查看器，文档不再静态，而是由编码Agent控制，可嵌入代码、问答、生成示例等

Cline SDK发布多Agent并行示例，支持实时流式合成结果

Cline SDK发布多Agent示例，可启动多个专家Agent并行处理，通过SSE流式输出各Agent结果至Web UI，最终合成为统一答案

LM Studio推出视觉模型批处理Beta，提升推理速度

LM Studio在其最新MLX引擎更新中开放视觉模型批处理Beta，同时大幅改进缓存以加速推理

开源项目实现单GPU端到端电影生成，8阶段pipeline开源

开发者发布StudioMI300，整合FLUX.2、Wan2.2等模型，输入一句话即可生成带角色、音乐、旁白的电影片段，45分钟出片

Kimi K2.6开源权重在金融Agent基准测试中夺冠

Kimi K2.6在Finance Agent Benchmark V2上取得开源权重第一名，展示了金融领域任务中的领先性能

Kimi发布浏览器扩展Kimi Web Bridge，Agent可操控网页

Kimi推出Kimi Web Bridge浏览器扩展，Agent现在能像人类一样在网页上搜索、滚动、点击、输入并完成任务

Manus升级Similarweb数据集成，增强增长情报分析

Manus接入升级版Similarweb数据，用户可在Manus内直接获取更丰富的网站流量和增长驱动因素，辅助增长决策

腾讯开源Agent记忆技术方案，Token消耗最高降低61%

腾讯发布开源Agent记忆技术，通过结构化存储与检索优化，使任务成功率最高提升51%，Token消耗降低61%，为Agent长期记忆管理提供新方案

opendesk：开源MCP远程电脑控制工具

opendesk允许AI代理通过MCP协议控制其他电脑，支持点击、输入、导航

飞书CLI被视为AI Agent必备工具，安装量超1万Star

向阳乔木强烈推荐飞书CLI作为Codex、Claude Code等Agent的通用接口，可自动写入文档、管理日程、生成会议纪要

a16z调查：AI工具推动CRM使用率上升，系统从记录转向智能

a16z四月GTM调查发现，AI工具大规模采用后CRM使用率上升

Raycast V2 Beta：从启动器进化为AI Agent平台

歸藏分享Raycast更新Beta版（V2），界面和底层架构全面重写，增加AI Chat独立窗口，支持Skills、Agent和Memory，并内置语音输入，变身“启动器+AI Agent”工具

Kimi支持跨平台搜索并自动填充电子表格

Kimi推出新功能：可跨多个平台大规模搜索，并将结果直接自动填充到电子表格中，提升数据收集效率

RTX 5090本地LLM性能基准测试：功耗与Token速率关系实测

用户对RTX 5090进行系统测试，搭载Qwen3.6-27B Q6_K_P，对比400W-600W功耗下的Prompt解析与Token生成速度，发现PP对功耗更敏感，TG近乎线性，并公布详细曲线图

Turboquant+MTP在AMD ROCm上实现24GB GPU跑64K上下文

开发者为AMD RX 7900 XTX适配TBQ4 KV缓存+MTP推理，在llama.cpp分支上实现64K上下文仅占约20GB显存，生成速度38-54 tok/s

Cerebras在纳斯达克挂牌上市

AI芯片公司Cerebras正式在纳斯达克上市，股票代码$CBRS，成为又一家登陆公开市场的AI硬件企业

国产GPU开启生态开源局，SGLang等核心开发者参与

国产GPU厂商联合开源社区，共同推进GPU生态兼容与工具链优化，邀请SGLang等核心开发者参与，意图打破CUDA垄断，降低国产芯片使用门槛

Runway宣布进军日本，投资4000万美元开设东京办公室

Runway正式进军日本市场，投资4000万美元开设东京办公室

Get笔记：支持多平台URL解读的AI工具被低估

Get笔记可解读小宇宙、B站、抖音、YouTube等平台链接，提供URL解读和原始转写文本

← 上一篇：苹果AI耳机亮相：AirPods能否成为下一代智能入口下一篇：徐汇区 AI 算力服务及孵化平台“揭榜挂帅”名单揭晓 →