标签

中美AI实力趋近,Anthropic客户增长超越OpenAI

发布时间:2026-05-15 13:35来源:微信阅读:9

Arena.ai 最新统计表明,中美两国在AI能力上的差距已从三年前的 +278 缩减至 +29,显示出全球AI竞争格局的显著变化。同时,Anthropic的企业客户规模已经超过了OpenAI。

开源社区表现活跃,Adaptive Markdown项目可将静态文档转换为由Agent驱动的动态工作区,而StudioMI300项目实现了单GPU端到端电影生成,体现了开源工具在Agent流程和多模态内容生成方面的快速进步。

在编码Agent的实际测试中,Claude Opus 4.7在代码质量方面表现更佳,而GPT-5.5 Codex则在成本控制上更具优势,两者各有千秋。

Arena.ai 数据指出,中美AI能力差距从三年前的+278缩小到+29,Anthropic企业客户数量超过OpenAI

Adaptive Markdown开源项目可将文档转化为由编码Agent控制的动态工作区,支持嵌入代码、问答和生成示例

StudioMI300开源项目实现单GPU端到端电影生成,输入一句话即可在45分钟内生成包含角色、音乐和旁白的影片片段

Kimi K2.6在Finance Agent Benchmark V2测试中,以开源权重获得第一,展现了在金融任务中的卓越性能

Arena数据:中美AI差距显著收窄,Anthropic客户数反超OpenAI

Arena.ai数据显示,中美AI能力差距从三年前的+278缩小至+29

OpenAI发布Codex移动端预览版,新增Hooks和编程访问令牌功能

移动端Codex(iOS/Android预览)上线,支持手机端发起任务、查看输出结果,同时电脑端Codex持续运行

开源Codex替代工具发布

一款开源Codex替代工具面世,采用SwiftUI外壳+内嵌React聊天界面+kwwk代理运行时

OpenAI详解Codex在Windows沙箱中的设计

为在Windows上运行Codex代理,OpenAI推出Windows沙箱,解决开发者在安全与权限方面的挑战

实测对比:GPT-5.5 Codex vs Claude Opus 4.7

Reddit用户测试两个编码Agent:Claude Opus 4.7生成代码更干净(零错误),Codex成本低(节省18%)

开发者用Claude打造开源智能音箱boxBot

一位reddit用户使用Claude和树莓派、Hailo等硬件自制智能音箱boxBot,支持语音和WhatsApp响应,可管理家庭日历

Anthropic发布中美AI竞争白皮书

Anthropic发布论文阐述对中美AI竞争的看法,称美国及民主盟友目前在前沿AI领域保持领先,并分析了如何维持这一优势

Anthropic与PwC达成大规模企业级Claude部署合作

Anthropic与PwC宣布扩大战略合作,PwC将向全球数十万员工推行Claude Code和Cowork,并培训3万名专业人员

AI成本失控风险加剧:AWS用户遭Claude跑单致3万美元账单

AWS Bedrock上Claude失控产生3万美元账单,成本检测工具失效

Anthropic与盖茨基金会达成2亿美元AI合作

Anthropic宣布与盖茨基金会合作,承诺提供2亿美元赠款、Claude积分和技术支持,用于全球健康、生命科学、教育等领域的AI应用

Fireworks AI开放Qwen 3.6 27B微调服务

Fireworks AI已支持对Qwen 3.6 27B进行全参数微调,通过Managed Fine-Tuning和Training API提供SFT和DPO,支持128K/256K上下文

开源项目Adaptive Markdown:让文档变成由Agent控制的动态工作区

Adaptive Markdown是一个开源文档格式/查看器,文档不再静态,而是由编码Agent控制,可嵌入代码、问答、生成示例等

Cline SDK发布多Agent并行示例,支持实时流式合成结果

Cline SDK发布多Agent示例,可启动多个专家Agent并行处理,通过SSE流式输出各Agent结果至Web UI,最终合成为统一答案

LM Studio推出视觉模型批处理Beta,提升推理速度

LM Studio在其最新MLX引擎更新中开放视觉模型批处理Beta,同时大幅改进缓存以加速推理

开源项目实现单GPU端到端电影生成,8阶段pipeline开源

开发者发布StudioMI300,整合FLUX.2、Wan2.2等模型,输入一句话即可生成带角色、音乐、旁白的电影片段,45分钟出片

Kimi K2.6开源权重在金融Agent基准测试中夺冠

Kimi K2.6在Finance Agent Benchmark V2上取得开源权重第一名,展示了金融领域任务中的领先性能

Kimi发布浏览器扩展Kimi Web Bridge,Agent可操控网页

Kimi推出Kimi Web Bridge浏览器扩展,Agent现在能像人类一样在网页上搜索、滚动、点击、输入并完成任务

Manus升级Similarweb数据集成,增强增长情报分析

Manus接入升级版Similarweb数据,用户可在Manus内直接获取更丰富的网站流量和增长驱动因素,辅助增长决策

腾讯开源Agent记忆技术方案,Token消耗最高降低61%

腾讯发布开源Agent记忆技术,通过结构化存储与检索优化,使任务成功率最高提升51%,Token消耗降低61%,为Agent长期记忆管理提供新方案

opendesk:开源MCP远程电脑控制工具

opendesk允许AI代理通过MCP协议控制其他电脑,支持点击、输入、导航

飞书CLI被视为AI Agent必备工具,安装量超1万Star

向阳乔木强烈推荐飞书CLI作为Codex、Claude Code等Agent的通用接口,可自动写入文档、管理日程、生成会议纪要

a16z调查:AI工具推动CRM使用率上升,系统从记录转向智能

a16z四月GTM调查发现,AI工具大规模采用后CRM使用率上升

Raycast V2 Beta:从启动器进化为AI Agent平台

歸藏分享Raycast更新Beta版(V2),界面和底层架构全面重写,增加AI Chat独立窗口,支持Skills、Agent和Memory,并内置语音输入,变身“启动器+AI Agent”工具

Kimi支持跨平台搜索并自动填充电子表格

Kimi推出新功能:可跨多个平台大规模搜索,并将结果直接自动填充到电子表格中,提升数据收集效率

RTX 5090本地LLM性能基准测试:功耗与Token速率关系实测

用户对RTX 5090进行系统测试,搭载Qwen3.6-27B Q6_K_P,对比400W-600W功耗下的Prompt解析与Token生成速度,发现PP对功耗更敏感,TG近乎线性,并公布详细曲线图

Turboquant+MTP在AMD ROCm上实现24GB GPU跑64K上下文

开发者为AMD RX 7900 XTX适配TBQ4 KV缓存+MTP推理,在llama.cpp分支上实现64K上下文仅占约20GB显存,生成速度38-54 tok/s

Cerebras在纳斯达克挂牌上市

AI芯片公司Cerebras正式在纳斯达克上市,股票代码$CBRS,成为又一家登陆公开市场的AI硬件企业

国产GPU开启生态开源局,SGLang等核心开发者参与

国产GPU厂商联合开源社区,共同推进GPU生态兼容与工具链优化,邀请SGLang等核心开发者参与,意图打破CUDA垄断,降低国产芯片使用门槛

Runway宣布进军日本,投资4000万美元开设东京办公室

Runway正式进军日本市场,投资4000万美元开设东京办公室

Get笔记:支持多平台URL解读的AI工具被低估

Get笔记可解读小宇宙、B站、抖音、YouTube等平台链接,提供URL解读和原始转写文本