2026.5.18 AI 速递:OpenAI 涉足金融,巨头竞逐智能体
OpenAI 近期面向部分美国 Pro 用户开启了 ChatGPT 个人理财功能内测,允许绑定银行、投资及信用卡账户,使 AI 能依据真实财务数据提供建议。此功能稍后将惠及 Plus 用户,并最终向全员开放。
网页版与 iOS 端均支持连接真实金融账户
ChatGPT 仅可读取余额和流水,无法执行转账等资金操作
同步数据保留 30 天后自动销毁,“财务记忆”支持独立查看与清除
Codex 发布了一轮聚焦开发效率的更新,加入自定义快捷键、优化 Git 操作入口,并改良了线程面板与本地服务器列表体验。官方数据显示,大型仓库内的 Git 操作效率提升了 10 至 50 倍。
快捷键现已支持在设置中按需定制,契合个性化工作流
提交、推送、建分支、创 PR 等 Git 操作被重新整合至更便捷位置
线程切换重渲染降低约 75%,显著减少 UI 卡顿及首交互延迟
SpaceXAI 宣布,所有等级的 Grok 订阅户现能通过 OAuth 直连 Hermes Agent,在 Agent 内部调用 Grok 4.3、GrokTTS 及 Grok Imagine。此举加速了 Grok 与开源 Agent 生态的融合进程。
接入流程简便,经 Grok OAuth 授权即可激活
涵盖高级推理、语音合成以及图文视频生成能力
官方透露未来将持续拓展更多开源 Agent 的集成
上海人工智能实验室发布了参数量达 35B 的 Intern-S2-Preview,定位为高效科学多模态基座模型。官方表示,其在核心科学任务上的表现可比肩万亿参数大模型,并首次拥有材料晶体结构生成能力。
在科学任务处理与 Agent 能力基准上实现显著跃升
首创材料晶体结构生成功能,成为开源模型界的重要突破
借助共享权重 MTP、KL 损失及 CoT 压缩技术优化推理效率与响应长度
Boson AI 推出了实时数字人基座模型 Higgs Avatar v1 的私有预览版,仅需单张静态图即可生成与语音实时同步的可交互面部影像。该产品专为实时对话虚拟人及 Agent 场景打造。
具备说话、倾听、响应及打断等实时交互技能
生成速度达每帧约 16 毫秒,满足实时对话标准
单张 H100GPU 可同时支撑 8 路并发对话
阿里正式推出 Qoder 1.0,将产品从 AIIDE 升级为 Agent 自主开发平台。用户仅需定义需求,Agent 团队便能自主完成执行、验证至交付的全流程,进一步推动“开发自动化”。
支持跨项目多任务并行处理及团队级知识引擎
新增自定义 Agent 专家组,适配多样化研发角色
底层 Agent Harness 完成系统性重构,大幅增强自主执行力
媒体报道指出,相关部门正全力推进全国一体化算力网建设,以应对激增的 AI 算力需求与成本压力。算力网被喻为“算力版国家电网”,预示着算力调度将迈向平台化与基础设施化。
计划联通各地数据中心与超算中心,达成统一调度
用户可在算力网上按需采购和调用算力资源
算力网已与水利网、电网等并列为核心基础设施方向
SpaceX AI 宣布下一代 Grok 模型 V9 已完成训练,预计今年夏季带来重大更新。该版本构建于 1.5T 参数基座模型之上,是 Grok 系列的关键迭代。
当前公开版本仍基于 0.5T 参数的 V8 基座模型
V9 被视为 Grok 在能力维度与规模体量上的一次质变
后续拟引入 Cursor 数据进行补充训练,以进一步优化效果
Anthropic 面向金融服务业发布了 10 款可部署的金融智能体工作流模板,涵盖财报分析、估值审查、对账及关账等核心场景。同期,穆迪等金融数据商通过 MCP 接入 Claude,Office 插件生态日趋完善。
模板由技能指令、数据连接器及子智能体构成
支持作为桌面插件运行,或作为托管智能体执行长周期任务
Claude Opus 4.7 在金融基准测试中以 64.37% 准确率位居榜首
MiniMax 推出了多智能体协作系统 Mavis,采用 Leader、Worker、Verifier 三层分权制衡架构,破解单智能体“既当裁判又当运动员”的瓶颈。该系统更像是一套运行时基础设施,而非单纯的提示词编排方案。
Leader 负责拆解任务,Worker 负责执行,Verifier 独立验收
三者目标函数互逆,构建出天然的对抗式质检机制
支持状态机驱动、异步 IM 执行及后台主动汇报进度
声明:本内容由 AI 生成,可能包含不准确或推测性信息,请读者自行甄别并谨慎参考。
欢迎点赞收藏