标签

OpenAI发布三款新语音模型 AI实现实时“边听边思考”

5月8日,OpenAI在Realtime API中一次性发布了三款前沿智能语音模型——GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,分别聚焦于语音交互对话、实时多语种翻译以及实时语音转写。这预示着智能语音技术已突破“仅能听懂”的局限,迈向了“边听边思考、边分析边执行”的全新境界。GPT-Realtime-2:AI终于掌握了边“听”边“想”的技能此次发布的“核心”无疑是GPT-Realtime-2。作为一个真正具备“人性化表达与执行力”

2026-05-08 12:18:29  |  6 阅读

AI每日速递:苹果新款AirPods集成摄像头,OpenAI发布三款语音模型

多语言语音克隆 TTS 模型 OmniVoice01一款集成了摄像头的 AirPods 正处于产品开发的后期验证阶段,最快可能在今年九月伴随升级后的 Siri 版本一同面市。这款 AirPods 的摄像头并非传统意义上的拍照或录像设备,而是作为 AI 版 Siri 的视觉输入端。两侧耳塞均配备了低分辨率摄像头,用于捕捉用户周遭环境的视觉信息,并实时传输给 Siri 进行分析。此举旨在让用户无需依赖手机,即可通过语音指令与环境进行互动,例如在冰箱前咨询食谱建议,或询问陌生物品的用途,Siri 都能依据摄像头

2026-05-08 10:51:09  |  6 阅读

OpenAI革新语音交互:低延迟与强推理并举

硅基工具人OpenAI正以前所未有的速度推进其语音技术的边界。OpenAI于2026年5月7日隆重推出其最新的语音模型及Realtime API功能,其战略意图十分明确:为开发者和产品团队提供低延迟的语音交互、推理、翻译及转写能力。对于一个已将文本对话确立为主要入口的公司而言,语音并非附加功能,而是其下一代人机交互入口的关键战场。本次发布的亮点在于“三款全新语音模型”的同步亮相。官方并未将此次更新包装成单一性能的提升,而是将实时语音能力、语音理解能力与文本化能力置于同等重要的讨论层面。语音助手、客服以及多

2026-05-08 10:16:05  |  6 阅读

AI 早报 Vol.023:OpenAI 语音 API 上线,Anthropic 发布自编码器

每天仅需3分钟,洞悉AI及加密货币市场核心资讯BTC 连续三日反弹至 81,000 高位遇阻,回撤至 79,800 点位。恐惧贪婪指数从 46 降至 38,重回恐惧区,表明市场信心不稳。ETH 跌势更猛,从 2,364 下探至 2,288,短期技术形态偏弱。据 TechCrunch 5 月 7 日消息,OpenAI 正式在其 API 中上线了全新的语音智能(Voice Intelligence)功能,赋予开发者更卓越的语音交互体验。核心摘要:深度剖析:此举意味着 OpenAI 正加速从图文领域迈向多模态语

2026-05-08 09:40:04  |  5 阅读

OpenAI自研芯片遇冷:博通索要微软40%产能

OpenAI与博通在AI芯片领域的合作目前遭遇了融资难题。 据消息指出,OpenAI与芯片设计巨头博通去年宣布联合研发定制AI芯片时,双方曾笃定这是一笔稳操胜券的交易。然而几个月过去,根据一份内部备忘录及两名谈判知情人的说法,双方正在商讨由博通出资负责芯片生产的第一期建设。该阶段需要1.3吉瓦的数据中心算力,耗资约180亿美元。据此估算,代号“Nexus”、总规模10吉瓦的完整项目,光是芯片生产成本就达1800亿美元,且尚未包含数据中心建设等其他费用。 搞定这笔融资对OpenAI至关重要。这家ChatGP

2026-05-08 05:44:28  |  17 阅读

2026年5月7日AI要闻速递

本期汇总20条全球 AI 与商业科技领域的关键动态,覆盖国际进展、行业走向以及产品发布。Elon Musk 表示,xAI 将终止以独立公司身份运作,并与 SpaceX 完成全面合并,随之更名为 SpaceXAI。该公司在周三宣布与 Anthropic 展开算力协同时,首次公开启用这一新称呼。Musk 解释称:"xAI 不会再以独立主体存在,它将成为 SpaceX 的 AI 产品线。"SpaceXAI 随后宣布与 Anthropic 达成重要算力合作。业内解读认为,这一动作让 Musk 的

2026-05-08 02:13:19  |  5 阅读

SpaceX 雄心万亿造芯、OpenAI 提前布局 AI 手机、国产大模型迎来资本与人才双高峰 | 前沿快讯

全球 AI 行业正处于推理效率变革、算力版图重组、资本疯狂注入的关键阶段。谷歌、OpenAI、SpaceX 等行业巨头动作密集,国内大模型及 AI 基础设施融资屡创新高,人才争夺战与战略调整愈演愈烈,产业步入高速迭代期。我们汇总了今日全球科技圈十大核心动态,提供一手资讯 + 深度产业解读,助你一目了然地把握行业最新风向。5 月 5 日,谷歌面向 Gemma 4 系列开源模型推出了多 Token 预测(MTP)起草工具,运用推测解码机制,推理速度最高可提升 3 倍,且输出品质无损。MTP 的核心机制在于 “

2026-05-08 00:03:05  |  7 阅读

OpenClaw 指南:打造你的智能助手

登场!OpenClaw 使用攻略 ### 📌 OpenClaw 是什么? 通俗来讲:**这是一个可运行于手机与电脑的智能助手**,除了对话,它还能为你: - 📅 规划日程、设置提醒 - 📧 处理邮件、归纳信息 - 📈 查阅股票、分析报表 - 🔍 搜索资讯、整理文档 - 🧹 自动化处理各类重复工作 ### 🚀 5 分钟极速上手 **第 1 步:安装** 在电脑或服务器部署 OpenClaw(支持 Mac/Linux/Windows) **第 2 步:绑定** 通过微信扫码连接,随时随地发送指令 **第 3

2026-05-07 21:41:00  |  5 阅读

OpenAI总裁庭上惊人陈述:零投入持股300亿,马斯克诉讼胜算几何?

近期,围绕马斯克与OpenAI的诉讼案出现了爆炸性的新进展。OpenAI总裁格雷格·布罗克曼出庭作证,其披露的核心信息彻底改变了公众的认知。布罗克曼在法庭上坦承:“自己并未向OpenAI注入任何资金,却持有其盈利部门近300亿美元的股份。”他早年承诺捐赠的10万美元,最终也未兑现。作为对比,马斯克作为早期关键支持者,已捐赠约“3800万美元”,然而他个人在OpenAI的持股却为“0”。庭审还揭示了重要的利益关联:布罗克曼与奥特曼均是AI芯片公司“Cerebras”的个人投资者。从2025年12月开始,Op

2026-05-07 18:39:00  |  6 阅读

OpenAI揭示AGI进化五阶梯

2024年夏,全球人工智能领域迎来了一场重要的概念革新。作为AI研究的领先者,OpenAI在其内部全员会议上首次公布了一套用于评估AI发展进程的“五级分级标准”。此标准被视为OpenAI迈向“通用人工智能”(AGI)的路线图,为行业提供了明确的参照,并极大地激发了公众对未来AI形态的想象。从能进行日常对话的“聊天机器人”到能够独立运营组织的“超级大脑”,这五级台阶究竟勾勒出怎样的智能蓝图?我们目前又处于哪个阶段?第一级别(Level 1)被界定为“聊天机器人”(Chatbots),其核心特征在于能够与人类

2026-05-07 17:30:58  |  10 阅读

智能体安全成焦点 “养虾先剪脚”重塑产业防线

国 研 洞 察AI智能体安全漏洞接连爆发,给产业敲响警钟。所谓的“养虾先剪脚”并非阻碍创新,而是为技术落地设定必要红线。只有把最小权限、沙箱隔离、全生命周期管理等手段纳入治理体系,才能真正释放智能体效能,确保合规。政企需合力,实现安全与效率的平衡。▼详细内容据经济参考报报道,近期AI智能体安全问题备受瞩目。被誉为“龙虾”的标杆项目OpenClaw被揭露存在众多高危漏洞,技能包投毒攻击日益频繁。CNNVD数据显示,4月14日至28日期间,OpenClaw漏洞达111个,包含2个超危漏洞和38个高危漏洞,主要

2026-05-07 15:49:47  |  13 阅读

AI风云:马斯克与奥特曼的权力与人性博弈

关注“学霸Jolin聊成长”公众号,收看更多好文AI官司 人性审判近期,一场备受瞩目的世纪诉讼在硅谷上演,原告为埃隆·马斯克,被告指向OpenAI的萨姆·奥特曼。根据最新公开的庭审记录,马斯克连续三天的出庭证词,宛如一部扣人心弦的高智商商业斗争大片。对方律师步步紧逼,试图诱导马斯克承认:“你是否因为当初未能获得OpenAI的控制权而心生嫉妒,如今才反目成仇?”对此,马斯克掷地有声地回应:“没有我,OpenAI根本不会存在。” 马斯克的此番言论并非空穴来风。回溯至2015年,当时谷歌旗下的DeepMind团

2026-05-07 15:27:29  |  6 阅读

OpenAI 推出 Agent Studio:零代码打造 AI 员工,普通人也能上手

5 月 5 日,OpenAI 推出重磅新品:Agent Studio 正式上线。拖拽操作、零代码,无需编写一行代码,即可构建、测试并部署一个自主工作的 AI Agent。该产品深度融合了 GPT-5 技术。听起来是给程序员准备的?其实不然。它的目标受众主要是像你我这样的非技术人员。以前利用 AI 辅助工作,你得学会“跟 AI 说话”,也就是提示词工程。现在变了,你只需描述想让 AI 干什么,Agent Studio 就帮你搭一个能自动跑的 AI 员工出来。举个具体例子。你做销售,每天要跟进客户、写邮件、更

2026-05-07 14:18:56  |  8 阅读
腾讯混元Hy3预览版Token调用量激增,两周增长十倍

腾讯混元Hy3预览版Token调用量激增,两周增长十倍

新浪科技讯 5月7日上午消息,腾讯混元发布最新统计数据,自推出以来,Hy3预览版的Token调用次数持续攀升,目前总量已是上一代模型Hy2的十倍以上。其中,在代码编写及智能体应用场景下的Token调用量增长尤为显著,而腾讯旗下的WorkBuddy/Codebuddy及Qclaw等应用的总增长幅度更是达到了16.5倍以上。 另外,根据OpenRouter的公开数据分析,Hy3预览版在过去一周的Token调用量不仅在总榜单上名列前茅,其市场份额也位居“双第一”。在编程和工具调用这两类场景中,其调用量同样占据了

2026-05-07 14:17:50  |  7 阅读

AI智能体与OpenClaw:企业安全新挑战

伴随众多企业纷纷试水AI代理系统,同时员工对OpenClaw的需求持续升温,安全隐患正由“模型层”向“执行层”及“控制层”扩散。本次线上研讨会将深度剖析AI智能体与OpenClaw所引发的新兴安全威胁,涵盖越权操作、命令注入、失控运行等议题,研究如何借助监管与防护体系,在创新推进与风险管控间寻求平衡,打造可靠的AI自动化安全架构。AI代理系统安全威胁由“模型层”向“执行层”延伸构建AI智能体“自主决策权”与“数据获取权限”的风险分级框架,实现防护策略与风险级别的精确匹配安全驾驭OpenClaw的实践路径

2026-05-07 12:50:45  |  4 阅读