语音模_标签-酷阅新闻

OpenAI发布革命性语音模型GPT-Live，开启全双工交互新时代

点击上方蓝字关注，行业资讯轻松掌握！OpenAI近期连续发布两条重要动态。当地时间7月8日，任职近九年的首席未来学家约书亚·阿奇亚姆（Joshua Achiam）宣布即将离职；次日7月9日，公司正式推出全新全双工语音模型GPT-Live系列。高管离任与产品发布的时间节点如此接近，引发业界广泛关注。7月8日，34岁的阿奇亚姆在社交平台发布声明，宣布将于本月离开OpenAI。他强调此次离职并无特定触发事件，而是经过长期深思熟虑后的决定。他指出，当前AI发展的巨大潜力已为全球所熟知，这一“共识”已不再需要身处顶

2026-07-10 17:27:21 | 13 阅读

AI前沿快讯：Grok 4.5经济版登场，阶跃星辰加速AI手机布局

◆ AI前沿 · 每日简报 AI前沿快讯：Grok 4.5经济版登场，阶跃星辰加速AI手机布局 ■ 2026.07.09 10:06 CST · 十三的创意空间 · 越思越远 01 SpaceXAI推出Grok 4.5，马斯克誉之为“Opus级模型” ▸ 2026-07-09 03:30 CST // TechCrunch 埃隆·马斯克的科技企业周三揭晓了Grok的最新迭代，宣称提供较其他顶尖AI模型更为经济高效的选项。 ◆ 展望 Grok 4.5凭“Opus级”实力聚焦性价比，或激化大模型价格竞争，促使

2026-07-09 10:32:47 | 10 阅读

OpenAI发布新一代全双工语音模型GPT-Live

OpenAI正式推出GPT-Live，这是一款采用全双工技术的新一代语音模型，能够同步实现听与说的功能。 7月8日将发布两个版本的GPT-Live，分别是GPT-Live-1和GPT-Live-1 mini。公司透露每周有1.5亿用户使用ChatGPT进行交流。责任编辑：丁文武新浪财经声明：此消息系转载自合作媒体，新浪财经登载此文出于传递更多信息之目的，文章内容仅供参考，不构成投资建议。郑重声明：1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有

2026-07-09 03:33:41 | 14 阅读

AI暂停期来临：别等新模型，先用好手头工具

整个六月，AI圈都在翘首以盼下一代旗舰模型，但GPT-5.6、Sonnet 5、Gemini 3.5 Pro悉数延期。预测市场显示，GPT-5.6本周发布概率已从近90%骤降至30%以下。这并非技术受限，而是监管压力与内部质量标准共同作用的结果——你手中的模型，或许远比你想象的强大。GPT-5.6与Sonnet 5等核心模型集体延后，用户正该趁此机会，弥合现有模型能力与实际应用间的鸿沟。•GPT-5.6发布概率从近90%跌至30%以下，新发布时间推至七月中旬。•OpenAI内部透露，全新语音模型或将于本周

2026-06-30 07:06:34 | 8 阅读

人工智能每日资讯 06-23

[行业动态] 1. MiniMax 推出 Speech 2.8 语音引擎，增强 AI 语音的真实感 2. NVIDIA 发布全新 AI 软件平台，提升材料模拟与暗物质研究效率 3. OpenAI 上线 Daybreak 工具套件，助力企业大规模修复安全漏洞 [热门产品] 1st Agent 37 Cloud 为开发者提供托管式 AI 智能体服务，无需自行搭建服务器。 2nd Atomic Mail Agentic 为 AI 智能体配备独立邮箱，实现邮件自主收发，无需人工介入。 3rd Grok by Sp

2026-06-23 08:44:41 | 14 阅读

AI行业日报｜2026年6月18日要闻速递

🔔1、SpaceX收购Cursor后发布1.5万亿参数通用代码大模型💡核心要点：刚完成600亿美元收购的Cursor在Compile大会发布超1.5万亿参数模型，依托SpaceX十万卡算力从零预训练，算力规模提升10-20倍。模型不局限代码能力，可像工程师自主规划、测试软件，训练已启动，数周内上线，后续还将推出面向智能体的全链路开发平台Origin。📌查看原文🔔2、微信支付推出AI专属隔离卡，授权Agent自动消费💡核心要点：微信支付上线AI专属卡，资金与主账户完全隔离，用户自主设置额度。可授权WorkB

2026-06-18 09:14:07 | 14 阅读

AI 前沿速递：语音突破与行业变局 (5 月 25 日)

一、语音模型阶跃星辰正式推出 StepAudio 2.5 Realtime 实时语音模型，该模型能深度解析语气、速率及停顿等副语言细节。它支持个性化定制，内置上万种原生人格模板，可灵活组合出数百万种独特特征。二、开发工具Replit Agent 携手 Squidler 达成集成，打造全自动化的 AI 质保流程。用户仅需通过自然语言阐述需求，Agent 即负责构建，Squidler 随后自动执行测试并反馈修复方案，彻底告别手动编写测试脚本。三、行业动态Anthropic 正推进超 300 亿美元的融资计划，

2026-05-25 09:13:02 | 14 阅读

OpenAI 推出语音模型新系列，同传行业受冲击？

语音技术的迅猛发展，正逐渐改变翻译行业的未来走向。5月7日，OpenAI 推出了全新的语音模型系列，其官方博客将其定义为「专为实时语音场景打造的新一代模型」。该系列包含三个子模型，分别针对推理、翻译和转写任务进行了专项优化，目前 API 已开放调用。01 三款模型各司其职此次发布的三款模型分别为：实时推理模型（主打低延迟对话）、翻译模型（实现多语言即时互译）、转写模型（追求高准确率语音转文字）。OpenAI 在博客中强调，翻译模型的延迟已降至「用户几乎无法察觉」的程度。这种分工明确的架构设计，取代了以往「

2026-05-18 08:34:06 | 12 阅读

AI领域24小时热点速递（5月13日）

【AI资讯日报 | 05月13日】24小时AI圈：OpenAI三连发语音模型，阿里千问×淘宝闭环，Meta发Muse Spark 🔥 GPT‑5.5 Instant 上线 & 三款实时语音模型发布 🔥 Thinking Machines Lab 交互语音模型 TML‑Interaction‑Small 🔥 千问与淘宝全面打通，AI购物闭环落地 🔥 Meta 自研模型 Muse Spark 发布 🔥 Claude Code Agent View 上线，多智能体调度“监工屏”

2026-05-13 13:16:29 | 15 阅读

AI行业周报（5月6日至5月10日）

技术动态01百度：发布基础大模型文心大模型5.15月9日，百度发布基础大模型文心大模型5.1。文心5.1基于文心5.0训练完成，从文心5.0子模型矩阵中提取最优子结构，充分继承文心5.0知识，显著降低预训练成本。创新性提出弹性训练框架，在单次预训练中，通过动态采样机制，同时优化大量参数各异的子模型，构建出覆盖多种参数规模与计算开销的子模型矩阵。技术报告：https://yiyan.baidu.com/blog原文链接>>文心 5.1正式上线！02阶跃星辰：发布实时语音大模型StepAudio

2026-05-11 21:36:57 | 11 阅读

AI热点日报|每日3分钟速览AI前沿动态(2026-05-11)

时间：2026-05-11 08:17 · 共收录 10 条热点 · 关键词：AI热点、语音模型、阶跃星辰、文心升级、蚂蚁百灵、通义灵码、智能体、科博会阶跃星辰发布全新实时语音大模型StepAudio 2.5 Realtime，该模型拥有三大突出特性：卓越的副语言识别能力，能精确捕捉语调、语速、停顿等情感细微变化；海量角色定制功能，可从性格特征到语言习惯进行深度个性化设置，创造独一无二的AI形象；对话智能全面升级，情商与智商同步提升。• 详情：https://mp.weixin.qq.com/s/P0x9

2026-05-11 08:31:21 | 12 阅读

AI界本周核心动态

过去一周人工智能领域热闹非凡，我们精选了9条最重磅的消息。OpenAI 推出重磅新品，Anthropic 连发多项研究成果，而 xAI 则宣告解散。下面逐一盘点。1.OpenAI 推出 GPT-Realtime-2 语音模型（5月7日）这是首个能够投入生产环境的端到端语音 Agent 模型，具备实时推理能力并涵盖70种语言翻译。经过众多开发者的实际测试，反馈极佳。语音 AI 技术已跨越"听懂"迈向"执行任务"的新台阶。2.Anthropic 携手 SpaceX 扩充算力（5

2026-05-10 20:35:18 | 19 阅读

AI行业每日观察 2026年05月10日

今日汇总 20 项 AI 产业新闻 | 由「坤哥学AI」智能编辑1. 马斯克痛失华裔核心人才，xAI Grok 预训练主管庄钧堂正式离职原标题：《xAI 痛失华裔骨干：预训练主管宣布离职，马斯克再度遭遇人才流失》xAI 再度失去一位华裔核心成员，预训练主管庄钧堂昨日公开宣布离职决定。在此之前，庄钧堂已在 xAI 任职达两年之久。任职期间，他全面负责 Grok 系列模型的预训练工作，并承担 Grok 在 X 平台和 Tesla 车载系统的语音模型预训练任务...

2026-05-10 20:04:21 | 14 阅读

AI前沿|文心5.1低成本登顶搜索榜，DeepSeek融资破纪录，OpenAI首届AI原生代毕业

1. 百度发布文心大模型5.1版本，以行业6%的预训练成本实现搜索榜登顶5月9日，百度推出新一代基础大模型文心5.1，运用"多维弹性预训练"技术，仅用同类模型约6%的预训练成本便达到基础性能领先水平。在LMArena大模型竞技场最新榜单中，文心5.1凭借1223分斩获国内搜索榜冠军、全球第四，成为唯一入围的国产模型。其智能体能力已反超DeepSeek-V4-Pro，创意文本生成水平媲美Gemini 3.1 Pro，推理性能逼近业界顶尖闭源模型。该模型将总参数缩减至约三分之一、激活参数压缩至约二分之一，体现

2026-05-09 13:46:23 | 30 阅读

人工智能前沿动态速览

国家相关部门联合推出了《人工智能终端智能化分级》的国家标准，该标准涵盖了手机、电脑、电视、智能眼镜、汽车座舱、音箱以及耳机等七大类产品。标准将产品的智能化水平划分为 L1（响应级）至 L4（协同级）四个等级。此举意味着消费者在选购人工智能家电和手机时，将拥有一个统一的“智商”衡量尺度，有助于遏制概念炒作，让用户能更清楚地了解设备的智能水平。OpenAI 推出了包括 GPT-Realtime-2 在内的三款新型语音模型，这些模型具备 GPT-5 级别的推理能力，能够实现边听边思考，并保证对话流畅无卡顿。同时

2026-05-09 13:45:39 | 21 阅读