交互升级_标签-酷阅新闻

OpenAI连推三款音频模型，语音交互实现零延迟突破

2026年5月8日，人工智能行业迎来了又一个历史性时刻！OpenAI正式向全球开发者推出了三款全新的实时音频API模型，彻底颠覆了传统语音AI“先转录、后处理、再回复”的滞后流程，实现了实时推理、实时翻译与实时转录的三大能力升级，从根本上重塑了人机语音交互的逻辑。这三款模型发布后，迅速成为了开发者和企业级应用关注的焦点，下面为您深度解析其核心亮点👇GPT-Realtime-2具备GPT-5级推理能力，首款真正理解对话的语音模型作为本次发布的旗舰产品，它是OpenAI首个集成GPT-5级别推理能力的语音模型

2026-05-08 08:40:03 | 21 阅读