标签

OpenAI连推三款音频模型,语音交互实现零延迟突破

2026年5月8日,人工智能行业迎来了又一个历史性时刻!OpenAI正式向全球开发者推出了三款全新的实时音频API模型,彻底颠覆了传统语音AI“先转录、后处理、再回复”的滞后流程,实现了实时推理、实时翻译与实时转录的三大能力升级,从根本上重塑了人机语音交互的逻辑。这三款模型发布后,迅速成为了开发者和企业级应用关注的焦点,下面为您深度解析其核心亮点👇GPT-Realtime-2具备GPT-5级推理能力,首款真正理解对话的语音模型作为本次发布的旗舰产品,它是OpenAI首个集成GPT-5级别推理能力的语音模型

2026-05-08 08:40:03  |  7 阅读