边听边想_标签-酷阅新闻

OpenAI发布三款新语音模型 AI实现实时“边听边思考”

5月8日，OpenAI在Realtime API中一次性发布了三款前沿智能语音模型——GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper，分别聚焦于语音交互对话、实时多语种翻译以及实时语音转写。这预示着智能语音技术已突破“仅能听懂”的局限，迈向了“边听边思考、边分析边执行”的全新境界。GPT-Realtime-2：AI终于掌握了边“听”边“想”的技能此次发布的“核心”无疑是GPT-Realtime-2。作为一个真正具备“人性化表达与执行力”

2026-05-08 12:18:29 | 11 阅读