OpenAI 推出三款实时语音模型:翻译转写对话升级
5 月 7 日,OpenAI 一次性发布了三款全新语音 AI 模型,并向开发者开放 API 接入。与以往的渐进式改进不同,这次升级覆盖了从推理能力到底层机制,并重点强化实时翻译与流式转写等能力。对终端用户而言,这意味着你开口与 AI 交流时,它不仅能"听懂"你的意思,还能在语音场景下"完成任务",同时跨越语言差异——让语音真正成为人与软件之间更顺畅的沟通入口。其中 GPT-Realtime-2 被视为本轮的关键产品,也是 OpenAI 首款具备 GPT-5 级别推理能力的实