标签

AI 早报|OpenAI 推出实时语音API三件套,AirPods与Cloudflare裁员消息

发布时间:2026-05-08 18:54来源:微信阅读:5

2026年5月8日,OpenAI为开发者带来了实时语音API的新功能,涵盖GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。GPT-Realtime-2侧重于对话中的推理、工具使用和打断处理;Translate支持70多种输入语言及13种输出语言;Whisper则用于低延迟的实时语音转写。OpenAI希望将语音交互从基础问答升级为具备听、思、译、写、执行能力的生产级智能体。语音模型正从“输入法”转变为“执行界面”,这势必推动客服、教育、会议、创作工具和车载助手等行业重塑交互逻辑。

语音模型正逐渐演化为“执行界面”,这将促使客服、教育、会议、创作工具及车载助手等领域的交互逻辑进行重构。