OpenAI 推出语音模型新系列,同传行业受冲击?
语音技术的迅猛发展,正逐渐改变翻译行业的未来走向。
5月7日,OpenAI 推出了全新的语音模型系列,其官方博客将其定义为「专为实时语音场景打造的新一代模型」。该系列包含三个子模型,分别针对推理、翻译和转写任务进行了专项优化,目前 API 已开放调用。
01 三款模型各司其职
此次发布的三款模型分别为:实时推理模型(主打低延迟对话)、翻译模型(实现多语言即时互译)、转写模型(追求高准确率语音转文字)。OpenAI 在博客中强调,翻译模型的延迟已降至「用户几乎无法察觉」的程度。
这种分工明确的架构设计,取代了以往「大一统」的模式。
02 同声传译是否会被替代?
新模型问世后,翻译界反响热烈。实时翻译功能的延迟已逼近「无感」状态,这对同声传译职业构成了真实冲击。不过业内人士指出,AI 翻译目前的短板在于「语义理解」——面对双关语、俚语及文化背景时,仍易出现错误。
在高端商务会议、法律合同、医疗对话等场景中,人类译员依然难以被取代。
03 API 定价:开发者能否接受?
OpenAI 官方博客公布了 API 的定价策略。根据页面显示,实时推理模型价格约为每千 token 0.03 美元,转写模型约为每分钟 0.006 美元。对中小开发者而言,成本虽可控但并不算低廉。
语音 AI 应用层的竞争日趋激烈。应用开发者需在模型能力、响应速度与价格三者之间寻求平衡。
你认为 AI 实时翻译能否取代同声传译?
A. 会,AI 成本低且进步迅速
B. 不会,高端场景仍需人工
C. 部分取代,人机协作是未来趋势
---
本文由 AI 辅助创作,内容