字节Seeduplex全双工语音模型发布,豆包通话实现双向实时交互
字节于今日正式揭晓其原生全双工语音大模型Seeduplex。
相较此前的半双工豆包端到端语音方案,Seeduplex采用“同步听说”的创新架构,使得交互的流畅性与真实感获得显著增强。
官方表示,Seeduplex主要达成了两大技术突破:
多项综合测评表明,Seeduplex在对话流畅性与节奏把控方面,明显超越传统半双工模式及市面主流应用的语音通话能力;在停顿判断精准度上,较半双工方案提高8%,呈现出更贴近真人对话的时机把握能力。
同时,大规模A/B测试结果揭示,相较于先前上线的半双工版本,Seeduplex使用户的通话时长、留存率等关键数据均呈现积极增长,整体通话满意度绝对值上扬8.34%,用户投诉中“抢话”、“反应迟缓”、“误打断”等现象的反馈频次显著降低。
现阶段,Seeduplex已完成在豆包App的全面部署,电话功能获得升级,在对话自然性、响应效率及抗干扰性能方面均有优化,支持同步听说,沟通感受更为贴近真实交流。(IT之家注:需选用桃子音色)
用户只需将豆包App升级至最新版,在对话框中点击“打电话”,即可进入语音通话界面进行体验。
IT之家整理Seeduplex项目链接如下:
https://seed.bytedance.com/seeduplex

