AI驱动高仿真数字人实现实时智能交互
多模态生成式高自然度数字人实时互动关键技术研究及应用
广州趣丸网络科技有限公司
该项目“多模态生成式高自然度数字人实时互动关键技术研究及应用”面向直播电商、客服、文旅、政务、医疗、教育、交通、金融等场景,聚焦数字人从“被动应答”向“主动感知与智能共情”升级。项目提出“环境感知一认知决策一情感表达”技术路线,突破多模态意图与情绪识别、视频大模型动作生成、LLM跨模态编排、低延迟实时渲染与口型驱动等关键技术,核心指标表现优异:语音识别CER1.08%、WER1.03%,意图识别96.5%,情绪识别97%,端到端响应延迟968毫秒。成果已落地趣影数字人平台、趣丸知了一体机等产品,并数字人制作成本降至百元级,并在电信、政务、会展、全运会等场景应用,取得良好经济和社会效益。项目已获授权发明专利36项、软著3项,参编国家标准1项、团体标准2项,且入选多项行业典型案例与荣誉。