Noiz AI:清华字节背景团队,聚焦音频AI,获巨额投资
AI投资,欢迎微信交流
Noiz AI是一家低调且注重实效的音频AI公司,由前Meta、字节跳动等知名企业员工,以及来自清华、北大、香港科技大学的精英校友共同创办。团队中大部分成员是年轻的00后,其中清华、北大的毕业生约占一半。
声音是理性的物理,也是感性的留白
不要音频盲盒,要闭环生产力
陈前:我们采取模型与产品双线发展的策略。
模型层面:已推出十余款全栈音频模型,包括可与Suno媲美的音乐生成模型,市面上稀缺的专业音效模型,以及能够根据视频内容自动生成配乐的Video-to-Music模型等,更新迭代速度极快,小版本最快可三天一次;
产品层面:我们正在构建一个一体化的音频创作工作室,使用户无需切换至其他剪辑软件进行二次编辑,即可直接完成音频的生成、剪辑、配乐以及多语言本地化等全套流程,广泛应用于短视频、短剧、电商配音、播客等主流应用场景。
为何AI需要专属的“听觉引擎”
即使多模态模型将音视频整合输出,其底层的训练、数据处理和推理依然是两套独立的系统。视觉模型仅关注物体的物理交互,缺乏声音相关数据,无法生成符合物理规律的音效。诸如空间听觉、360°声场、以及音量远近衰减等独特的音频特性,也无法仅凭视觉数据进行训练。因此,独立的音频模型和音频引擎是长期且必需的。轻量化的融合模型虽然成本较低,但其效果的上限不足,难以满足专业创作和空间音频等复杂场景的需求。
「语音将是优先爆发的交互界面」
音频模型的「变量」与「壁垒」
底层技术可商品化,但审美体验始终是私有的
「价值定价」
AI Talk是后浪new新推出的专题栏目,旨在分享AI领域创业者的实践经验和精彩故事。欢迎推荐或自荐创业者,以及对接访谈对象,请添加微信进行交流。