Noiz AI：清华字节背景团队，聚焦音频AI，获巨额投资

发布时间：2026-05-06 12:47阅读：10

AI投资，欢迎微信交流

Noiz AI是一家低调且注重实效的音频AI公司，由前Meta、字节跳动等知名企业员工，以及来自清华、北大、香港科技大学的精英校友共同创办。团队中大部分成员是年轻的00后，其中清华、北大的毕业生约占一半。

声音是理性的物理，也是感性的留白

不要音频盲盒，要闭环生产力

陈前：我们采取模型与产品双线发展的策略。

模型层面：已推出十余款全栈音频模型，包括可与Suno媲美的音乐生成模型，市面上稀缺的专业音效模型，以及能够根据视频内容自动生成配乐的Video-to-Music模型等，更新迭代速度极快，小版本最快可三天一次；

产品层面：我们正在构建一个一体化的音频创作工作室，使用户无需切换至其他剪辑软件进行二次编辑，即可直接完成音频的生成、剪辑、配乐以及多语言本地化等全套流程，广泛应用于短视频、短剧、电商配音、播客等主流应用场景。

为何AI需要专属的“听觉引擎”

即使多模态模型将音视频整合输出，其底层的训练、数据处理和推理依然是两套独立的系统。视觉模型仅关注物体的物理交互，缺乏声音相关数据，无法生成符合物理规律的音效。诸如空间听觉、360°声场、以及音量远近衰减等独特的音频特性，也无法仅凭视觉数据进行训练。因此，独立的音频模型和音频引擎是长期且必需的。轻量化的融合模型虽然成本较低，但其效果的上限不足，难以满足专业创作和空间音频等复杂场景的需求。

「语音将是优先爆发的交互界面」

音频模型的「变量」与「壁垒」

底层技术可商品化，但审美体验始终是私有的

「价值定价」

AI Talk是后浪new新推出的专题栏目，旨在分享AI领域创业者的实践经验和精彩故事。欢迎推荐或自荐创业者，以及对接访谈对象，请添加微信进行交流。

← 上一篇：AI就业威胁论遭质疑，技术人才需求逆势攀升下一篇：AI成本失控：Uber预算告急，OpenAI巨额算力支出曝光 →