标签

AI简报:小米推出OmniVoice开源模型;阶跃星辰筹备上市:大模型产业资本融合加速

发布时间:2026-05-08 20:00来源:微信阅读:5

算力豹AI资讯

每日资讯

近期AI算力动态汇总

01

小米开源OmniVoice:AI语音迈向“全语种统一大模型”新时代

小米公司AI实验室正式推出并开源了多语言语音克隆系统OmniVoice,据称支持超过600种语言及方言,能在低资源小语种环境下达成高水准语音合成。不同于传统TTS系统所需的多模型、多阶段拼接方式,OmniVoice利用单一的Transformer架构,致力于通过一个统一模型实现文本到语音的直接生成。

(图片来源:IT之家)

技术突破的核心在于“利用小模型架构实现大规模语种泛化”。OmniVoice不仅摒弃了繁琐的系统预测及独立文本建模结构,还率先在非自回归TTS模型中融入大语言模型预训练参数,显著提升了理解模型在发音精准度、语言及语义连贯性方面的表现。这标志着AI语音系统正由“声音建模”向“理解语言的语音生成”转变。

就行业应用而言,多语种语音生成始终是AI商业化的关键阻碍。众多小语种训练数据匮乏,传统语音系统通常仅能覆盖主流语言,但OmniVoice即便在训练数据不足10小时的小语种情境下,依然能保证语音的可懂度与一致性。这将进一步降低跨境电商、智能客服、AI伴侣、数字人及全球化内容生产的多语种门槛。

尤为重要的是,OmniVoice已不再局限于“朗读文本”。它具备自定义音色、表情演绎、噪声过滤及发音纠错功能,表明AI语音的竞争焦点正由“能说”转向“类真人的表达”。伴随统一多语言模型能力的增强,未来AI语音有望逐步演变为多模态智能体的核心交互入口。

02

阶跃星辰筹备上市:国产大模型步入产业资本深度绑定期

国产大模型企业阶跃星辰传闻即将完成近25亿美元融资,且已落实股份制改造及红筹架构等事宜,市场普遍认为这是其赴港IPO的关键前兆。与以往AI公司主要依赖财务投资人不同,本轮融资的焦点在于大量产业链资本开始涉足大模型领域。

(图片来源:光华日报)

观察行业趋势,国内大模型公司正迈入新阶段。一方面,基础模型能力日趋同质化,单纯依赖参数规模和跑分已难以构建长期壁垒;另一方面,谁能率先打通芯片、启动、操作系统与AI代理生态,谁便更有希望构建商业闭环。阶跃星辰此次引入大规模硬件产业资本,实则是为了提前抢占“端侧AI”与“AI硬件入口”的先机。

与此同时,此次搭建红筹架构、引入香港投资管理有限公司等举措,也折射出国内AI企业正加速推进资本化与合规化进程。置身全球AI竞争的大环境下,大模型公司未来的较量不仅限于技术和算力,更将延伸至产业联盟、融资实力及生态整合速度的比拼。

我们以算力为纽带,持续追踪算力基础设施的动态,输出深度洞察,助力算力行业迈向算力自由。欢迎关注!