标签

阿里豪掷2.9亿美元,深耕下一代AI“世界模型”

发布时间:2026-04-13 11:15来源:微信阅读:6

随着大语言模型(LLM)的短板日益凸显,全球AI竞争的焦点正从“生成文本”向“复刻现实世界”转移。

4月10日报道,阿里巴巴领投了视频生成工具Vidu的开发商生数科技B轮,金额达20亿人民币(约2.9亿美元)。这笔巨资表明科技巨头正全力押注“世界模型”,试图构建一种能更精准复制现实的新型AI。

本轮融资由阿里巴巴牵头,好未来教育和百度风投也参与其中。

这是生数科技在两个月内完成的第二次大额融资,此前在启明创投等支持下已获6亿元。尽管未透露最新估值,但连续的注资显示出市场对该技术路线的高度认可。

此次投资逻辑在于行业对当前主流AI路线的深度反思。过去几年,以ChatGPT为代表的文本训练大模型虽主导市场,但随着应用深入,开发者发现仅靠文本难以让AI真正掌握复杂物理规律。

生数科技认为,“基于视觉、听觉和触觉等多模态数据构建的通用世界模型,比大模型更能自然地捕捉物理世界的运行机制,”这家成立三年的初创公司在声明中阐述了其技术构想。

生数科技创始人朱军补充:“我们的目标是连接感知与行动。”他希望通过这种新型模型,让AI系统能更好地模拟和预测现实行为,从而打破数字与物理世界的壁垒。

据AI分析机构数据,生数科技1月发布的Vidu Q3 Pro,在文生视频模型中已位列全球前十。这一技术实力也是吸引阿里巴巴入局的核心。

实际上,阿里在“世界模型”领域的布局早已展开。作为电商起家的巨头,阿里不仅2月推出了驱动机器人的模型,还发布了视频生成的免费开源AI模型。

除生数科技外,阿里近期还领投了PixVerse的6000万美元融资。PixVerse早前发布了AI世界模型,允许用户精准控制视频展开。与此同时,百度和百度风投领投了Tripo AI的5000万美元,后者致力于利用AI从照片快速生成3D模型,明确表示要摒弃语言模型技术,转向基于物理空间的AI开发。

这轮投资热潮背后,是全球科技界对AI下一形态的共识。《连线》联合创始人凯文·凯利上月撰文指出,世界模型对机器人技术至关重要,因机器人技术所需不仅是LLM。

凯利表示:“最终,要复制人类智能,AI需具备三个要素:推理能力、物理世界理解及持续学习。”他强调,虽聊天机器人已构建知识,但“世界模型是亟需突破的关键领域”。

激烈的市场竞争中,中国科技企业正试图通过“世界模型”实现赶超。在OpenAI下线视频生成模型Sora后,字节跳动、快手等多家公司纷纷推出同类AI视频生成工具。

生数科技透露,公司已与多家具身智能公司建立合作关系。这些合作旨在将AI技术应用于人形机器人等系统,服务于工业、商业及家庭环境。