标签

腾讯开源混元世界模型2.0,一句话即可打造3D游戏雏形

发布时间:2026-04-16 12:53来源:新浪新闻阅读:4

腾讯今日宣布正式对外开放混元3D世界模型2.0(HY-World 2.0)。该模型具备多模态理解能力,可处理文本、图像、视频等多种输入形式,自主构建、还原及仿真三维场景,并支持Mesh、3DGS、点云等多类型3D资源输出,能与主流游戏开发管线顺畅衔接,助力快速搭建游戏地图与关卡雏形。

与谷歌Genie 3及混元1.5版本仅支持视频输出不同,新版模型实用性大幅跃升:可直接产出可再编辑的三维资源文件,这些资产能无缝接入游戏开发或仿真模拟平台,达成真正可交互、可应用的目标。

目前,该模型已在腾讯混元3D创作引擎官方网站上线,用户可提交申请体验。

混元世界模型2.0兼容文本、图像、视频多元输入。用户只需提供文字描述或单张图片,系统便能精确理解深层语义,瞬间创建可自由探索的多样化三维场景。相较前代,2.0版本架构全面革新,画质细节与真实感显著增强。用户可按需求定制写实、动漫、游戏等不同风格的三维环境。创作完成后,资源可导入Unity、UE等引擎深度加工,极大缩减了游戏地图制作难度。

该模型还提供角色操控功能,使用者可指挥虚拟人物在建筑、街道、场景中任意穿行,不受时间限制,且具备真实物理碰撞效果,仿若置身真实游戏。此外,2.0版本可还原现实三维场景,只需提供实拍视频或多角度照片,即可重建高精度数字孪生体。依托升级的WorldMirror 2.0框架,系统支持任意分辨率图像与视频输入,可同步预测稠密点云、多视角深度图、表面法线及相机参数,实现一次性生成、永久复用。未来,家居设计预览、城市规划设计、文化遗产数字化等领域均可借助此项能力实现高效构建与复原。

混元世界模型2.0聚焦三维技术主轴,通过整合空间理解、生成与重建的统一框架,达到业界顶尖的生成水准。相较其他世界模型,在场景完整性(物体侧背面细节)及输入图像还原准确度方面表现更为出色。混元采用的3DGS与Mesh混合表示方式,更让用户得以激活角色模式,体验具备真实物体碰撞的沉浸式交互。