标签

美团开源原生多模态模型LongCat-Next

发布时间:2026-03-27 13:06来源:新浪新闻阅读:15

新浪科技讯 3月27日上午消息,美团正式发布并全面开源原生多模态大模型LongCat-Next,以及其核心组件——离散原生分辨率视觉分词器(dNaViT)。

这一模型突破了当下大模型“以语言为核心”的传统拼接式架构,把图像、语音和文本统一映射为同源离散Token。借助纯粹的“下一个Token预测”(Next Token Prediction,NTP)范式,LongCat-Next使视觉与语音真正成为AI的“原生语言”。

据悉,LongCat-Next完成了三项重要技术突破:其一是离散原生自回归架构(DiNA)全面打通模态边界;其二是离散原生分辨率视觉分词器(dNaViT)搭建视觉世界的“词表”;其三是语义对齐完备编码器,攻克了“离散化必然带来信息损失”的行业难题。

责任编辑:江钰涵

新浪财经声明:该消息转载自合作媒体,新浪财经刊载本文旨在传递更多信息,文章内容仅供参考,不构成投资建议。

郑重声明:1.依据《证券法》规定,严禁编造、传播虚假信息或误导性信息,扰乱证券市场;2.用户在本社区发布的全部资料、言论等仅代表个人观点,与本网站立场无关,也不构成对您的任何投资建议。用户应基于独立判断,自主决定证券投资并自行承担相应风险。