智谱推出多模态编程模型GLM-5V-Turbo,强化视觉与代码能力
新浪科技讯4月2日上午消息,智谱推出了首个原生支持多模态的编程基础模型GLM-5V-Turbo,该模型将视觉和编程功能深度融合,能够处理文本、图片、视频等多种信息,并擅长编程、长期规划和操作执行等复杂任务。
据了解,GLM-5V-Turbo在多模态编程和Agent等关键基准上,以较小规模实现了领先表现。它不仅引入了视觉能力,还保持了纯文本编程和推理的同等水平。此外,它深度适配Claude Code和龙虾场景,使OpenClaw龙虾具备真正的视觉理解能力,能识别屏幕上的信息。
与传统纯文本编程模型不同,GLM-5V-Turbo可以直接理解和处理设计稿、网页截图、K线图表等视觉信息,并生成可运行的代码,提供“所见即所得”的AI编程体验。目前,该模型已通过智谱MaaS平台开放接入。(文猛)
责任编辑:杨赐
新浪财经声明:此消息转载自合作媒体,登载此文旨在传递更多信息,内容仅供参考,不构成投资建议。
郑重声明:1.根据《证券法》,禁止编造、传播虚假或误导性信息,扰乱证券市场;2.用户发表的所有资料、言论仅代表个人观点,与本网站立场无关,投资风险自行承担。