标签

MIT新研 | 人工智能能否帮你找回遗失的钥匙?

发布时间:2026-06-28 04:21阅读:2

各位同学大家好,欢迎来到芸升教育前沿 AI 科普课堂。

今天我们聚焦一篇来自世界顶尖理工名校麻省理工 MIT 的最新官方科研报道,这篇研究在 2026年6月17日由 MIT News 正式对外发布,解决了长久以来机器人领域一个非常贴近我们生活的难题 —— 机器人不会 “记路、记东西”。

先问大家一个生活里最简单的问题:你出门忘带钥匙,回到家能清楚回忆钥匙放在书桌抽屉;工厂里的工人下班前没组装完零件,第二天一上班,立刻能找到存放半成品的货架。

人类天生拥有时空空间记忆,能把物体、地点、时间绑定在一起记住。

但过去的机器人完全做不到。就算它刚刚见过零件、自行车、雕塑,只要离开一小会儿,你口头问它东西在哪,它根本无法理解、无法定位。人机协同存在巨大鸿沟,而 MIT 这支科研团队推出的全新系统 DAAAM,彻底补上了机器人的 “记忆大脑”。

一、先搞懂:之前的机器人技术,为什么存不住完整记忆?

MIT 科研团队指出,过去两大主流技术各有短板,没法结合:

第一种是多模态视觉 AI,擅长拍照识别物体,能描述 “红色爆胎自行车”“校园雕塑”,但一次只能标注少量物品,不能覆盖整片大型空间;

第二种是机器人三维建图技术,可以构建整栋教学楼、整片工厂的 3D 地图,但只有几何轮廓,没有文字描述,运算量巨大,实时运行卡顿。

两者割裂,机器人只能 “看当下”,不能 “回忆过去”,自然听不懂人类自然语言指令。

MIT 航空航天系副教授、信息与决策系统实验室 LIDS 首席研究员、SPARK 实验室主任 Luca Carlone,也是本次项目核心负责人,他提出一个核心观点:想要机器人和人类并肩工作,必须让机器人和人类拥有相同的时空推理逻辑,能听懂人类语言、用语言调取空间信息。

DAAAM 的核心目标,就是把冰冷的三维几何地图,升级成一套带文字描述、语言可检索的语义记忆地图。

二、核心技术 DAAAM:全称 Describe Anything, Anywhere, Anytime, at Any Moment

这套全新机器人长期记忆框架,融合计算机视觉与机器人建图两大方向优势,我们拆解它两大核心创新:

第一,机器人自主巡游环境,自动给所有物体贴上精细化文字标签。

举个论文里真实的例子:机器人在 MIT 校园行走,会自动记录斯塔塔中心的建筑风格;车棚里五辆单车会区分标注 —— 直把手黑色自行车、浅蓝车架自行车、爆胎红色自行车。所有文字描述绑定 3D 空间坐标,按区域分类存储,机器人能精准记住 “爆胎红车就在斯塔塔中心外车棚”。

传统同类技术标注几个物品就要耗费数秒,机器人行走几分钟会看到上百件物体,完全无法实时使用。而 DAAAM 做了效率革新:自动聚集附近物体,筛选画面清晰的关键帧并行标注,计算速度直接提升十倍;同时每个物体只标注一次,哪怕是大型厂区、整片校园这种超大场景,也能实时稳定运行。

第二,搭配大语言模型,实现自然语言快速检索,大幅减少 AI “胡说八道” 的幻觉问题。

系统建好完整空间记忆库后,用户只用大白话提问,几秒就能给出精准答案。比如你输入关键词 “雕塑”,机器人会立刻检索校园里所有艺术品;如果你询问某栋建筑旁的雕塑,系统会同时结合文字语义、空间位置双重检索定位。

团队实测对比当下全球顶尖算法,根据提问类型不同,DAAAM 的识别、检索准确率提升 21% 至 53%,速度、精度双双突破行业上限。

三、这项技术能用到哪里?覆盖我们未来生活方方面面

这项时空记忆框架绝不只是实验室成果,落地场景非常广泛:

智能制造工厂:工人只需要口头说一句 “把昨晚没组装完的零件取过来”,机器人就能凭借记忆自主找到物料存放区,替代大量重复人工搬运;

AR 设备工业运维:帮助检修工人记忆设备故障点位,快速识别设备异常;

日常出行导航:辅助我们记住随身物品、地标位置,回答 “我的钥匙落在哪” 这类生活化问题;

家用通用机器人:未来听懂 “去客厅拿零食”“找回阳台的钱包” 这类模糊口语指令,真正走进家庭。

四、权威科研信息:团队、会议、资金与行业认可

研究第一作者:MIT 在读博士生 Nicolas Gorlo;

合作研究者:前 MIT 科研科学家、现德国纽伦堡工业大学 Lukas Schmid;

指导教授 Luca Carlone;

成果发布:论文在国际顶会 CVPR(计算机视觉与模式识别大会)公开宣讲;

项目资助:美国陆军研究实验室、美国海军研究办公室;

所属实验室与院系:MIT SPARK 实验室、信息与决策系统实验室 LIDS、MIT 苏世ordo计算学院、工程学院航空航天系、电子工程与计算机科学 EECS。

团队还公布了后续两大研发计划:第一,拓展记忆能力,让机器人完整记录环境里发生的完整事件,不止记住静态物品;第二,给每一条回答增加置信度,让机器人告诉人类这条记忆的可靠程度。

论文一作 Nicolas Gorlo 表示:我们的终极目标是打造通用全能智能机器人,而 DAAAM 空间记忆系统,就是实现这一切最关键的底层基础。

五、芸升教育科普总结:对我们学生有什么启发?

听完整套研究,很多同学会好奇,这项前沿技术和我们日常学习、科创竞赛、海外理工科升学有什么关系?

当下计算机视觉、机器人感知、大模型工具调用、三维语义建图,是人工智能、自动化、计算机、航空航天专业最热门交叉方向,也是各类科创比赛、海外本科研究生申请的优质选题。

MIT 作为全球 AI、机器人领域标杆院校,每一篇官方新闻都代表行业未来发展方向。芸升教育会持续同步 MIT、斯坦福、剑桥等名校一手前沿科研!

带大家拆解顶会论文、设计科创项目、梳理理工科留学科研规划,帮助大家紧跟全球人工智能创新浪潮。