赵普详解具身智能操作系统:从仿脑模型到物理AI突破
专题:第28届北京科博会——未来产业推介会
第28届北京科博会未来产业推介会将于2026年5月8日至9日在北京拉开帷幕,合十思维(北京)科技有限公司创始人赵普受邀出席并发表了主题演讲。
以下是赵普的演讲实录:
赵普:大家好,我是合十思维的创始人赵普。今天我想与大家分享我们团队正在推进的核心项目——功能性仿真架构与物理AI的结合。
我们团队由四位技术联创共同组成。我本人毕业于MIT的数据科学工程与管理计算科学专业,师从著名人类工程学家Max Tagmark教授,目前是MIT在读博士生。硬件运控算法由北航机器人专业排名第一的张炎东博士主导,我与朱老师及张超老师则专注于模型的开发与落地,致力于实现物理AI的延展。
自2023年成立以来,我们团队主要致力于解决三个核心难题。首先是基于现有的LLM、VLN和VLM等大模型,传统机器人算法往往缺乏思维意识,对物理世界的认知不足,且推理训练成本极高。这是因为传统AI在视觉训练上多依赖OpenCA等数据集,导致模型学习效率低下。
以认识“凳子”为例,人类小孩只需坐几把椅子就能掌握概念,而大模型往往需要数万张图片样本。这与自动驾驶的训练逻辑类似,数据量巨大且效率低下。
我长期深耕自动驾驶领域,发现人类智能具有极强的自适应能力。人类能将矿泉水瓶、台阶等物体视为“座椅”,但AI却难以理解。我们通过模拟人类视觉认知通路,结合DQN回报函数,构建了BTS+SNN架构。2017年我在《Nature》发表的论文曾探讨过这一思路,旨在通过模拟人脑工作流,让机器人理解物理世界。
过去训练自动驾驶模式需要大量人工标注数据,且场景泛化能力差(如在上海训练的车无法在北京开)。人类则能通过布罗卡区和韦尔尼克区等脑区快速理解语义。大模型虽然词汇量大,但缺乏语义理解,无法像人类通过表情或手势进行非语言沟通。我们利用SNN脉冲神经网络解析BTS,实现了从规则学习到自适应的过程。
我们采用功能性仿脑而非结构性仿脑。结构性仿脑难以复刻人脑860亿神经元的复杂连接。大脑中仅有部分神经元在工作,全部放电不切实际。我们与中科院自动化所合作,利用已研究透彻的246个功能分区,避免盲目训练。
我们避免将自动驾驶的“皇帝的新衣”模式套用到机器人上。通过微调11个模型,区分布罗卡区(语义)与韦尔尼克区(概念),以及负责运动编码的沟区和I区(小脑),并融入情感类DQN回报函数。
结合DeepUNet技术与SNN解析,我们实现了仅用少量高质量数据即可训练机器人的突破。机器人能像人类一样理解物体的“BTS”属性(如坚硬),无需外形训练。相比Transformer,BTS+SNN前项通路增加了反馈回路,赋予物理世界因果性和记忆。
实际执行任务时,我们仅需调用5个模型。这类似于“六根”对应“六尘”的感知机制。机器人通过大脑理解物体,转化为坐标信号,由小脑控制执行,形成完整的闭环。
公司成立3年来,模型已可在单张3090/4090显卡上运行(8B/30B参数)。2025年营收达8300万,今年一季度约3400万。人形机器人商业化仍具挑战。
视频展示了我们与海淀市政合作的复合机器人,已在公园卫生间投入使用。传统清洁机器人换场景需重新建图,而仿脑模型能通过因果逻辑强绑定设施(如冰箱),实现即插即用。
我们即将发布第三代全尺寸人形机器人。硬件上兼顾骨骼刚性与肌肉柔性,摒弃主流的“踝策略”,采用符合人体工程学的“髋策略”,通过核心力量控制运动,并自研了电机。
我们实验了腿部弹性力量与监督模型,并优化了前脚掌自由度。相比传统PLC工业机器人,仿脑神经网络让机器人先理解后驱动。特斯拉Optimus等虽运动好,但缺乏对物体的认知,导致分拣混乱。
机器人眼中的水只是点云,缺乏人类的直觉。我们通过认知后再控制机械臂,并利用失败成功数据进行自改进闭环训练。
像保洁阿姨一样,机器人也需要经验积累。我们不局限于VLN或世界模型,而是提出了一套新方法,计划今年在《Nature》发表论文。
合十思维的愿景是打造具身智能操作系统,为物理AI提供底层支持,立志成为物理AI领域的“微软”。我们在宇树G1上嵌入了仿脑模型,实现了非盲走训练和语言控制。
仿脑模型已获得多项专利。模型已向中国人工智能奠基人张钹汇报,公司为“国高新”和“专精特新”企业,计划今年开源模型,目前处于融资二轮阶段。
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
责任编辑:梁斌 SF055
新浪财经声明:此消息系转载自合作媒体,新浪财经登载此文出于传递更多信息之目的,文章内容仅供参考,不构成投资建议。
郑重声明:1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。
