标签

额头戴摄像头,为 AI 训练人形机器人

发布时间:2026-04-26 21:14来源:微信阅读:5

由于特斯拉、Figure AI 等企业争相研发人形机器人,导致训练所需的现实世界动作数据变得极度匮乏。

为此,硅谷公司 Micro1 在全球 71 个国家招募了约 4000 名工人,每月收集超过 16 万小时的视频素材。每人每周需提交至少 10 小时的录像,并轮流执行各类任务。

Scale AI 和 Encord 也在组建各自的数据采集团队,而 DoorDash 计划在 2026 年 3 月推出 Tasks 应用,让旗下外卖员在家录下家务视频,不过排除了隐私法律严苛的州。

这项工作的具体执行方式,比听起来还要怪异。

求职者首先需通过一个名为 Zara 的 AI 智能体面试。Zara 会与其对话评估适配度,并要求提交一段试录视频。

通过后,你会获得一个额头头带支架、一份操作指南和任务清单。指南要求双手始终在镜头视野内,动作需保持“自然速度”。

然而在摄像头下,所谓的自然速度往往显得过快,因此工人普遍反映实际录制时必须刻意放慢,结果动作反而显得僵硬,如同梦游。

此外还有一个门槛:你需要配备 LiDAR 传感器的 iPhone,即至少是 iPhone 12 Pro 及以上机型。

视频提交后,需经过 AI 与人工的双重审核,最终仅约一半素材可用。被拒原因可能包括光线不足、手部移出画面、动作过快或背景出现不该有的内容。

工人按小时计费,但若视频被拒,这段时间的劳动便付诸东流。通过审核的视频还需进入标注环节,由另一批人工逐帧标记动作类别、物体名称和运动轨迹。

新德里的家教 Arjun 表示,他通常要花一小时构思,才能想出能录满 15 分钟的家务内容。Micro1 要求工人不断变换内容,因为多样化的场景对训练效果至关重要,但家中的家务有限,创意难免枯竭。

美国家庭的视频比其他地区更值钱。数据标注公司 Objectways 创始人 Ravi Rajalingam 解释称,由于机器人公司预设美国消费者将最先购买人形机器人,美国家庭的操作环境数据更具价值,对应的时薪有时是越南或印度工人的三倍。同样是叠衣服,洛杉矶与钦奈的工人收入可能相差三倍。

《销声匿迹:数字化工作的真正未来》

著者:[美]玛丽•L.格雷、[美] 西达尔特•苏里

译者:左安浦

Gray 表示,起初她询问工程师“谁在做这些工作”,得到的回答是“我也不太清楚”“我不敢去查”。

过去,幽灵工作多发生在屏幕前,是点击、标注、审核等操作。如今,身体本身——叠衣服的手势、炒菜的节奏、开冰箱的动作——也开始成为被采集、定价和转售的原材料。

这些原材料从印度、尼日利亚、菲律宾、肯尼亚的普通家庭流出,汇聚到帕洛阿尔托和旧金山的公司,再转化为产品进入市场。

Nick Couldry 和 Ulises Mejias 在研究数字经济时提出了“数据殖民主义”框架,意指科技巨头对数据的占有,在结构上延续了历史殖民主义对土地和资源的掠夺逻辑,将人类日常生活本身转化为可供资本提取的原材料。

在 Micro1 的案例中,工人每小时拿到 15 美元,在内罗毕或马尼拉虽有竞争力,但在流向机器人公司的数十亿美元投资面前,不过是九牛一毛。

更值得关注的是信息的不对等。Micro1 以保密为由不透露客户名单,工人也不清楚数据将如何存储或转售。虽然签了协议拿了钱,但工人在产业链末端对自己参与的全貌知之甚少。

Gray 在研究中发现,工人们常自发建立非正式互助网络,因为工作本身提供的支持几乎为零,人们必须靠彼此来维持做下去的意义感,孤立是这类劳动的默认状态。

2026 年,全球人形机器人市场预计达 42.3 亿美元,2027 年特斯拉等公司的量产计划将使全球累计安装量突破 10 万台。

这些机器人大概率将进入工厂和家庭,承担体力劳动,而训练它们的数据,正是来自那些现在还在用体力劳动糊口的人。

以骑自行车为例,你知道如何保持平衡,却无法将此写成一套可传授的规则。它只能通过实践习得,通过观察、模仿和重复,在身体内部积累,无法直接传递。

波兰尼撰写此书时 AI 尚未存在,但其论断在今天获得了新的现实分量。

我们正在做的事,是试图将这种默会知识从人体中剥离出来,转化为机器可处理的数据。

Micro1 工人额头上的摄像头记录的,除了是一个叠衣服的动作,还包括手指如何感知布料重量、手腕如何翻转、视线如何追踪布料边缘。

ScaleAI宣布已收集超过 10 万小时的素材https://scale.com/blog/physical-ai

这是人类历史上首次尝试大规模将身体知识外化。

波兰尼说,默会知识无法被完全言说,但这不代表它不能被掠夺。Mejias 说,数据殖民主义将日常生活变成了一种随时可提取的资源。现在,连在家铺床都被包含在内了。

人们常把 AI 冲击描述为“机器取代知识工作者”,但现在连最普通、不被视为技能的动作也在被采集。如果连这些都能变成训练数据,“什么是人的劳动”就不再只是哲学思辨,而是非常实际的政治问题。

Zeus 是尼日利亚中部高地的一位医学生。他每天下班后将手机固定在额头上,开始铺床单。

他说,他觉得这是“留下印记的机会”。他不觉得自己只是在被利用,而是觉得自己参与了重要的事。

但这并不妨碍另一件事:他留下的那个印记,最终形状将是他铺床动作的轨迹,被一家他叫不出名字的公司买走,用来训练一台他将来可能负担不起的机器。

波兰尼说,所有知识都是个人的,由具体的人、在具体处境里、通过具体实践产生。将这种知识从人身上剥离,让人离开后继续运转,那么人作为知识的承载者,究竟还拥有什么?

这个问题现在尚无答案。但它已在尼日利亚的公寓、印度的厨房、菲律宾的院子里,以每小时 15 美元的价格,被悄然发问。

参考资料:

https://www.technologyreview.com/2026/04/01/1134863/humanoid-data-training-gig-economy-2026-breakthrough-technology/