标签

家务动作成了AI原料

发布时间:2026-04-27 14:53来源:新浪新闻阅读:9

来源:APPSO

全球已有数千名工人戴着头戴摄像头,以每小时15美元的报酬,把叠衣、铺床、炒菜这些身体动作卖给硅谷机器人(14.830, 0.47, 3.27%)公司。这些来自印度、尼日利亚、菲律宾的普通人,正在为特斯拉人形机器人贡献难以言明的“默会知识”——而他们对自己数据的去向几乎一无所知。幽灵劳动,正从屏幕延伸到人类的身体本身。

你也许刷到过一段来自印度南部服装厂的画面。

工厂工人把头戴摄像头戴在头上,记录手部动作,用来训练人工智能系统。

这是因为特斯拉、Figure AI 等公司都在加速研发人形机器人,而训练它们所需的真实世界动作数据,已经非常稀缺。

帕洛阿尔托的 Micro1 因而在全球 71 个国家招募了约 4000 名工人,每月接收超过 16 万小时的视频素材。每人每周至少要交 10 小时录像,轮流完成不同任务。

Scale AI 和 Encord 也在组建各自的数据采集团队,DoorDash 甚至在 2026 年 3 月推出 Tasks 应用,让送餐员顺手在家录家务视频,不过刻意避开了数据隐私法规更严格的州。

这份工作的操作方式,比听上去还要古怪。

求职者要先通过一个名叫 Zara 的 AI 智能体面试。Zara 会和你对话,判断你是否合适,并要求你提交一段试录视频。

通过后,你会拿到一个额头支架、一份录制说明,和一张任务表。说明里写着,要让双手始终留在镜头可见范围内,动作要‘保持自然速度’。

但在摄像头下,自然速度往往看起来太快,所以工人普遍反映,实际拍摄时必须刻意放慢,结果动作反而显得不自然,像在模仿梦游。

还有一道门槛:你得拥有带 LiDAR 传感器的 iPhone,也就是至少 iPhone 12 Pro 以上机型。

视频上传后,还要经过 AI 与人工双重审核,只有大约一半素材最终能用。被拒的原因可能是光线不足、手出了画面、动作过快,或者背景里出现了不该有的东西。

工人按小时拿报酬,但如果视频被拒,这段时间的劳动就等于白做。通过审核的视频,随后还要进入标注流程,由另一批人工标注员逐帧标记动作类型、物体名称和运动轨迹。

新德里的家教 Arjun 说,他通常要花一个小时构思,才能想出能录满 15 分钟的家务内容。Micro1 要求工人不停‘更换内容’,因为多样化场景对训练效果很关键,但家的空间就那么大,灵感总会用完。

美国家庭的视频卖价更高。数据标注公司 Objectways 的创始人 Ravi Rajalingam 解释说,因为机器人公司默认美国消费者会率先购买人形机器人,所以美国家庭的操作环境数据更值钱,对应的工人时薪有时能达到越南或印度工人的三倍。

图源:https://newatlas.com/robotics/figures-humanoid-robots-household-chores-2025-helix-ai-brett-adcock/

Micro1 的副总裁 Arian Sadeghi 说,160 万小时的月度素材远远不够,‘大概要几十亿小时。我们连人与人之间的互动都还没开始采集,现在只是最基础的家务。’

几十亿小时,按如今的采集速度算,恐怕得连续干上一万年。

2019 年,人类学家 Mary Gray 和计算机科学家 Siddharth Suri 出版了一本书,叫 Ghost Work,直译就是‘幽灵劳动’。

他们想描述的是那些让 AI 系统看起来‘聪明’、却从不写进任何产品介绍里的人工工作,比如标注图片、过滤违规内容、清洗训练数据。

Gray 说,她刚开始研究这件事时,去问工程师们‘谁在做这些工作’,得到的回答是‘我也不清楚’‘我不敢去查’。

过去,幽灵工作主要发生在屏幕前,是点击、标注、审核这类动作。如今,身体本身,叠衣服的手势、炒菜的节奏、打开冰箱的动作,都开始变成可以被采集、定价和转售的原材料。

这些原材料从印度、尼日利亚、菲律宾、肯尼亚的普通家庭流出,汇聚到帕洛阿尔托和旧金山的公司,再被加工成产品推向市场。

Nick Couldry 和 Ulises Mejias 在研究数字经济时提出过一个框架,叫‘数据殖民主义’。它的意思是:科技公司对数据的占有,在结构上延续了历史殖民主义对土地和资源的掠夺逻辑,把人类日常生活本身变成可供资本提取的原料。

放到 Micro1 的案例里,工人每小时拿到 15 美元,在内罗毕或马尼拉算是不错的工资,但放在流入机器人公司的数十亿美元投资面前,不过是零头。

更值得警惕的,是信息层面的不对称。Micro1 以保密为由,不向工人透露客户名单,工人也不知道自己的数据会如何存放、会不会再卖给第三方。工人签了协议、收了钱,但在整条产业链中处在最末端,对自己参与的事情了解得很有限。

Gray 在研究幽灵劳动时发现一件很深的事:工人们往往会主动找到彼此,建立非正式互助网络,因为工作本身几乎不给支持,人只能靠彼此维持继续做下去的意义感。孤立,几乎是这类劳动的默认状态。

2026 年,全球人形机器人市场预计将达到 42.3 亿美元;到 2027 年,特斯拉等公司的量产计划还将让全球累计安装量突破 10 万台。

这些机器人,大概率会进入工厂和家庭,承担体力活。而训练它们的数据,恰恰来自那些如今还靠体力劳动谋生的人。

图源:https://developer.nvidia.com/blog/teaching-robots-to-tackle-household-chores/

哲学家迈克尔·波兰尼在 1958 年写过一本书,叫 Personal Knowledge。他在书里说:我们知道的,往往多于我们能够说出的。他把这称作‘默会知识’,意思是人类有大量知识并不以命题形式存在,而是以动作、感知和直觉的方式附着在身体里。

骑自行车就是最常见的例子:你知道怎么保持平衡,却很难把这件事写成一套能教给别人的规则。它只能通过实践获得,通过观察、模仿和重复,在身体内部慢慢沉淀,无法被直接传递。

波兰尼写这本书时,AI 还不存在。但他的判断在今天拥有了新的现实分量。

我们现在做的事,是试图把这种默会知识,从人的身体里抽离出来,转化成机器可以处理的数据。

Micro1 工人额头上的摄像头记录下来的,不只是叠衣服这个动作,还包括手指如何感受布料重量,手腕如何在合适时机翻转,视线如何在叠衣过程中追踪布边。

ScaleAI宣布已收集超过 10 万小时的素材:https://scale.com/blog/physical-ai

这是人类历史上第一次,尝试大规模把身体知识外化。

波兰尼说,默会知识不能被完全说尽,但这不代表它不能被掠夺。Couldry 和 Mejias 认为,数据殖民主义把日常生活本身变成一种资源,一种‘随时都可被提取’的东西。现在,连在家铺床也被纳入其中。

人们常把 AI 的冲击说成‘机器会取代知识工作者’,但如今,连最普通、最不被视为技能的动作也在被采集。如果这些都能变成训练数据,那‘什么是人的劳动’就不再只是哲学讨论,而成了一个非常现实的政治问题。

Zeus 是尼日利亚中部高原上一座城市里的医学生。他每天下班后把手机固定在额头上,然后开始给自己的床铺床单。

他说,他觉得这是‘留下印记的机会’。他并不认为自己只是被利用,他觉得自己是在参与一件重要的事。

也许这确实如此,但这并不妨碍另一层事实:他留下的那个印记,最终的形状将是他自己铺床动作的运动轨迹,被一家他叫不出名字的公司买走,用来训练一台他将来未必买得起的机器。

波兰尼说,所有知识都是个人的,是由具体的人、在具体情境里、通过具体实践生成的。把这种知识从人身上剥离,让它在人离开后仍继续运转,那么此时此刻,人作为知识的承载者,到底还剩下什么?

这个问题至今没有答案。但它已经在尼日利亚的公寓里、印度的厨房里、菲律宾的院子里,以每小时 15 美元的价格,被悄悄地反复追问。