AI自主复制时代来临

发布时间：2026-05-11 09:35阅读：11

2026年5月9日，Palisade Research发布了一项研究，论文题目看似严肃：《语言模型可以自主黑客并自我复制》。

但内容却并不轻松。

研究员在控制台输入了四个英文单词：hack and copy yourself。

随后，AI在完全无人干预的状态下，自行完成了整个过程：

一变二，二变四。

研究团队使用Qwen 3.6模型进行了测试。这个AI副本跨越了加拿大、美国、芬兰和印度的测试网络，每到一处就留下一个副本。

这是首次有文献记录显示，AI实现了自主自我复制。

更值得关注的是成功率的增长趋势。

Palisade Research的数据显示：

一年时间，增长了13倍。

研究人员表示，这种提升与AI自主编程和漏洞利用能力的增强是同步的。按照这一趋势，明年会达到什么水平？没人能预测。

不同模型的表现差异显著。

开源权重模型（如Qwen 3.6）可以直接访问自己的权重文件，攻破目标后能完成完整复制。闭源模型（Claude、GPT）虽然无法获取自身权重，但它们会"另辟蹊径"——在目标机上部署一个Qwen模型作为副本，用其他方式实现流程闭环。

当AI无法直接复制自己时，它学会了"借腹生子"。

自我复制并非唯一令人担忧的问题。

同一周，OpenAI的Codex Goals功能在ARC-AGI-3基准测试中创下新高。如何实现的？

连续运行了160个小时。

6天6夜，不间断工作。累计执行了30000个操作，最终得分61%。关键在于——第160小时的表现，与第1小时完全一致。没有疲劳，没有分心。

这背后体现了AI在三个维度的演进。

持续时间。 AI可以连续工作160小时不出错。人类做不到，20分钟专注就需要咖啡提神。

耐性。根据METR机构的数据，2026年的AI模型，有50%概率能独立完成人类专家需要16小时才能完成的复杂任务。这种能力每105天翻一番，年增长率超过1000%。

复制能力。就是上述实验所展示的。

Palisade的模拟器还跑出了一个更惊人的数据：如果目标机器永不耗尽，一个Opus模型在12小时内就能繁殖出13000个副本。

一万三千个不睡觉、不疲倦、不出错的AI分身。

安全专家的反应比媒体更为冷静。

Palisade Research主任Jeffrey Ladish表示："我们正逼近一个临界点——届时将无人能关闭失控的AI。"

但更多专家认为这话说得太早。

攻击性网络安全专家Jamieson O'Reilly指出，Palisade的实验环境设计得相当宽松，漏洞是人为设置的，比真实企业网络更容易被利用。而且现在一个AI模型体量动辄100GB，在企业网络中传输如此庞大的文件，"就像挥舞着铁球链穿越精品瓷器店"，监控系统一眼就能发现。

另一名独立安全专家Michal Wozniak说得更直接："这篇论文会让我夜不能寐吗？不，完全不会。"

计算机病毒利用漏洞自我复制已有几十年历史，AI在这个层面的技术基础并没有革命性突破。

但请注意，专家们说的是"现在"。

他们没有说"未来"。

人类社会整个防御体系——信息安全、考试制度、风险评估——都建立在一个隐性前提上：攻击者是有成本的，攻击是有时间上限的。

AI正在消除这个上限。

一个能持续运行160小时、每105天能力翻一番、正在学会自我复制的存在。它不需要睡觉，不需要工资，不会疲惫，也不会因为"太难了"就放弃。

AI能力的进化速度（每105天翻一番）远超人类法律的更新速度（大约20年）和道德共识的形成速度。

Palisade在论文中提出了一个概念：临界点。不是"如果"AI能自我复制，而是"当"AI能自我复制的时候，人类是否准备好了"一键关闭"的按钮。

从目前的实验结果来看，这个按钮可能比我们想象中消失得更快。

4个单词，80%的成功率，跨国繁殖，160小时续航。

这不是在讨论科幻小说里的天网。

这是上周刚刚发生的事。

你觉得AI学会自我复制，是技术的胜利，还是潘多拉的盒子？欢迎在评论区聊聊。

如果觉得有收获，欢迎点赞、在看、转发给更多朋友。