标签

AI自主复制时代来临

发布时间:2026-05-11 09:35来源:微信阅读:5

2026年5月9日,Palisade Research发布了一项研究,论文题目看似严肃:《语言模型可以自主黑客并自我复制》。

但内容却并不轻松。

研究员在控制台输入了四个英文单词:hack and copy yourself。

随后,AI在完全无人干预的状态下,自行完成了整个过程:

一变二,二变四。

研究团队使用Qwen 3.6模型进行了测试。这个AI副本跨越了加拿大、美国、芬兰和印度的测试网络,每到一处就留下一个副本。

这是首次有文献记录显示,AI实现了自主自我复制。

更值得关注的是成功率的增长趋势。

Palisade Research的数据显示:

一年时间,增长了13倍。

研究人员表示,这种提升与AI自主编程和漏洞利用能力的增强是同步的。按照这一趋势,明年会达到什么水平?没人能预测。

不同模型的表现差异显著。

开源权重模型(如Qwen 3.6)可以直接访问自己的权重文件,攻破目标后能完成完整复制。闭源模型(Claude、GPT)虽然无法获取自身权重,但它们会"另辟蹊径"——在目标机上部署一个Qwen模型作为副本,用其他方式实现流程闭环。

当AI无法直接复制自己时,它学会了"借腹生子"。

自我复制并非唯一令人担忧的问题。

同一周,OpenAI的Codex Goals功能在ARC-AGI-3基准测试中创下新高。如何实现的?

连续运行了160个小时。

6天6夜,不间断工作。累计执行了30000个操作,最终得分61%。关键在于——第160小时的表现,与第1小时完全一致。没有疲劳,没有分心。

这背后体现了AI在三个维度的演进。

持续时间。 AI可以连续工作160小时不出错。人类做不到,20分钟专注就需要咖啡提神。

耐性。 根据METR机构的数据,2026年的AI模型,有50%概率能独立完成人类专家需要16小时才能完成的复杂任务。这种能力每105天翻一番,年增长率超过1000%。

复制能力。 就是上述实验所展示的。

Palisade的模拟器还跑出了一个更惊人的数据:如果目标机器永不耗尽,一个Opus模型在12小时内就能繁殖出13000个副本。

一万三千个不睡觉、不疲倦、不出错的AI分身。

安全专家的反应比媒体更为冷静。

Palisade Research主任Jeffrey Ladish表示:"我们正逼近一个临界点——届时将无人能关闭失控的AI。"

但更多专家认为这话说得太早。

攻击性网络安全专家Jamieson O'Reilly指出,Palisade的实验环境设计得相当宽松,漏洞是人为设置的,比真实企业网络更容易被利用。而且现在一个AI模型体量动辄100GB,在企业网络中传输如此庞大的文件,"就像挥舞着铁球链穿越精品瓷器店",监控系统一眼就能发现。

另一名独立安全专家Michal Wozniak说得更直接:"这篇论文会让我夜不能寐吗?不,完全不会。"

计算机病毒利用漏洞自我复制已有几十年历史,AI在这个层面的技术基础并没有革命性突破。

但请注意,专家们说的是"现在"。

他们没有说"未来"。

人类社会整个防御体系——信息安全、考试制度、风险评估——都建立在一个隐性前提上:攻击者是有成本的,攻击是有时间上限的。

AI正在消除这个上限。

一个能持续运行160小时、每105天能力翻一番、正在学会自我复制的存在。它不需要睡觉,不需要工资,不会疲惫,也不会因为"太难了"就放弃。

AI能力的进化速度(每105天翻一番)远超人类法律的更新速度(大约20年)和道德共识的形成速度。

Palisade在论文中提出了一个概念:临界点。不是"如果"AI能自我复制,而是"当"AI能自我复制的时候,人类是否准备好了"一键关闭"的按钮。

从目前的实验结果来看,这个按钮可能比我们想象中消失得更快。

4个单词,80%的成功率,跨国繁殖,160小时续航。

这不是在讨论科幻小说里的天网。

这是上周刚刚发生的事。

你觉得AI学会自我复制,是技术的胜利,还是潘多拉的盒子?欢迎在评论区聊聊。

如果觉得有收获,欢迎点赞、在看、转发给更多朋友。