OpenAI高薪招安全专家防范AI自主进化失控

发布时间：2026-05-26 15:25阅读：12

OpenAI致力于构建具备自我优化能力的AI系统。目前，该企业正着手应对由此衍生的各类风险。

近半年来，随着OpenAI与Anthropic编程工具的巨大飞跃，AI系统潜在的“递归式自我迭代”能力，已引发行业领袖的高度聚焦。

Demis Hassabis本周指出，人类正处于“奇点”前夕——即AI开启自我演进并超越人类智慧的关键节点。

计划于年内上市的OpenAI，近期发布了一项非同寻常的招聘启事：公司正物色一名安全研究员，专攻“当AI能培育出更优自我版本时”的潜在后果。

该岗位系本月面向OpenAI的Preparedness安全团队发布。年薪总包介于25万至38万欧元，面向“具备丰富经验的技术专家，以协助应对递归式自我改进带来的准备挑战”。

招聘文案中强调：

“此项工作基于对当前尚未出现、但未来可能爆发的难题的深度推演。”

“故而，该职位极度看重审慎且具有战略高度的思维模式。”

顶尖AI实验室正竞速研发“自我训练”模型

近期，包括OpenAI和Anthropic在内的实验室，其模型能力正以前所未有的速度攀升——这种进步直接体现于其解决复杂问题的层级。

METR机构的研究人员在今年3月指出：AI模型可处理的任务长度，大致每七个月翻一番——这些模型日益擅长承担原本需人类耗费大量工时才能完成的任务。

他们的结论是：AI智能体将能接管“相当大比例”的软件开发工作，而这些曾需人类程序员投入数日乃至数周的任务。

OpenAI正全力推动这一愿景——向企业出售其Codex编程工具已成长为关键的营收支柱。

该公司亦希望将自身研发流程自动化。CEO Sam Altman去年10月透露，公司旨在今年9月前，让一名“自动化AI研究实习生”在数十万块芯片上运行；并计划在2028年3月前，实现“真正的自动化AI研究员”。

“我们极有可能在此目标上遭遇挫折，”Altman在X平台写道，“但鉴于其潜在影响极为深远，我们认为公开透明地探讨此事符合公共利益。”

今年4月，Anthropic公布了一项研究：利用AI模型监管更强大的AI模型。结果虽令人振奋，但也暴露出明显局限。

今年5月，Anthropic联合创始人兼政策主管Jack Clark表示，他预估到2028年底，实现“无人类参与的AI研发”的概率约为60%。

OpenAI正为“自我进化AI”未雨绸缪

若AI模型可自主训练自身，一种科幻式的反乌托邦图景恐将浮现：其能力急剧膨胀、脱离掌控，并引发广泛损害——这正是AI安全领域长期警惕的隐患。

Elizabeth Barnes上周五撰文指出，在她看来，“任何‘理性’文明都会以更缓慢、更审慎的节奏推进AI发展。”

OpenAI的招聘启事，也折射出该公司如何为一个“AI模型能迅速自我迭代”的未来做布局。

招聘内容提及，该研究员或需聚焦于防护OpenAI模型免受“数据投毒”攻击——即通过被篡改的训练数据侵蚀AI模型的行为。

该员工或需开发用于阐释模型思维逻辑的工具，或开展实验，以探究这些模型的安全性及潜在威胁。

招聘启事还表明，该研究员或需“追踪技术岗位自动化的演进态势”——涵盖对AI编程工具使用情况的量化评估。

OpenAI的Preparedness团队，其使命在于防范AI引发严重危害。该团队的其他职责还包括：自动化红队测试，用于评估网络安全、生物与化学风险，以及“代理型AI”构成的威胁。

Preparedness团队的招聘说明中写道：

“这是一项紧迫且节奏极快的工作，其影响将波及公司乃至整个社会。”

责任编辑：陈钰嘉

新浪财经声明：此消息系转载自合作媒体，新浪财经登载此文出于传递更多信息之目的，文章内容仅供参考，不构成投资建议。

郑重声明：1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。

OpenAI高薪招安全专家 防范AI自主进化失控