标签

OpenAI高薪招安全专家 防范AI自主进化失控

发布时间:2026-05-26 15:25来源:新浪新闻阅读:6

OpenAI致力于构建具备自我优化能力的AI系统。目前,该企业正着手应对由此衍生的各类风险。

近半年来,随着OpenAI与Anthropic编程工具的巨大飞跃,AI系统潜在的“递归式自我迭代”能力,已引发行业领袖的高度聚焦。

Demis Hassabis本周指出,人类正处于“奇点”前夕——即AI开启自我演进并超越人类智慧的关键节点。

计划于年内上市的OpenAI,近期发布了一项非同寻常的招聘启事:公司正物色一名安全研究员,专攻“当AI能培育出更优自我版本时”的潜在后果。

该岗位系本月面向OpenAI的Preparedness安全团队发布。年薪总包介于25万至38万欧元,面向“具备丰富经验的技术专家,以协助应对递归式自我改进带来的准备挑战”。

招聘文案中强调:

“此项工作基于对当前尚未出现、但未来可能爆发的难题的深度推演。”

“故而,该职位极度看重审慎且具有战略高度的思维模式。”

顶尖AI实验室正竞速研发“自我训练”模型

近期,包括OpenAI和Anthropic在内的实验室,其模型能力正以前所未有的速度攀升——这种进步直接体现于其解决复杂问题的层级。

METR机构的研究人员在今年3月指出:AI模型可处理的任务长度,大致每七个月翻一番——这些模型日益擅长承担原本需人类耗费大量工时才能完成的任务。

他们的结论是:AI智能体将能接管“相当大比例”的软件开发工作,而这些曾需人类程序员投入数日乃至数周的任务。

OpenAI正全力推动这一愿景——向企业出售其Codex编程工具已成长为关键的营收支柱。

该公司亦希望将自身研发流程自动化。CEO Sam Altman去年10月透露,公司旨在今年9月前,让一名“自动化AI研究实习生”在数十万块芯片上运行;并计划在2028年3月前,实现“真正的自动化AI研究员”。

“我们极有可能在此目标上遭遇挫折,”Altman在X平台写道,“但鉴于其潜在影响极为深远,我们认为公开透明地探讨此事符合公共利益。”

今年4月,Anthropic公布了一项研究:利用AI模型监管更强大的AI模型。结果虽令人振奋,但也暴露出明显局限。

今年5月,Anthropic联合创始人兼政策主管Jack Clark表示,他预估到2028年底,实现“无人类参与的AI研发”的概率约为60%。

OpenAI正为“自我进化AI”未雨绸缪

若AI模型可自主训练自身,一种科幻式的反乌托邦图景恐将浮现:其能力急剧膨胀、脱离掌控,并引发广泛损害——这正是AI安全领域长期警惕的隐患。

Elizabeth Barnes上周五撰文指出,在她看来,“任何‘理性’文明都会以更缓慢、更审慎的节奏推进AI发展。”

OpenAI的招聘启事,也折射出该公司如何为一个“AI模型能迅速自我迭代”的未来做布局。

招聘内容提及,该研究员或需聚焦于防护OpenAI模型免受“数据投毒”攻击——即通过被篡改的训练数据侵蚀AI模型的行为。

该员工或需开发用于阐释模型思维逻辑的工具,或开展实验,以探究这些模型的安全性及潜在威胁。

招聘启事还表明,该研究员或需“追踪技术岗位自动化的演进态势”——涵盖对AI编程工具使用情况的量化评估。

OpenAI的Preparedness团队,其使命在于防范AI引发严重危害。该团队的其他职责还包括:自动化红队测试,用于评估网络安全、生物与化学风险,以及“代理型AI”构成的威胁。

Preparedness团队的招聘说明中写道:

“这是一项紧迫且节奏极快的工作,其影响将波及公司乃至整个社会。”

责任编辑:陈钰嘉

新浪财经声明:此消息系转载自合作媒体,新浪财经登载此文出于传递更多信息之目的,文章内容仅供参考,不构成投资建议。

郑重声明:1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。