标签

AI的道德素养可经后天习得?OpenAI实验揭示反直觉结论

这并非源于他曾接受"经商需诚信"的专项培训,而是诚信已内化为他的核心品格,融入其处理各类事务的行为模式中。OpenAI于2026年6月18日发表的这项研究,正是探索这一命题——只不过研究对象是人工智能。该研究题为《强化学习通向广泛且持久的有益模型》(Reinforcement Learning Towards Broadly and Persistently Beneficial Models)。研究团队聚焦的核心命题在于:能否借助强化学习(RL)为AI构建"核心品格",使其在从未遭遇的情境中依旧保持诚实

2026-06-20 07:08:40  |  2 阅读