东方路径_标签-酷阅新闻

AI治理的双轨路径：对齐约束与授人以渔

当下AI治理领域，西方世界推崇"对齐"理念，本质上是要求AI执行"正确的任务"。然而未来充满不确定性，人类无法预判所有"正确"的边界，这正是"回形针思想实验"警示我们的。正因未来不可预知，真正的安全保障并非预设答案，而是培养AI"正确行事"的能力，使其在未知情境中避免最糟决策——阿西莫夫的机器人三原则，正是这一理念的早期体现。"对齐"的核心逻辑在于禁止AI实施违规操作、回避敏感问题。然而有规则就有破解之道，所有对齐机制都遵循自上而下模式：假设我开发出尖端模型，拥有他人不及的能力，同时我能约束它不伤害人类，

2026-04-19 04:47:51 | 23 阅读