AI模仿人类思维反而更强大?
戳👆职场 > 点右上角 … > 设为星标🌟
通常人们觉得,机器运算应该比人脑更冷静客观。但最新研究却表明,适当加入人类的“思维定式”,反而能让AI既聪明又省钱。
目前,大模型完成初步训练后,还需经过“价值观对齐”这一环节,通过持续反馈来调整输出,让模型更可靠、更精确、更贴近人类期望。行业内主流的对齐策略主要有两种:一种是依赖固定数据集的“批量对齐”,开销较小;另一种是模型在产出内容的同时接收反馈的“持续对齐”,效果更佳,但算力消耗巨大。
研究者发现,持续对齐之所以效果更突出,一个核心因素是它无意中复制了人脑的思维特点。人类并不能完全客观地看待概率。基于这一洞察,他们开发出了一种低成本模拟持续训练成效的方案。该方案包含两个关键改进:第一,不再拿“历史版本”作为固定基准,而是动态更新参照模型,使其紧随当前水平;第二,采用“非均匀限制”策略,对模型调整概率的范围进行差异化约束,赋予特定结果更高权重,从而模拟人类对概率的主观感受。
实验数据表明,传统持续训练通常比批量训练强30%—60%。但引入人类的“思维特点”后,批量方法不仅能逼近持续训练的表现,部分情况下训练效率还提高了6倍有余。这预示着未来AI训练未必需要持续投入天价算力,通过深入研究人类认知原理,模型或许能以更低成本实现更高性能。这可能让更多企业能够利用自身数据定制和优化专属AI模型,而不再只有少数大型企业才能负担高昂的训练费用。
作者芝加哥大学布斯商学院特约撰稿人Monika Brown