剑桥研究报告:AI论文评审准确率仅65% 暴露核心问题
AI阅卷准确率最高仅达六成多?牛津大学OpRaise研究团队近期公布的一份报告,正在国际学术界激起广泛讨论。这份针对大语言模型在学术论文评审中应用效能的系统测评,揭露了现有AI评审体系存在的根本性问题,也让AIGC技术在学术评价范畴的适用性再次成为焦点话题。坦率地讲,看到这份研究报告的数据时,我的第一反应是意外。不是意外于AI做不到,而是意外于差距如此悬殊。在多数人的认知里,大语言模型已能够撰写文章、编写代码、进行翻译,审阅一篇学术论文理应不在话下?事实恰恰相反。研究团队让多个主流AI模型对学术论文进行评