标签

AI如何掌握科学直觉?RLCF赋能科学思维

伟大的科学家拥有强大的判断力和远见,这与我们所说的科学品味密切相关。来自复旦大学、上海创新研究院、OpenMOSS团队等机构的研究团队提出RLCF(Reinforcement Learning from Community Feedback),一种使用大规模社区信号作为监督的训练范式。研究团队在700K论文对上训练Scientific Judge,实现93.6%的判断准确率,并训练Scientific Thinker提出具有高潜在影响的研究想法。伟大的科学家拥有强大的判断力和远见,这与我们所说的"

2026-03-28 19:13:55  |  6 阅读