科学品味_标签-酷阅新闻

AI如何掌握科学直觉？RLCF赋能科学思维

伟大的科学家拥有强大的判断力和远见，这与我们所说的科学品味密切相关。来自复旦大学、上海创新研究院、OpenMOSS团队等机构的研究团队提出RLCF（Reinforcement Learning from Community Feedback），一种使用大规模社区信号作为监督的训练范式。研究团队在700K论文对上训练Scientific Judge，实现93.6%的判断准确率，并训练Scientific Thinker提出具有高潜在影响的研究想法。伟大的科学家拥有强大的判断力和远见，这与我们所说的"

2026-03-28 19:13:55 | 15 阅读