斯坦福3D大模型Merlin:AI读片写报告,精准预判风险
研究速览放射科医生资源短缺与CT扫描量持续攀升的矛盾愈发严峻,尤其腹部CT切片数量庞大,解读过程耗时费力。当前AI模型多局限于二维图像或简短文本,难以有效处理真实的临床三维CT数据。为此,斯坦福大学的研究团队开发了Merlin,一个专门针对腹部CT的三维视觉语言基础模型。Merlin的创新之处在于,它打破了传统“单一模态、单一任务”的局限,能够同时从海量的三维CT扫描、电子健康记录(EHR)诊断代码以及长篇放射学报告中进行联合学习。研究团队在一个A6000 GPU上,利用超过15000例CT数据完成了模型