标签

AI新突破:仅需12.5%专家模块性能几乎无损

核心看点 · 艾伦人工智能研究院及加州大学伯克利分校联合推出了EMO模块化语言模型。其内部组件专注于医学、政治等特定垂直领域(而非局限于语法规则),同时确保了强大的整体表现。· 该系统在训练阶段采用了固定的文档边界机制,促使各个模块专注于培养不同内容领域的专业知识,而非仅仅模仿纯粹的结构性语言模式。· 当模块缩减至四分之一规模时,EMO的性能仅下滑约1%,这极大降低了存储开销,并能精准调控模型所覆盖的知识范畴。艾伦人工智能研究院与加州大学伯克利分校的科研团队打造了EMO——一种在预训练阶段便形成了模块化架

2026-05-16 18:34:56  |  5 阅读