AI界震动!谷歌祭出颠覆性技术,内存需求锐减六倍
2026年4月的第一周,人工智能领域接连发生了几桩影响深远的大事,每一件都可能重塑行业面貌。首先是最具冲击力的消息。3月25日,谷歌研究团队正式公布了TurboQuant压缩算法,这项技术能够将大型语言模型的内存占用量骤降至原先的六分之一,同时几乎不牺牲任何精度。谷歌科学家Amir Zandieh和Vahab Mirrokni在官方博客中阐述,这是一种极为激进的量化技术,可将模型权重压缩至3比特级别,而模型的输出性能却不受影响。以往行业内的模型压缩,常常需要在节省内存和保持精度之间做出权衡,但TurboQ