利用零值的AI芯片突破
对人工智能模型而言,算力规模往往决定上限。尽管一些AI从业者提醒,像大规模语言模型(LLM)这类技术的效果提升可能正在出现边际递减,企业依旧持续发布规模更大的AI产品。Meta 最近推出的Llama模型就配备了高达2万亿个参数。模型越大,能力通常也越强。但与此同时,它的用电量和运行时间也会随之上升,进一步推高碳排放。为降低这些代价,人们转而采用更小但能力更有限的模型,并尽量用更低精度的参数配置。不过还有另一条思路:既保留大模型的高性能,又能显著减少运行时间与能耗。关键在于“善待”大模型内部的零值(This