标签

AI领域核心术语解读 | 从处理速率到自主智能

1. tokens/second (tps)发音:/ˈtɒkənz pə ˈsekənd/定义:每秒令牌数,评估AI模型运算效率的核心参数示例:小米在万亿参数模型上实现了每秒1000+令牌的处理速度。2. decode speed发音:/dɪˈkəʊd spiːd/定义:解码速率,AI输出文本时的响应效率示例:这一突破源于FP4量化与推测解码的协同应用。3. MoE (Mixture of Experts)发音:/ˈmɪkstʃər əv ˈekspɜːts/定义:专家混合架构,一种高效率的神经网络设计方

2026-06-15 11:01:21  |  1 阅读