小米大模型开启永久降价模式,最大优惠高达 99%
作者 | 李香香
编辑 | 叶映橙
5 月 27 日,小米旗下的 MiMo 大模型团队正式发布公告,宣布对 V2.5 系列模型的 API 实施永久性价格下调,最大降幅达到 99%,且不再根据上下文窗口长度进行区分。与此同时,团队还优化了 Token Plan 计费机制,在相同价格下,用户的使用量可提升至原有的 5 到 8 倍。此后,雷军转发了该消息并给出了内容一致的回应。
小米技术官方微博指出,此次调价得益于团队在推理系统层面的不断精进。通过 SGLang HiCache 全面支持 SWA(滑动窗口注意力机制),成功将 KV Cache 在 GPU 显存、CPU 内存及 SSD 等多级存储间的数据传输量削减至优化前的约七分之一,并将可缓存的 token 数量提升至之前的近五倍,从而大幅提高了缓存命中率与推理效率。
在降价消息发布的前一晚,小米集团公布了第一季度财报:总营收达 991 亿元,经调整净利润为 61 亿元;智能电动汽车及 AI 等创新业务贡献收入 199 亿元,季度新车交付量为 80856 辆;研发支出为 90 亿元,同比大幅增长 33.4%。雷军同时宣告,未来三年将在 AI 领域投资 600 亿元,预计全年研发投入将超过 400 亿元。当前,MiMo-V2.5-Pro 已在 Artificial Analysis 榜单的综合智能指数与 Agent 指数上,位居全球开源模型并列榜首。
