百灵Ling-2.6-flash发布:104B参数,定价低至0.1美元
新浪科技讯 4 月 22 日下午报道,蚂蚁百灵正式发布了 Ling-2.6-flash —— 一个总参数 104B、活跃参数 7.4B 的指令模型,核心卖点在于“Token 效率”。 Ling-2.6-flash 继承了 Ling 2.5 的混合线性架构优势,在 4 张 H20 显卡环境下,推理速度峰值可达 340 tokens/s,Prefill 吞吐量更是 Nemotron-3-Super 的 2.2 倍。 在 Token 消耗层面,Ling-2.6-flash 的智能效率比大幅提高。根据 Artif