标签

百灵Ling-2.6-flash发布:104B参数,定价低至0.1美元

发布时间:2026-04-22 13:21来源:新浪新闻阅读:6

新浪科技讯 4 月 22 日下午报道,蚂蚁百灵正式发布了 Ling-2.6-flash —— 一个总参数 104B、活跃参数 7.4B 的指令模型,核心卖点在于“Token 效率”。

Ling-2.6-flash 继承了 Ling 2.5 的混合线性架构优势,在 4 张 H20 显卡环境下,推理速度峰值可达 340 tokens/s,Prefill 吞吐量更是 Nemotron-3-Super 的 2.2 倍。

在 Token 消耗层面,Ling-2.6-flash 的智能效率比大幅提高。根据 Artificial Analysis 的全面评测,Ling-2.6-flash 总消耗仅为 15M tokens,相比之下 Nemotron-3-Super 等模型消耗至少 110M tokens。

此外,Ling-2.6-flash 针对智能体场景进行了专门优化,在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等智能体相关基准测试中,取得了同尺寸下的 SOTA 表现。

关于 API 价格,Ling-2.6-flash 的输入定价为每百万 tokens 0.1 美元,输出定价为 0.3 美元。

目前,Ling-2.6-flash 的 API 已面向公众开放,并附带为期一周的免费试用。用户可以通过 OpenRouter 或百灵大模型 tbox 来获取这项服务。

据悉,该模型后续将通过蚂蚁数科推出商业版本 LingDT,旨在服务全球开发者和中小企业。

编辑:王翔

新浪财经声明:本文转载自合作媒体,新浪财经登载此文仅为了提供更多信息,文章内容仅供参考,不构成投资建议。

郑重声明:1.依据《证券法》,禁止编造、传播虚假或误导性信息以扰乱市场;2.用户在本社区发表的所有资料和言论仅代表个人观点,与本网站无关,不构成任何投资建议。用户应独立判断并自行承担投资风险。