蚂蚁集团百灵大模型 Ling-2.6-flash 发布,匿名上线一周日均 tokens 调用达 100B 级

IT之家 4 月 22 日消息,蚂蚁集团旗下的百灵大模型今日宣布,推出一款总参数量 104B激活参数 7.4B 的 Instruct 模型 Ling-2.6-flash

一周前,代号为 Elephant Alpha 的匿名模型登陆 OpenRouter。上线以来,其调用量持续增长,连续多日位列 Trending 榜首,日均 tokens 调用量达 100B 级别。百灵大模型今日宣布 Elephant Alpha 正是百灵模型 Ling-2.6-flash 的匿名测试版本。

官方表示,面对持续攀升的 Token 压力,Ling-2.6-flash 选择了一条不同的技术路径:不是单纯依赖更长输出换取更高分数,而是围绕推理效率、Token 效率与 Agent 场景表现进行系统性优化,在保持竞争力智能水平的同时,尽可能做到更快、更省和更适合真实业务场景。

Ling-2.6-flash 的核心能力体现在三个方面:

为方便更多开发者快速体验 Ling-2.6-flash,百灵大模型将在 OpenRouter 与官方平台同步提供一周免费 API 调用。

免费期结束后,将按使用量计费:输入 0.1 美元 / 百万 tokens,输出 0.3 美元 / 百万 tokens,缓存命中 0.02 美元 / 百万 tokens(按 20% 计费)。

Ling-2.6-flash 官方 API 服务也已正式开放,官方免费期结束后,平台仍将提供每日 50 万 tokens 免费额度;超出部分按量计费:输入 0.6 元 / 百万 tokens,输出 1.8 元 / 百万 tokens。

IT之家注意到,官方表示,模型的 BF16、FP8、INT4 等版本也将于近期正式开源。

免责声明:

1、本网站所展示的内容均转载自网络其他平台,主要用于个人学习、研究或者信息传播的目的;所提供的信息仅供参考,并不意味着本站赞同其观点或其内容的真实性已得到证实;阅读者务请自行核实信息的真实性,风险自负。

2、如因作品内容、版权和其他问题请与本站管理员联系,我们将在收到通知后的3个工作日内进行处理。