来源：IT之家 · 科技 · 东亚 · 04-29 09:27

蚂蚁集团百灵大模型开源 Ling-2.6-flash，提供 BF16、FP8、INT4 等版本

阅读原文 →

AI 摘要

这条新闻显示「蚂蚁集团百灵大模型开源 Ling-2.6-flash，提供 BF16、FP8、INT4 等版本」正在成为科技产业方向的新信号，值得结合东亚与科技后续动态继续观察。

关键点

核心事件：蚂蚁集团百灵大模型开源 Ling-2.6-flash，提供 BF16、FP8、INT4 等版本
所属领域：科技 / 科技产业
观察维度：东亚、IT之家后续报道与同类事件是否继续增加

影响分析

短期可能影响产品路线、开发者生态与产业链预期；若同类新闻继续增加，可能形成新的科技主题。

情绪：中性偏积极 · 相关：IT之家 / 科技 / 东亚 / 科技产业 · 模板回退

IT之家 4 月 29 日消息，蚂蚁集团旗下的百灵大模型今日宣布，Ling-2.6-flash 正式开源。同步提供 BF16、FP8、INT4 等多个版本，方便开发者根据不同硬件环境、推理成本和部署需求灵活选择。Ling-2.6-flash 是一款总参数量 104B、激活参数 7.4B 的 Instruct 模型，两周前以 Elephant Alpha 的匿名身份登陆 OpenRouter。官方表示，过去两周里持续收集来自开发者的真实反馈，并针对 Ling-2.6-flash 的使用体验进行了多轮优化，进一步改善了中英文自然切换能力，并提升了其在主流 Coding 框架中的适配效果。据介绍，Ling-2.6-flash 的核心能力体现在三个方面：混合线性架构，释放推理效率：通过引入混合线性架构，模型从底层优化计算效率，在 4 卡 H20 条件下推理速度最快可达到 340 tokens/s，Prefill 吞吐达到 Nemotron-3-Super 的 2.2 倍Token 效率优化，提升智效比：在训练过程中对 Token 效率进行了针对性校准，力求以更精简的输出完成既定目标。在 Artificial Analysis 的完整评测中，Ling-2.6-flash 仅消耗 15M tokens，约为 Nemotron-3-Super 等模型的 1/10面向 Agent 场景进行定向增强：针对当前需求最旺盛的 Agent 应用，在工具调用、多步规划与任务执行能力上持续打磨，使模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等评测中，即使面对激活参数更大的模型，依然能够取得相近甚至 SOTA 级别的表现IT之家附开源链接如下：Hugging Face：https://huggingface.co/inclusionAI/Ling-2.6-flashModelScope：https://www.modelscope.cn/models/inclusionAI/Ling-2.6-flash

阅读原文 →