来源：Hacker News · AI · 北美洲 · 05-07 16:56

ZAYA1-8B发布：8B MoE模型以760M激活参数对标DeepSeek-R1数学能力

原标题：ZAYA1-8B: An 8B Moe Model with 760M Active Params Matching DeepSeek-R1 on Math

AI 情报摘要

ZAYA1-8B试图用更低激活参数实现接近DeepSeek-R1的数学推理表现。

若基准结果经独立验证，将强化小型MoE模型在低成本推理场景中的吸引力。

情绪：中性 · 相关：ZAYA1-8B / DeepSeek-R1 / Hacker News / 北美洲 · LLM 已生成

开源模型ZAYA1-8B引发关注。该模型采用8B规模的MoE架构，每次推理仅激活约760M参数，主打数学与编程能力，并宣称在数学任务上可匹配DeepSeek-R1表现。相关信息来自Hacker News转发的项目文章。