来源：IT之家 · 科技 · 东亚 · 04-30 22:39

DeepSeek 发布多模态大模型技术报告，提出“视觉原语”推理框架

原标题：DeepSeek 公布多模态模型技术报告

AI 情报摘要

DeepSeek 公开多模态模型技术报告，探索以“视觉原语”提升空间视觉推理能力。

该技术路线若被验证有效，可能提升国产多模态模型在视觉理解、空间推理和复杂交互场景中的竞争力。

情绪：利好 · 相关：DeepSeek / GitHub / 多模态大语言模型 / 东亚 · LLM 已生成

DeepSeek 在 GitHub 发布多模态大模型及配套技术报告，重点提出基于“视觉原语”的推理框架，试图改进多模态大语言模型在空间参照等视觉理解任务中的表现，并弥补传统链式思维方法偏重语言推理的不足。