来源：Ars Technica · 科技 · 北美洲 · 05-06 23:44

Google Gemma 4 开放模型通过预测后续 token 提速最高 3 倍

原标题：Google's Gemma 4 AI models get 3x speed boost by predicting future tokens

AI 情报摘要

Google 正为 Gemma 4 引入基于未来 token 预测的推理加速能力，推动本地 AI 运行更快。

该优化可能提升开放模型在个人设备和边缘场景中的实用性，进一步加剧本地 AI 推理性能竞争。

情绪：利好 · 相关：Google / Gemma 4 / Ars Technica / 北美洲 · LLM 已生成

据 Ars Technica 报道，Google 今年春季推出的 Gemma 4 开放模型正通过“预测未来 token”等推理优化获得显著加速，最高可提升约 3 倍生成速度。这一改进有望增强本地端和边缘设备运行 AI 模型的效率，降低延迟并改善用户体验。