来源:Google AI Blog · AI · 北美洲 · 04-03 00:00

Google 为 Gemini API 推出 Flex 与 Priority 两档推理服务

原标题:New ways to balance cost and reliability in the Gemini API

阅读原文 →

AI 情报摘要

Google 通过新增 Gemini API 推理层级,为开发者提供更灵活的成本与性能选择。

关键点

  • Gemini API 新增 Flex 和 Priority 两种 inference tiers。
  • Flex 主要面向成本敏感型应用,适合可接受一定延迟波动的任务。
  • Priority 面向低延迟和高可靠性需求场景,适合生产级关键应用。

影响分析

此举有助于 Google 提升 Gemini API 对不同开发者和企业场景的适配能力,增强其在生成式 AI 云服务市场的竞争力。

情绪:利好 · 相关:Google / Google AI Blog / Gemini API / 北美洲 · LLM 已生成

Google AI Blog 发布消息称,Gemini API 新增 Flex 和 Priority 两种推理层级,帮助开发者在成本、延迟和可靠性之间进行取舍。Flex 更偏向降低成本,Priority 则面向对响应速度和稳定性要求更高的场景。

阅读原文 →