回应额度消耗过快，谷歌Gemini推出免费使用Flash-Lite等六项优化针对用户普遍反映的谷歌 Gemini App 使用限额消耗过快且缺乏预测性的问题，谷歌 Gemini 产品副总裁 Josh Woodward 宣布团队正在紧急上线六项额度优化措施

7 小时前

回应额度消耗过快，谷歌Gemini推出免费使用Flash-Lite等六项优化

针对用户普遍反映的谷歌 Gemini App 使用限额消耗过快且缺乏预测性的问题，谷歌 Gemini 产品副总裁 Josh Woodward 宣布团队正在紧急上线六项额度优化措施。

具体调整包括：
1. 免费使用 Flash-Lite：用户向轻量级模型 Flash-Lite 发送的所有提示词将完全免费，不再扣除任何日常使用限额。
2. 修复视频扣额并翻倍：修复了在多模态视频场景下仅生成一两个视频便耗尽额度的 Bug，并将 Gemini Ultra 订阅用户的 Omni 视频生成限额即刻提升至双倍。
3. 复杂 Pro 提示词设限：针对携带庞大文件附件或超长提示词的单个 Pro 模型请求设立扣除上限，确保用户获取更连贯的调用次数。
4. 错误与失败请求免扣额：多模态交互过程中的网络延迟与系统错误均不再计费，用户仅需为顺利返回的成功结果支付限额。
5. 重度任务用量透明化：对于消耗庞大算力的 Deep Research 等重度任务，正在设计更详尽的用量仪表盘与限额透支预警，以便提升高负载操作的可控性。
6. 自动记忆模型选择：系统将自动锁定并记忆用户手动选定的具体模型，除非遭遇限额限制触发自动降级或手动调整，否则不会在后续会话中强制切换至轻量版本。

信源：https://x.com/joshwoodward/status/2060171610922058142

X (formerly Twitter)

Josh Woodward (@joshwoodward) on X

We’ve heard your feedback about hitting limits too quickly on @GeminiApp. We're rolling out several fixes to make your quota stretch further and feel more predictable… 🧵