回应额度消耗过快,谷歌Gemini推出免费使用Flash-Lite等六项优化
针对用户普遍反映的谷歌 Gemini App 使用限额消耗过快且缺乏预测性的问题,谷歌 Gemini 产品副总裁 Josh Woodward 宣布团队正在紧急上线六项额度优化措施。
具体调整包括:
1. 免费使用 Flash-Lite:用户向轻量级模型 Flash-Lite 发送的所有提示词将完全免费,不再扣除任何日常使用限额。
2. 修复视频扣额并翻倍:修复了在多模态视频场景下仅生成一两个视频便耗尽额度的 Bug,并将 Gemini Ultra 订阅用户的 Omni 视频生成限额即刻提升至双倍。
3. 复杂 Pro 提示词设限:针对携带庞大文件附件或超长提示词的单个 Pro 模型请求设立扣除上限,确保用户获取更连贯的调用次数。
4. 错误与失败请求免扣额:多模态交互过程中的网络延迟与系统错误均不再计费,用户仅需为顺利返回的成功结果支付限额。
5. 重度任务用量透明化:对于消耗庞大算力的 Deep Research 等重度任务,正在设计更详尽的用量仪表盘与限额透支预警,以便提升高负载操作的可控性。
6. 自动记忆模型选择:系统将自动锁定并记忆用户手动选定的具体模型,除非遭遇限额限制触发自动降级或手动调整,否则不会在后续会话中强制切换至轻量版本。
信源:https://x.com/joshwoodward/status/2060171610922058142
针对用户普遍反映的谷歌 Gemini App 使用限额消耗过快且缺乏预测性的问题,谷歌 Gemini 产品副总裁 Josh Woodward 宣布团队正在紧急上线六项额度优化措施。
具体调整包括:
1. 免费使用 Flash-Lite:用户向轻量级模型 Flash-Lite 发送的所有提示词将完全免费,不再扣除任何日常使用限额。
2. 修复视频扣额并翻倍:修复了在多模态视频场景下仅生成一两个视频便耗尽额度的 Bug,并将 Gemini Ultra 订阅用户的 Omni 视频生成限额即刻提升至双倍。
3. 复杂 Pro 提示词设限:针对携带庞大文件附件或超长提示词的单个 Pro 模型请求设立扣除上限,确保用户获取更连贯的调用次数。
4. 错误与失败请求免扣额:多模态交互过程中的网络延迟与系统错误均不再计费,用户仅需为顺利返回的成功结果支付限额。
5. 重度任务用量透明化:对于消耗庞大算力的 Deep Research 等重度任务,正在设计更详尽的用量仪表盘与限额透支预警,以便提升高负载操作的可控性。
6. 自动记忆模型选择:系统将自动锁定并记忆用户手动选定的具体模型,除非遭遇限额限制触发自动降级或手动调整,否则不会在后续会话中强制切换至轻量版本。
信源:https://x.com/joshwoodward/status/2060171610922058142