配额和限制

本文档列出了适用于 Gemini for Google Cloud的配额和系统限制。

  • 配额用于指定您可以使用的可计数共享资源的数量。配额由 Gemini for Google Cloud等 Google Cloud 服务定义。
  • 系统限制是无法更改的固定值。

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

Gemini 资源也有系统限制。系统限制不能更改。

每秒请求数

Gemini for Google Cloud 会对项目中每位用户每秒的请求数施加配额。

配额
每秒请求数 2

每日请求数

Gemini for Google Cloud 会对项目中每位用户每天的请求总数实施配额。

配额
每天针对 Gemini Code Assist 或 Gemini in BigQuery 代码请求(例如代码生成和代码补全)的请求数。 6000
在 Google Cloud 控制台和 IDE 的 Cloud Assist 面板中显示回答的对话、可视化、数据分析洞见表格扫描、元数据生成、数据准备以及其他请求的每日请求数。 960

Gemini Code Assist 配额

Gemini Code Assist 会对某些功能强制执行配额。

配额
本地代码库感知 128,000 个 token 的上下文窗口
代码自定义代码库 20,000

代理模式和 Gemini CLI 的配额

Gemini Code Assist 代理模式和 Gemini CLI 的请求配额会合并计算。在代理模式下或使用 Gemini CLI 时,一个提示可能会生成多个请求。

配额 Gemini Code Assist 版本
每个用户每分钟的请求数 标准版 120
企业 120
每个用户每天的请求数 标准版 1500
企业 2000

Gemini in BigQuery 配额

对于代码编写协助功能,Gemini Code Assist 和 Gemini in BigQuery 代码请求(针对代码补全和代码生成等功能)的配额是相同的。

对于使用 Gemini in BigQuery 且拥有 BigQuery 按需计算版或企业版/企业 Plus 版的客户,系统会根据上一个完整日历月的扫描 TiB 数或槽小时数的每日平均用量来提供数据分析洞见等高级功能的配额。此配额适用于组织级别,并适用于该组织中的所有项目。配额会向上舍入到最接近的 100 个槽时使用量。

每 100 个槽时数的配额(企业版或企业 Plus 版每日平均用量)或使用按需计算模型每扫描 1 TiB 数据的配额
在 Google Cloud 控制台的 Cloud Assist 面板中显示回答的对话、可视化、表格扫描以及其他请求的每日请求数。 5

示例:如果某个组织拥有 100 个槽的企业版预留作为基准,则每天平均使用 2,400 个槽时(100 个槽 * 24 小时 = 2,400 个槽时)。因此,在下个月,他们将获得以下每日配额:

  • 每天 120 次对话、可视化、数据分析洞见表格扫描和自动元数据生成

如果您的组织此前尚未购买任何 BigQuery 企业版、企业 Plus 版槽或按需计算 (TiB),则在首次使用后,您将在第一个完整的日历月内获得以下默认配额:

  • 每天 250 次对话、可视化、数据分析洞见表格扫描和自动生成元数据

如果您在月中开始使用按需计算、企业版或企业 Plus 版预留,则默认配额将持续有效至下一个月末。

申请增加配额

如需调整大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请配额调整