用量限额

由于 Google Chat API 是一项共享服务，因此我们会应用配额和限制，以确保所有用户都能公平地使用该服务，并保护 Google Workspace 的整体性能。

如果您超出配额，则会收到 429: Too many requests HTTP 状态代码响应。聊天后端上的其他速率限制检查也可能会生成相同的错误响应。如果发生此错误，您应使用指数退避算法，稍后再试。只要您不超过下表中列出的每分钟配额，每天可以发出的请求数量就没有限制。

多种配额类型可能适用于 Chat API 方法：每项目配额、每空间配额和每用户配额。

每个项目的配额

每个项目的配额限制了 Google Cloud 项目的查询速率，因此适用于调用指定 Chat API 方法的单个 Chat 应用。

下表详细列出了每个项目的查询限制。您还可以在配额页面上找到这些限制。

每个项目的配额	Chat API 方法	限制（每 60 秒）
每分钟消息写入次数	`spaces.messages.create` `spaces.messages.patch` `spaces.messages.delete`	3000
每分钟消息读取次数	`spaces.messages.get` `spaces.messages.list`	3000
每分钟会员资格写入次数	`spaces.members.create` `spaces.members.delete`	300
每分钟会员资格读取次数	`spaces.members.get` `spaces.members.list`	3000
每分钟空间写入次数	`spaces.setup` `spaces.create` `spaces.patch` `spaces.delete`	60
每分钟空间读取次数	`spaces.get` `spaces.list` `spaces.findDirectMessage`	3000
每分钟附件写入次数	`media.upload`	600
每分钟附件读取次数	`spaces.messages.attachments.get` `media.download`	3000
每分钟反应写入次数	`spaces.messages.reactions.create` `spaces.messages.reactions.delete`	600
每分钟反应读取次数	`spaces.messages.reactions.list`	3000

每个空间的配额

聊天室级配额会限制指定聊天室中的查询速率，并且由在该聊天室中运行的所有 Chat 应用共享，这些应用会针对每个配额调用列出的 Chat API 方法。

下表详细列出了每个空间的查询限制：

每个空间的配额	Chat API 方法	限制（每秒）
每秒读取次数	`media.download` `spaces.get` `spaces.members.get` `spaces.members.list` `spaces.messages.get` `spaces.messages.list` `spaces.messages.attachments.get` `spaces.messages.reactions.list`	15
每秒写入次数	`media.upload` `spaces.delete` `spaces.patch` `spaces.messages.create`（传入的网络钩子还需遵守其他限制） `spaces.messages.delete` `spaces.messages.patch` `spaces.messages.reactions.delete`	1
每秒创建的 Reaction 写入次数	`spaces.messages.reactions.create`	5
将数据导入到 Google Chat 时每秒的消息写入次数	`spaces.messages.create`	10

每位用户的配额

每位用户的配额会限制 Google Chat 用户的查询速率。查询涉及代表用户（使用用户身份验证）调用 Chat API 方法的所有 Chat 应用。

下表详细列出了每个用户的查询限制：

每位用户的配额	Chat API 方法	限制（每秒）
每秒读取次数	`customEmojis.get` `customEmojis.list`	15
每秒写入次数	`customEmojis.create` `customEmojis.delete`	1

每位用户的配额

Chat API 方法

限制（每秒）

每秒读取次数

customEmojis.get

customEmojis.list

每秒写入次数

customEmojis.create

customEmojis.delete

其他用量限额

如果针对同一空间的 API 流量过高，可能会触发配额页面中未显示的额外内部限制。

解决基于时间的配额错误

对于所有基于时间的错误（每 X 分钟最多 N 个请求），我们建议您的代码捕获异常并使用截断的指数退避，以确保设备不会产生过大的负载。

指数退避算法是网络应用的标准错误处理策略。指数退避算法以指数方式重试请求（不断增加各次请求之间的等待时间，直到达到最大退避时间）。如果请求仍然失败，请务必逐渐增加请求之间的延迟时间，直到请求成功为止。

示例算法

指数退避算法以指数方式重试请求（不断增加各次重试之间的等待时间，直到达到最大退避时间）。例如：

向 Google Chat API 发出请求。
如果请求失败，请等待 1 + random_number_milliseconds 秒后再重试请求。
如果请求失败，请等待 2 + random_number_milliseconds 秒后再重试请求。
如果请求失败，请等待 4 + random_number_milliseconds 秒后再重试请求。
依此类推，等待时间上限为 maximum_backoff。
继续等待并重试，直至达到重试次数上限，但不会增加重试之间的等待时间。

其中：

等待时间为 min(((2^n)+random_number_milliseconds), maximum_backoff)，其中，n 会在每次迭代（请求）后增加 1。
random_number_milliseconds 是小于或等于 1,000 的毫秒数（随机值）。这有助于避免出现以下情况：许多客户端在某些情况下全部同步进行处理并同时执行重试操作，导致同步发送每一波请求。每次重试请求后，系统都会重新计算 random_number_milliseconds 值。
maximum_backoff 通常为 32 或 64 秒。适当的值取决于用例。

客户端在达到 maximum_backoff 时间后可以继续重试。此后执行的重试不需要继续增加退避时间。例如，如果客户端使用的 maximum_backoff 时间为 64 秒，则在达到此值后，客户端可以每 64 秒重试一次。到了特定时间点后，客户端应停止无限重试。

重试之间的等待时间和重试次数取决于您的用例和网络条件。

申请提高每个项目的配额

根据项目的资源用量，您可能需要申请调整配额。服务账号的 API 调用被视为使用单个账号。我们无法保证您的调整配额请求一定会得到批准。如果配额调整请求会大幅增加配额值，则可能需要更长时间才能获得批准。

并非所有项目的配额都完全相同。随着您对 Google Cloud 的使用量逐步增加，您可能需要增加配额值。如果您预计用量即将显著增加，可以在 Google Cloud 控制台的“配额”页面中主动申请调整配额。

如需了解详情，请参阅以下资源：

用量限额 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

每个项目的配额

每个空间的配额

每位用户的配额

其他用量限额

解决基于时间的配额错误

示例算法

申请提高每个项目的配额

用量限额