用量限额

由于 Google Chat API 是一项共享服务,因此我们会应用配额和限制,以确保所有用户都能公平地使用该服务,并保护 Google Workspace 的整体性能。

如果您超出配额,则会收到 429: Too many requests HTTP 状态代码响应。聊天后端上的其他速率限制检查也可能会生成相同的错误响应。如果发生此错误,您应使用指数退避算法,稍后再试。只要您不超过下表中列出的每分钟配额,每天的请求数量就没有限制。

多种配额类型可能适用于 Chat API 方法:每项目配额、每空间配额和每用户配额。

每个项目的配额

每个项目的配额限制了 Google Cloud 项目的查询速率,因此适用于调用指定 Chat API 方法的单个 Chat 应用。

下表详细列出了每个项目的查询限制。您还可以在配额页面上找到这些限制。

每个项目的配额

Chat API 方法

限制(每 60 秒)

每分钟消息写入次数

spaces.messages.create

spaces.messages.patch

spaces.messages.delete

3000

每分钟消息读取次数

spaces.messages.get

spaces.messages.list

3000

每分钟会员资格写入次数

spaces.members.create

spaces.members.delete

300

每分钟会员资格读取次数

spaces.members.get

spaces.members.list

3000

每分钟聊天室写入次数

spaces.setup

spaces.create

spaces.patch

spaces.delete

60

每分钟空间读取次数

spaces.get

spaces.list

spaces.findDirectMessage

3000

每分钟附件写入次数

media.upload

600

每分钟附件读取次数

spaces.messages.attachments.get

media.download

3000

每分钟反应写入次数

spaces.messages.reactions.create

spaces.messages.reactions.delete

600

每分钟反应读取次数

spaces.messages.reactions.list

3000

每个空间的配额

每个聊天室的配额会限制指定聊天室中的查询速率,并且由在该聊天室中运行的所有 Chat 应用共享,这些应用会针对每个配额调用列出的 Chat API 方法。

下表详细说明了每个空间的查询限制:

每个空间的配额

Chat API 方法

限制(每 60 秒)

每分钟读取次数

media.download

spaces.get

spaces.members.get

spaces.members.list

spaces.messages.get

spaces.messages.list

spaces.messages.attachments.get

spaces.messages.reactions.list

900

每分钟写入次数

media.upload

spaces.delete

spaces.patch

spaces.messages.create传入的网络钩子还需遵守其他限制)

spaces.messages.delete

spaces.messages.patch

spaces.messages.reactions.create

spaces.messages.reactions.delete

60

每位用户的配额

每位用户的配额会限制 Google Chat 用户的查询速率。查询涉及所有代表用户(使用用户身份验证)调用 Chat API 方法的 Chat 应用。

下表详细列出了每个用户的查询限制:

每位用户的配额

Chat API 方法

限制(每 60 秒)

每分钟读取次数

customEmojis.get

customEmojis.list

900

每分钟写入次数

customEmojis.create

customEmojis.delete

60

其他用量限额

创建类型为 GROUP_CHATSPACE 的聊天室(使用 spaces.createspaces.setup 方法)还有其他配额限制。每分钟创建的此类聊天室数量不超过 35 个,每小时不超过 800 个。类型为 DIRECT_MESSAGE 的空间不受这些额外配额限制的约束。

如果 API 流量过高,且目标是同一空间,则可能会触发配额页面中未显示的额外内部限制。

解决基于时间的配额错误

对于所有基于时间的错误(每 X 分钟最多 N 个请求),我们建议您的代码捕获异常并使用截断指数退避,以确保设备不会产生过大的负载。

指数退避算法是网络应用的标准错误处理策略。指数退避算法以指数方式重试请求(不断增加各次请求之间的等待时间,直到达到最大退避时间)。如果请求仍然失败,请务必逐渐增加请求之间的延迟时间,直到请求成功为止。

示例算法

指数退避算法以指数方式重试请求(不断增加各次重试之间的等待时间,直到达到最大退避时间)。例如:

  1. 向 Google Chat API 发出请求。
  2. 如果请求失败,请等待 1 + random_number_milliseconds 秒后再重试请求。
  3. 如果请求失败,请等待 2 + random_number_milliseconds 秒后再重试请求。
  4. 如果请求失败,请等待 4 + random_number_milliseconds 秒后再重试请求。
  5. 依此类推,等待时间上限为 maximum_backoff
  6. 继续等待并重试,直至达到重试次数上限,但不会增加重试之间的等待时间。

其中:

  • 等待时间为 min(((2^n)+random_number_milliseconds), maximum_backoff),其中,n 会在每次迭代(请求)后增加 1。
  • random_number_milliseconds 是小于或等于 1,000 的毫秒数(随机值)。这有助于避免出现以下情况:许多客户端在某些情况下全部同步进行处理并同时执行重试操作,导致同步发送每一波请求。每次重试请求后,系统都会重新计算 random_number_milliseconds 值。
  • maximum_backoff 通常为 32 或 64 秒。哪个值更为适当,这取决于用例。

客户端在达到 maximum_backoff 时间后可以继续重试。 此后执行的重试不需要继续增加退避时间。例如,如果客户端使用的 maximum_backoff 时间为 64 秒,则在达到此值后,客户端可以每 64 秒重试一次。到了特定时间点后,客户端应停止无限重试。

重试之间的等待时间和重试次数取决于您的用例和网络条件。

申请提高每个项目的配额

根据项目的资源用量,您可能需要申请调整配额。服务账号的 API 调用被视为使用单个账号。我们无法保证您的调整配额请求一定会得到批准。如果配额调整请求会大幅增加配额值,则可能需要更长时间才能获得批准。

并非所有项目的配额都完全相同。随着您对 Google Cloud 的使用量逐步增加,您可能需要增加配额值。如果您预计用量即将显著增加,可以在 Google Cloud 控制台的“配额”页面中主动申请调整配额

如需了解详情,请参阅以下资源: