使用限制

由于 Google Chat API 是一项共享服务,因此我们实施了配额和限制,以确保所有用户都能公平地使用该服务,并保护 Google Workspace 的整体性能。

如果您超出配额,将会收到 429: Too many requests HTTP 状态代码响应。对 Chat 后端进行额外的速率限制检查也可能生成相同的错误响应。如果发生此错误,您应使用指数退避算法,然后重试。只要您不超出下表中列出的每分钟配额,您每天可以发出的请求数就没有限制。

Chat API 方法有两种配额类型:按空间配额和按项目配额。

每个空间的配额

每个聊天室的配额会限制给定聊天室中的查询速率,且由在相应聊天室中调用所列 Chat API 方法的所有 Chat 应用共享。

下表详细介绍了每个空间的查询限制:

每个空间的配额

Chat API 方法

限制(每 60 秒,
在聊天室中的所有 Chat 应用之间共享)

每分钟读取次数

media.download

spaces.get

spaces.members.get

spaces.members.list

spaces.messages.get

spaces.messages.list

spaces.messages.attachments.get

spaces.messages.reactions.list

900

每分钟写入次数

media.upload

spaces.delete

spaces.patch

spaces.messages.create(也适用于传入的网络钩子

spaces.messages.delete

spaces.messages.patch

spaces.messages.reactions.create

spaces.messages.reactions.delete

60

每个项目的配额

每个项目的配额会限制 Google Cloud 项目的查询速率,因此适用于针对每个配额调用指定 Chat API 方法的单个 Chat 应用。

下表详细介绍了每个项目的查询限制。您还可以在配额页面上找到这些限制。

每个项目的配额

Chat API 方法

限制(每 60 秒)

每分钟消息写入次数

spaces.messages.create

spaces.messages.patch

spaces.messages.delete

3000

每分钟消息读取次数

spaces.messages.get

spaces.messages.list

3000

每分钟成员资格写入次数

spaces.members.create

spaces.members.delete

300

每分钟成员资格读取次数

spaces.members.get

spaces.members.list

3000

每分钟空间写入次数

spaces.setup

spaces.create

spaces.patch

spaces.delete

60

每分钟的聊天室读取次数

spaces.get

spaces.list

spaces.findDirectMessage

3000

每分钟附件写入次数

media.upload

600

每分钟附件读取次数

spaces.messages.attachments.get

media.download

3000

每分钟响应写入次数

spaces.messages.reactions.create

spaces.messages.reactions.delete

600

每分钟反应读取次数

spaces.messages.reactions.list

3000

额外的用量限额

使用 spaces.createspaces.setup 方法创建 GROUP_CHATSPACE 类型的聊天室时,还存在额外的配额限制。对于这些类型的聊天室,每分钟创建少于 35 个聊天室,每小时创建不到 210 个聊天室。DIRECT_MESSAGE 类型的聊天室不受这些额外配额限制。

针对同一空间的任何 API 的每秒大型查询次数 (QPS) 都可能会触发配额页面中未显示的其他内部限制。

解决基于时间的配额错误

对于所有基于时间的错误(每 X 分钟最多发出 N 个请求),我们建议您的代码捕获异常,并使用截断的指数退避算法来确保您的设备不会产生过多负载。

指数退避算法是网络应用的标准错误处理策略。指数退避算法算法会使用以指数方式增加的请求之间的等待时间重试请求,最长可达到退避时间上限。如果请求仍然失败,则必须确保请求之间的延迟时间会随着时间的推移而增加,直到请求成功为止。

示例算法

指数退避算法以指数方式重试请求,增加重试之间的等待时间,直到达到最大退避时间。例如:

  1. 向 Google Chat API 发出请求。
  2. 如果请求失败,则等待 1 + random_number_milliseconds,然后重试请求。
  3. 如果请求失败,则等待 2 + random_number_milliseconds,然后重试请求。
  4. 如果请求失败,则等待 4 + random_number_milliseconds,然后重试请求。
  5. 依此类推,等待时间上限为 maximum_backoff
  6. 继续等待并重试,直至达到重试次数上限,但不要增加重试之间的等待期。

其中:

  • 等待时间为 min(((2^n)+random_number_milliseconds), maximum_backoff),其中 n 在每次迭代(请求)后增加 1。
  • random_number_milliseconds 是小于或等于 1,000 的随机毫秒数。这有助于避免以下情况:许多客户端在某些情况下同步并同时执行重试操作,从而同步发送每一波请求。每次重试请求后,系统都会重新计算 random_number_milliseconds 的值。
  • maximum_backoff 通常为 32 或 64 秒。适当的值取决于用例。

客户端可以在达到 maximum_backoff 时间后继续重试。此后执行的重试不需要继续增加退避时间。例如,如果客户端使用的 maximum_backoff 时间为 64 秒,则在达到此值后,客户端可以每 64 秒重试一次。在某个时间点,应阻止客户端无限期重试。

重试之间的等待时间和重试次数取决于您的使用场景和网络条件。

申请增加每个项目的配额

根据项目的资源用量,您可能需要申请增加配额。系统会将服务帐号执行的 API 调用视为使用单个帐号。申请增加配额并不保证一定会获得批准。大型配额增加可能需要更长时间才能获得批准。

并非所有项目的配额都完全相同。随着您越来越多地使用 Google Cloud,您的配额可能需要增加。如果您预计自己的用量即将显著增加,可以在 Google Cloud 控制台的“配额”页面中主动申请调整配额

如需了解详情,请参阅以下资源: