由于 Google Chat API 是一项共享服务,因此我们会应用配额和限制,以确保所有用户都能公平地使用该服务,并保护 Google Workspace 的整体性能。
如果您超出配额,则会收到 429: Too many requests
HTTP 状态代码响应。聊天后端上的其他速率限制检查也可能会生成相同的错误响应。如果发生此错误,您应使用指数退避算法,稍后再试。只要您不超过下表中列出的每分钟配额,每天的请求数量就没有限制。
多种配额类型可能适用于 Chat API 方法:每项目配额、每空间配额和每用户配额。
每个项目的配额
每个项目的配额限制了 Google Cloud 项目的查询速率,因此适用于调用指定 Chat API 方法的单个 Chat 应用。
下表详细列出了每个项目的查询限制。您还可以在配额页面上找到这些限制。
每个项目的配额 |
Chat API 方法 |
限制(每 60 秒) |
---|---|---|
每分钟消息写入次数 |
|
3000 |
每分钟消息读取次数 |
|
3000 |
每分钟会员资格写入次数 |
|
300 |
每分钟会员资格读取次数 |
|
3000 |
每分钟聊天室写入次数 |
|
60 |
每分钟空间读取次数 |
|
3000 |
每分钟附件写入次数 |
|
600 |
每分钟附件读取次数 |
|
3000 |
每分钟反应写入次数 |
|
600 |
每分钟反应读取次数 |
|
3000 |
每个空间的配额
每个聊天室的配额会限制指定聊天室中的查询速率,并且由在该聊天室中运行的所有 Chat 应用共享,这些应用会针对每个配额调用列出的 Chat API 方法。
下表详细说明了每个空间的查询限制:
每个空间的配额 |
Chat API 方法 |
限制(每 60 秒) |
---|---|---|
每分钟读取次数 |
|
900 |
每分钟写入次数 |
|
60 |
每位用户的配额
每位用户的配额会限制 Google Chat 用户的查询速率。查询涉及所有代表用户(使用用户身份验证)调用 Chat API 方法的 Chat 应用。
下表详细列出了每个用户的查询限制:
每位用户的配额 |
Chat API 方法 |
限制(每 60 秒) |
---|---|---|
每分钟读取次数 |
|
900 |
每分钟写入次数 |
|
60 |
其他用量限额
创建类型为 GROUP_CHAT
或 SPACE
的聊天室(使用 spaces.create
或 spaces.setup
方法)还有其他配额限制。每分钟创建的此类聊天室数量不超过 35 个,每小时不超过 800 个。类型为 DIRECT_MESSAGE
的空间不受这些额外配额限制的约束。
如果 API 流量过高,且目标是同一空间,则可能会触发配额页面中未显示的额外内部限制。
解决基于时间的配额错误
对于所有基于时间的错误(每 X 分钟最多 N 个请求),我们建议您的代码捕获异常并使用截断指数退避,以确保设备不会产生过大的负载。
指数退避算法是网络应用的标准错误处理策略。指数退避算法以指数方式重试请求(不断增加各次请求之间的等待时间,直到达到最大退避时间)。如果请求仍然失败,请务必逐渐增加请求之间的延迟时间,直到请求成功为止。
示例算法
指数退避算法以指数方式重试请求(不断增加各次重试之间的等待时间,直到达到最大退避时间)。例如:
- 向 Google Chat API 发出请求。
- 如果请求失败,请等待 1 +
random_number_milliseconds
秒后再重试请求。 - 如果请求失败,请等待 2 +
random_number_milliseconds
秒后再重试请求。 - 如果请求失败,请等待 4 +
random_number_milliseconds
秒后再重试请求。 - 依此类推,等待时间上限为
maximum_backoff
。 - 继续等待并重试,直至达到重试次数上限,但不会增加重试之间的等待时间。
其中:
- 等待时间为
min(((2^n)+random_number_milliseconds), maximum_backoff)
,其中,n
会在每次迭代(请求)后增加 1。 random_number_milliseconds
是小于或等于 1,000 的毫秒数(随机值)。这有助于避免出现以下情况:许多客户端在某些情况下全部同步进行处理并同时执行重试操作,导致同步发送每一波请求。每次重试请求后,系统都会重新计算random_number_milliseconds
值。maximum_backoff
通常为 32 或 64 秒。哪个值更为适当,这取决于用例。
客户端在达到 maximum_backoff
时间后可以继续重试。
此后执行的重试不需要继续增加退避时间。例如,如果客户端使用的 maximum_backoff
时间为 64 秒,则在达到此值后,客户端可以每 64 秒重试一次。到了特定时间点后,客户端应停止无限重试。
重试之间的等待时间和重试次数取决于您的用例和网络条件。
申请提高每个项目的配额
根据项目的资源用量,您可能需要申请调整配额。服务账号的 API 调用被视为使用单个账号。我们无法保证您的调整配额请求一定会得到批准。如果配额调整请求会大幅增加配额值,则可能需要更长时间才能获得批准。
并非所有项目的配额都完全相同。随着您对 Google Cloud 的使用量逐步增加,您可能需要增加配额值。如果您预计用量即将显著增加,可以在 Google Cloud 控制台的“配额”页面中主动申请调整配额。
如需了解详情,请参阅以下资源: