Da die Google Chat API ein freigegebener Dienst ist, wenden wir Kontingente und Einschränkungen an, um sicherzustellen, dass sie von allen Nutzern fair verwendet wird, und um die Gesamtleistung von Google Workspace zu schützen.
Wenn Sie ein Kontingent überschreiten, erhalten Sie eine Antwort mit dem HTTP-Statuscode 429: Too many requests. Zusätzliche Ratenbegrenzungstests im Chat-Back-End können ebenfalls dieselbe Fehlermeldung ausgeben. In diesem Fall sollten Sie einen
exponentiellen Backoff-Algorithmus
verwenden und es später noch einmal versuchen. Solange Sie die in den folgenden Tabellen aufgeführten Kontingente pro Minute nicht überschreiten, ist die Anzahl der Anfragen, die Sie pro Tag stellen können, nicht begrenzt.
Für Chat API-Methoden können mehrere Kontingenttypen gelten: Kontingente pro Projekt, pro Bereich und pro Nutzer.
Kontingente pro Projekt
Kontingente pro Projekt begrenzen die Rate der Abfragen für ein Google Cloud-Projekt und gelten daher für eine einzelne Chat-App, die die angegebenen Chat API-Methoden für jedes Kontingent aufruft.
In der folgenden Tabelle sind die Abfragelimits pro Projekt aufgeführt. Sie finden diese Limits auch auf der Seite Kontingente.
Kontingent pro Projekt |
Chat API-Methoden |
Limit (pro 60 Sekunden) |
|---|---|---|
Schreibvorgänge für Nachrichten pro Minute |
|
3000 |
Lesevorgänge für Nachrichten pro Minute |
|
3000 |
Schreibvorgänge für Mitgliedschaften pro Minute |
|
300 |
Lesevorgänge für Mitgliedschaften pro Minute |
|
3000 |
Schreibvorgänge für Bereiche pro Minute |
|
60 |
Lesevorgänge für Bereiche pro Minute |
|
3000 |
Schreibvorgänge für Anhänge pro Minute |
|
600 |
Lesevorgänge für Anhänge pro Minute |
|
3000 |
Schreibvorgänge für Reaktionen pro Minute |
|
600 |
Lesevorgänge für Reaktionen pro Minute |
|
3000 |
Schreibvorgänge für benutzerdefinierte Emojis pro Minute |
|
600 |
Lesevorgänge für benutzerdefinierte Emojis pro Minute |
|
3000 |
Schreibvorgänge für Abschnitte pro Minute |
|
600 |
Lesevorgänge für Abschnitte pro Minute |
|
3000 |
Kontingente pro Bereich
Kontingente pro Bereich begrenzen die Rate der Abfragen in einem bestimmten Bereich und werden von allen Chat-Apps gemeinsam genutzt, die in diesem Bereich aktiv sind und die aufgeführten Chat API-Methoden für jedes Kontingent aufrufen.
In der folgenden Tabelle sind die Abfragelimits pro Bereich aufgeführt:
Kontingent pro Bereich |
Chat API-Methoden |
Limit (pro Sekunde) |
|---|---|---|
Lesevorgänge pro Sekunde |
|
15 |
Schreibvorgänge pro Sekunde |
|
1 |
Schreibvorgänge für das Erstellen von Reaktionen pro Sekunde |
|
5 |
Schreibvorgänge für Nachrichten pro Sekunde beim Importieren von Daten in Google Chat |
|
10 |
Kontingente pro Nutzer
Kontingente pro Nutzer begrenzen die Rate der Abfragen für einen Google Chat-Nutzer. Abfragen beziehen sich auf alle Chat-Apps, die eine Chat API-Methode im Namen eines Nutzers aufrufen (mit Nutzerauthentifizierung).
In der folgenden Tabelle sind die Abfragelimits pro Nutzer aufgeführt:
Kontingent pro Nutzer |
Chat API-Methoden |
Limit (pro Sekunde) |
|---|---|---|
Schreibvorgänge für benutzerdefinierte Emojis pro Sekunde |
|
1 |
Lesevorgänge für benutzerdefinierte Emojis pro Sekunde |
|
15 |
Schreibvorgänge für Abschnitte pro Sekunde |
|
1 |
Lesevorgänge für Abschnitte pro Sekunde |
|
15 |
Zusätzliche Nutzungslimits
Hoher API-Traffic, der auf denselben Bereich ausgerichtet ist, kann zusätzliche interne Limits auslösen, die auf der Kontingente-Seite nicht sichtbar sind.
Zeitbasierte Kontingentfehler beheben
Bei allen zeitbasierten Fehlern (maximal N Anfragen pro X Minuten) empfehlen wir Ihnen, dass Ihr Code die Ausnahme abfängt und einen abgeschnittenen exponentiellen Backoff verwendet, um zu verhindern, dass Ihre Geräte eine übermäßige Last erzeugen.
Exponentielle Backoffs bilden eine Standard-Fehlerbehandlungsstrategie für Netzwerkanwendungen. Ein exponentieller Backoff-Algorithmus wiederholt Anfragen mit exponentiell zunehmenden Wartezeiten zwischen den Anfragen bis zur maximalen Backoff-Zeit. Wenn Anfragen weiterhin nicht erfolgreich sind, müssen die Verzögerungen zwischen den Anfragen im Laufe der Zeit zunehmen, bis die Anfrage erfolgreich ist.
Beispielalgorithmus
Ein exponentieller Backoff-Algorithmus wiederholt Anfragen exponentiell und verlängert dabei die Wartezeit zwischen zwei Wiederholungen bis zur maximalen Backoff-Zeit. Beispiel:
- Anfrage an die Google Chat API senden.
- Wenn die Anfrage fehlschlägt, warten Sie 1 +
random_number_millisecondsund wiederholen Sie die Anfrage. - Wenn die Anfrage fehlschlägt, warten Sie 2 +
random_number_millisecondsund wiederholen Sie die Anfrage. - Wenn die Anfrage fehlschlägt, warten Sie 4 +
random_number_millisecondsund wiederholen Sie die Anfrage. - Und so weiter bis zur
maximum_backoff-Zeit. - Das System wartet weiter und führt erneute Versuche bis zu einer maximalen Anzahl an Wiederholungsversuchen aus, jedoch ohne den zeitlichen Abstand zwischen zwei Versuchen zu erhöhen.
Dabei gilt:
- Die Wartezeit beträgt
min(((2^n)+random_number_milliseconds), maximum_backoff), wobeinbei jeder Ausführung (Anfrage) um 1 erhöht wird. random_number_millisecondsist eine zufällige Anzahl von Millisekunden,die kleiner oder gleich 1.000 ist. So lassen sich Situationen vermeiden, in denen viele Clients synchronisiert werden durch eine Situation und alle gleichzeitig Anfragen wiederholen und diese in synchronisierten Wellen senden. Der Wert vonrandom_number_millisecondswird nach jeder Wiederholungsanfrage neu berechnet.maximum_backoffist normalerweise 32 oder 64 Sekunden lang. Der geeignete Wert hängt vom jeweiligen Anwendungsfall ab.
Der Client kann den Vorgang wiederholen, nachdem er die maximum_backoff-Zeit erreicht hat.
Die Backoff-Zeit muss dabei nicht mehr verlängert werden. Wenn ein Client beispielsweise eine maximum_backoff-Zeit von 64 Sekunden verwendet, kann er nach Erreichen dieses Werts alle 64 Sekunden einen neuen Versuch starten. Irgendwann sollten Clients daran gehindert werden, den Vorgang unbegrenzt zu wiederholen.
Die Wartezeit zwischen den Wiederholungen und der Anzahl der Wiederholungen hängt von Ihrem Anwendungsfall und den Netzwerkbedingungen ab.
Kontingenterhöhung pro Projekt anfordern
Abhängig von der Ressourcennutzung Ihres Projekts können Sie eine Kontingent anpassung anfordern. API-Aufrufe durch ein Dienstkonto gelten als Nutzung eines einzelnen Kontos. Wenn Sie ein angepasstes Kontingent beantragen, bedeutet dies nicht, dass Ihr Antrag auch genehmigt wird. Anfragen zur Kontingentanpassung , die den Kontingentwert erheblich erhöhen würden, können länger dauern, bis sie genehmigt werden.
Es gelten nicht für alle Projekte dieselben Kontingente. Wenn Sie Google Cloud im Laufe der Zeit immer häufiger verwenden, müssen Ihre Kontingentwerte möglicherweise erhöht werden. Falls Sie eine deutlich stärkere Auslastung erwarten, können Sie proaktiv eine Anpassung Ihres Kontingents anfordern auf der Seite Kontingente der Google Cloud Console.
Weitere Informationen finden Sie in den folgenden Ressourcen:
- Kontingentanpassungen
- Aktuelle Kontingentnutzung und -limits aufrufen
- Höheres Kontingentlimit anfordern