So funktioniert die Google Suche

Wie funktioniert die Google Suche? Hier findest du eine kurze und eine lange Antwort auf diese Frage.

Google erhält Informationen von vielen unterschiedlichen Quellen, z. B. von

  • Webseiten,
  • Inhalten, die von Nutzern eingereicht werden, z. B. in Google My Business und Maps,
  • Bücherscans,
  • öffentlichen Datenbanken im Internet
  • und vielen mehr.

In diesem Artikel beschränken wir uns auf Webseiten.

Die kurze Antwort

Mithilfe der folgenden drei Schritte werden aus Webseiten Suchergebnisse:

Crawling

Im ersten Schritt wird festgestellt, welche Seiten im Web existieren. Es gibt kein zentrales Verzeichnis aller Webseiten. Deshalb muss Google laufend nach neuen Seiten suchen und sie seiner Liste bekannter Seiten hinzufügen. Einige Seiten sind bekannt, da sie schon zuvor von Google aufgerufen wurden. Andere Seiten werden entdeckt, wenn Google einem Link von einer bekannten Seite folgt, der auf eine neue Seite verweist. Wieder andere Seiten werden gefunden, wenn ein Websiteinhaber eine Liste von Seiten – eine sogenannte Sitemap – einreicht, damit sie von Google gecrawlt wird. Wenn du einen verwalteten Webhost verwendest, wie Wix oder Blogger, wird Google möglicherweise von diesem Dienst informiert, dass aktualisierte oder neue, von dir erstellte Seiten gecrawlt werden müssen.

Sobald Google eine Seiten-URL erkennt, wird die Seite aufgerufen oder gecrawlt, um den Inhalt der Seite zu ermitteln. Google rendert die Seite und analysiert sowohl textbasierte und nicht textbasierte Inhalte als auch das visuelle Gesamtlayout, um zu entscheiden, wo sie in den Suchergebnissen erscheint. Je besser Google deine Website versteht, desto besser können wir sie den Personen zuordnen, die nach deinen Inhalten suchen.

So kannst du das Crawling für deine Website verbessern:

  • Sorge dafür, dass Google auf die Seiten deiner Website zugreifen kann und dass sie korrekt aussehen. Google greift als anonymer Nutzer auf das Web zu, also als ein Nutzer ohne Passwörter oder Informationen. Google sollte auch alle Bilder und anderen Elemente der Seite sehen können, um sie richtig zu verstehen. Du kannst das schnell prüfen, indem du die Seiten-URL in das Tool zum Test auf Optimierung für Mobilgeräte eingibst.
  • Wenn du eine einzelne Seite erstellt oder aktualisiert hast, kannst du eine einzelne URL an Google senden. Wenn du Google über viele neue oder aktualisierte Seiten gleichzeitig informieren möchtest, verwende eine Sitemap.
  • Wenn du bei Google eine Crawling-Anfrage für eine einzelne Seite stellst, sollte es sich am besten um deine Startseite handeln. Für Google ist deine Startseite die wichtigste Seite deiner Website. Damit deine Website vollständig gecrawlt werden kann, achte darauf, dass das Navigationssystem deiner Startseite (und aller anderen Seiten) Links zu allen wichtigen Bereichen und Seiten der Website enthält. Hierdurch können Nutzer und Google sich besser auf deiner Website zurechtfinden. Bei kleineren Websites (weniger als 1.000 Seiten) genügt es, Google nur auf deine Startseite aufmerksam zu machen – vorausgesetzt, Google kann über einen Pfad mit Links, der auf deiner Startseite beginnt, auf alle anderen Seiten zugreifen.
  • Es hilft, wenn sich auf einer anderen Seite, die Google bereits kennt, ein Link auf deine Seite befindet. Beachte jedoch, dass Links in Anzeigen, Links, für die du auf anderen Websites bezahlst, Links in Kommentaren oder andere Links, die nicht den Google-Richtlinien für Webmaster entsprechen, nicht beachtet werden.
Google akzeptiert keine Zahlungen, um eine Website häufiger zu crawlen oder höher einzustufen. Falls du etwas anderes gehört hast, bist du falsch informiert worden.

Indexierung

Nachdem eine Seite gefunden wurde, versucht Google zu verstehen, worum es auf der Seite geht. Dieser Vorgang wird Indexierung genannt. Google analysiert den Inhalt der Seite, katalogisiert die auf der Seite eingebetteten Bilder und Videodateien und versucht auch anderweitig, die Seite zu verstehen. Diese Informationen werden im Google-Index gespeichert, einer riesigen Datenbank, die aus unzähligen Computern besteht.

So kannst du die Indexierung deiner Seiten verbessern:

  • Erstelle kurze, aussagekräftige Titel für die Seiten.
  • Verwenden Sie Seitenüberschriften, die das Thema der jeweiligen Seite vermitteln.
  • Verwende Text statt Bildern, um Inhalte zu vermitteln. Google kann zwar Bilder und Videos einigermaßen verstehen, aber nicht so gut wie Text. Versieh deine Videos und Bilder zumindest mit alternativem Text und anderen Attributen.

Aufnahme in die Suchergebnisse und Ranking

Wenn ein Nutzer eine Suchanfrage eingibt, versucht Google, auf der Basis zahlreicher Faktoren die relevanteste Antwort in seinem Index zu finden. Google versucht, die Ergebnisse mit der besten Qualität zu finden und andere Aspekte einzubeziehen, die den höchsten Nutzen und die treffendste Antwort liefern. Dabei werden Umstände beachtet wie der Standort des Nutzers, die Sprache und das verwendete Gerät, also ob auf einem Computer oder Smartphone gesucht wird. Beispielsweise erhält ein Nutzer in Paris, der nach einem „Fahrradreparaturgeschäft“ sucht, andere Antworten als ein Nutzer in Hongkong. Google akzeptiert keine Zahlungen, um eine Website höher einzureihen. Das Ranking erfolgt automatisch.

So kannst du die Aufnahme in die Suchergebnisse und das Ranking verbessern:

Die lange Antwort

Du möchtest mehr wissen? Bitte schön:

Die lange Antwort

Crawling

Crawling bezeichnet den Prozess, durch den der Googlebot neue und aktualisierte Seiten aufruft, damit sie dem Google-Index hinzugefügt werden.

Wir setzen unzählige Computer ein, die täglich Milliarden von Webseiten durchsuchen („crawlen“). Das Programm, das diese Seiten durchsucht, heißt Googlebot. Andere Bezeichnungen für solche Programme sind „Robot“, „Bot“ und „Spider“. Der Googlebot bestimmt anhand eines algorithmischen Prozesses, welche Websites wann und wie oft durchsucht und wie viele Seiten von jeder Website abgerufen werden.

Der Crawling-Prozess von Google beginnt mit einer Liste von Webseiten-URLs, die aus vorhergehenden Crawling-Prozessen stammt und mit Sitemap-Daten von Websiteinhabern vervollständigt wurde. Beim Besuch auf einer Seite findet der Googlebot Links auf der Seite und nimmt sie in die Liste der zu crawlenden Seiten auf. Neue Websites, Änderungen an bestehenden Websites und veraltete Links werden ermittelt und zur Aktualisierung des Google-Indexes verwendet.

Während des Crawlings rendert Google die Seite mit einer aktuellen Version von Chrome. Im Rahmen des Rendering-Prozesses werden alle gefundenen Seitenskripts ausgeführt. Wenn deine Website dynamisch generierte Inhalte enthält, solltest du dich an die Grundlagen von JavaScript-SEO halten.

Primäres/sekundäres Crawling

Google verwendet zum Crawlen von Websites zwei verschiedene Crawler: einen mobilen und einen Computer-Crawler. Bei jedem der beiden Typen wird simuliert, was passiert, wenn ein Nutzer deine Seite mit einem Gerät dieses Typs besucht.

Google verwendet einen Crawler-Typ (Mobilgerät oder Computer) als primären Crawler für deine Website. Alle Seiten deiner Website, die Google crawlt, werden mit dem primären Crawler gecrawlt. Der primäre Crawler für alle neuen Websites ist der mobile.

Außerdem crawlt Google einige Seiten deiner Website mit dem anderen Crawler-Typ (Mobilgerät oder Computer) noch einmal. Das wird als sekundäres Crawling bezeichnet und dient dazu, festzustellen, wie gut deine Website mit dem anderen Gerätetyp funktioniert.

Wie entscheidet Google, welche Seiten nicht gecrawlt werden?

  • Seiten, die über robots.txt gesperrt sind, werden nicht gecrawlt, werden aber möglicherweise indexiert, wenn ein Link von einer anderen Seite auf sie verweist. Google kann mithilfe eines Links, der auf eine Seite verweist, Rückschlüsse auf den Inhalt dieser Seite ziehen und sie indexieren, ohne ihren Inhalt zu parsen.
  • Google kann nur Seiten crawlen, die auch für anonyme Nutzer zugänglich sind. Deshalb können keine Seiten gecrawlt werden, für die eine Anmeldung erforderlich ist oder eine anderweitige Zugriffsbeschränkung besteht.
  • Seiten, die bereits gecrawlt wurden und als Duplikate einer anderen Seite eingestuft werden, werden seltener gecrawlt.

So kannst du das Crawling für deine Website verbessern

Mit den folgenden Methoden kannst du dazu beitragen, dass Google die richtigen Seiten deiner Website findet.

Indexierung

Der Googlebot verarbeitet jede gecrawlte Seite, um den Inhalt der Seite zu verstehen. Dazu gehört die Verarbeitung von Textinhalten, wichtigen Inhalts-Tags und Attributen wie <title>-Tags und ALT-Attributen, Bildern, Videos und mehr. Der Googlebot kann viele verschiedene Inhaltstypen verarbeiten, aber nicht alle. Beispielsweise können wir den Inhalt einiger Rich Media-Dateien nicht verarbeiten.

Zwischen dem Crawlen und dem Indexieren ermittelt Google, ob eine Seite ein Duplikat oder kanonisch ist. Wird die Seite als Duplikat eingestuft, wird sie viel seltener gecrawlt. Ähnliche Seiten werden in einem Dokument gruppiert. Dabei handelt es sich um eine Gruppe mit mindestens einer Seite, die die kanonische Seite (die repräsentativste Seite der Gruppe) und alle gefundenen Duplikate enthält. Diese können alternative URLs für dieselbe Seite oder alternative mobile bzw. Desktopversionen derselben Seite sein.

Seiten mit einer noindex-Anweisung (als Header oder Tag) werden von Google nicht indexiert. Der Googlebot muss jedoch in der Lage sein, die Anweisung zu sehen. Wenn die Seite von einer robots.txt-Datei, einer Anmeldeseite oder anderweitig blockiert wird, ist es möglich, dass die Seite indexiert wird, selbst wenn Google sie nicht besucht hat.

So kannst du die Indexierung deiner Seiten verbessern

Es gibt viele Methoden, um Google zu helfen, den Inhalt deiner Seite besser zu verstehen:

Was ist ein „Dokument“?

Intern stellt Google das Web als (riesige) Menge an Dokumenten dar. Jedes Dokument repräsentiert eine oder mehrere Webseiten. Diese Seiten sind entweder identisch oder sehr ähnlich, haben aber im Wesentlichen denselben Inhalt, auf den über verschiedene URLs zugegriffen werden kann. Die verschiedenen URLs in einem Dokument können zu genau derselben Seite führen, also z. B. können beispiel.de/kleider/sommer/1234 und beispiel.de?produkt=1234 dieselbe Seite anzeigen. Oder sie führen zur selben Seite mit kleinen Variationen, die für Nutzer auf verschiedenen Geräten bestimmt ist, etwa beispiel.de/meineseite für Computernutzer und m.beispiel.de/meineseite für Mobilgerätenutzer.

Google wählt eine der URLs in einem Dokument aus und definiert sie als kanonische URL des Dokuments. Die kanonische URL des Dokuments ist die URL, die Google am häufigsten crawlt und indexiert. Die anderen URLs gelten als Duplikate oder Alternativen und können gelegentlich gecrawlt oder entsprechend der Nutzeranfrage bereitgestellt werden. Wenn z. B. die kanonische URL des Dokuments die mobile URL ist, wird Google wahrscheinlich trotzdem die Desktop-URL (alternative URL) für Nutzer bereitstellen, die auf einem Computer suchen.

In den meisten Berichten in der Search Console werden Daten der kanonischen URL des Dokuments zugeordnet. Einige Tools, z. B. das URL-Prüftool, unterstützen das Testen alternativer URLs. Die Überprüfung der kanonischen URL sollte jedoch auch Informationen zu den alternativen URLs liefern.

Du kannst Google mitteilen, welche URL deiner Meinung nach die kanonische URL ist, aber Google kann aus verschiedenen Gründen eine andere kanonische URL auswählen.

Im Folgenden findest du eine Übersicht über die Begriffe und ihre Verwendung in der Search Console:

  • Dokument: Eine Sammlung ähnlicher Seiten. Verfügt über eine kanonische URL und möglicherweise über alternative URLs, wenn es auf deiner Website doppelte Seiten gibt. Die URLs im Dokument können von derselben oder einer anderen Organisation stammen (die Stammdomain, z. B. „google“ in www.google.com). Google wählt die beste URL, die in den Suchergebnissen angezeigt werden soll, nach Plattform (mobil/Computer), Sprache oder Standort des Nutzers und vielen anderen Variablen aus. Google erkennt verwandte Seiten auf deiner Website durch organisches Crawlen oder durch von der Website implementierte Funktionen wie Weiterleitungen oder <link rel=alternate/canonical>-Tags. Ähnliche Seiten in anderen Organisationen können nur dann als alternative Seiten gekennzeichnet werden, wenn sie von deiner Website explizit codiert sind (durch Weiterleitungen oder Link-Tags).
  • URL: Die URL, über die auf einen bestimmten Inhalt einer Website zugegriffen wird. Die Website kann verschiedene URLs derselben Seite zuordnen.
  • Seite: Eine bestimmte Webseite, auf die über eine oder mehrere URLs zugegriffen wird. Je nach Plattform des Nutzers (Mobilgerät, Computer, Tablet usw.) gibt es verschiedene Versionen einer Seite.
  • Version: Eine Variante der Seite, die in der Regel als „Mobil“, „Desktop“ oder „AMP“ kategorisiert wird. AMP kann jedoch auch mobile und Desktopversionen haben. Je nach deiner Websitekonfiguration kann jede Version eine andere URL (beispiel.de im Vergleich zu m.beispiel.de) oder dieselbe URL haben. Wenn deine Website dynamische Bereitstellung oder responsives Webdesign verwendet, können mit derselben URL verschiedene Versionen derselben Seite aufgerufen werden. Sprachvarianten gelten nicht als unterschiedliche Versionen, sondern als unterschiedliche Dokumente.
  • Kanonische Seite oder URL: Die URL, die Google als die repräsentativste des Dokuments betrachtet. Google crawlt diese URL immer. Doppelte URLs im Dokument werden gelegentlich auch gecrawlt.
  • Alternative/doppelte Seite oder URL: Die Dokument-URL, die Google gelegentlich crawlt. Google stellt diese URLs auch bereit, wenn sie für den Nutzer und die Anfrage geeignet sind. So wird beispielsweise bei Anfragen auf einem Computer eine alternative URL für Computernutzer anstelle einer kanonischen mobilen URL bereitgestellt.
  • Website: Wird normalerweise für eine konzeptionell verbundene Gruppe von Webseiten verwendet, manchmal aber auch als Synonym für eine Search Console-Property, obwohl eine Property auch nur als Teil einer Website definiert werden kann. Eine Website kann Subdomains und sogar Domains für richtig verknüpfte AMP-Seiten umfassen.

 Seiten mit demselben Inhalt in verschiedenen Sprachen werden in verschiedenen Dokumenten gespeichert, die mithilfe von hreflang-Tags aufeinander verweisen. Aus diesem Grund ist es wichtig, hreflang-Tags für übersetzte Inhalte zu verwenden.

Bereitstellung der Ergebnisse

Gibt ein Nutzer eine Suchanfrage ein, durchsuchen unsere Computer den Index nach übereinstimmenden Seiten und geben die Ergebnisse zurück, die unserer Meinung nach am relevantesten für den Nutzer sind. Die Relevanz wird von Hunderten von Faktoren bestimmt und wir arbeiten laufend an der Verbesserung unseres Algorithmus. Google berücksichtigt bei der Auswahl und beim Ranking der Ergebnisse die Nutzerfreundlichkeit. Achte deshalb darauf, dass deine Seite schnell geladen wird und für Mobilgeräte optimiert ist.

So kannst du die Aufnahme deiner Seiten in die Suchergebnisse verbessern

  • Sollten sich deine Ergebnisse an Nutzer in einer bestimmten geografischen Region oder mit einer bestimmten Sprache richten, kannst du Google deine Präferenzen mitteilen.
  • Deine Seiten müssen sich schnell laden lassen und für Mobilgeräte optimiert sein.
  • Beachte die Richtlinien für Webmaster, um häufige Fehler zu vermeiden und deine Website so zu gestalten, dass sich ihr Ranking verbessern kann.
  • Erwäge die Implementierung von Suchergebnisfunktionen für deine Website, wie Rezept- oder Artikelkarten.
  • Implementiere AMP, damit die Seiten auf Mobilgeräten schneller geladen werden. Für manche AMP-Seiten stehen auch zusätzliche Suchfunktionen zur Verfügung, wie das Schlagzeilen-Karussell.
  • Der Algorithmus von Google wird laufend verbessert. Anstatt zu versuchen, den Algorithmus zu erraten und deine Seite dafür zu entwerfen, solltest du gute, aktuelle Inhalte bieten, die Nutzer interessieren. Außerdem solltest du dabei unseren Richtlinien folgen.

Eine noch längere Antwort

Hier findest du eine noch längere Antwort auf die Frage, wie die Google Suche funktioniert, einschließlich Bildern und Videos.