How Google Search Works

Wie funktioniert die Google-Suche? Hier finden Sie eine kurze und eine lange Antwort auf diese Frage.

Google erhält Informationen von vielen unterschiedlichen Quellen, z. B. von:

  • Webseiten,
  • Inhalten, die von Nutzern eingereicht werden, z. B. in Google My Business und Maps.
  • Bücherscans,
  • öffentlichen Datenbanken im Internet
  • und vielen mehr.

In diesem Artikel beschränken wir uns auf Webseiten.

Die kurze Antwort

Mithilfe der folgenden drei Schritte werden aus Webseiten Suchergebnisse:

Crawlen

Im ersten Schritt wird festgestellt, welche Seiten im Web existieren. Es gibt kein zentrales Verzeichnis aller Webseiten. Deshalb muss Google laufend nach neuen Seiten suchen und sie zu seiner Liste bekannter Seiten hinzufügen. Einige Seiten sind bekannt, da sie schon zuvor von Google aufgerufen wurden. Andere Seiten werden entdeckt, wenn Google einem Link von einer bekannten Seite folgt, der auf eine neue Seite verweist. Wieder andere Seiten werden gefunden, wenn ein Websiteinhaber eine Liste von Seiten – eine sogenannte Sitemap – einreicht, damit sie von Google gecrawlt wird. Wenn Sie einen verwalteten Webhost verwenden, wie Wix oder Blogger, wird Google möglicherweise von diesem Dienst informiert, dass aktualisierte oder neue, von Ihnen erstellte Seiten gecrawlt werden müssen.

Sobald Google eine Seiten-URL erkennt, wird die Seite aufgerufen oder gecrawlt, um den Inhalt der Seite zu ermitteln. Google rendert die Seite und analysiert sowohl textbasierte und nicht textbasierte Inhalte als auch das visuelle Gesamtlayout, um zu entscheiden, wo sie in den Suchergebnissen erscheint. Je besser Google Ihre Website versteht, desto besser können wir sie den Personen zuordnen, die nach Ihren Inhalte suchen.

So verbessern Sie das Crawling für Ihre Website:

  • Sorgen Sie dafür, dass Google auf die Seiten Ihrer Website zugreifen kann und dass sie korrekt aussehen. Google greift als anonymer Nutzer auf das Web zu, also als ein Nutzer ohne Passwörter oder Informationen. Google sollte auch alle Bilder und anderen Elemente der Seite sehen können, um sie richtig zu verstehen. Sie können das schnell prüfen, indem Sie die Seiten-URL in das Tool zum Test auf Optimierung für Mobilgeräte eingeben.
  • Wenn Sie eine einzelne Seite erstellt oder aktualisiert haben, können Sie eine einzelne URL an Google senden. Wenn Sie Google über viele neue oder aktualisierte Seiten gleichzeitig informieren möchten, verwenden Sie eine Sitemap.
  • Wenn Sie bei Google eine Crawling-Anfrage für eine einzelne Seite stellen, sollte es sich am besten um Ihre Startseite handeln. Für Google ist Ihre Startseite die wichtigste Seite Ihrer Website. Damit Ihre Website vollständig gecrawlt werden kann, achten Sie darauf, dass das Navigationssystem Ihrer Startseite (und aller anderen Seiten) Links zu allen wichtigen Bereichen und Seiten Ihrer Website enthält. Hierdurch können Nutzer und Google sich besser auf Ihrer Website zurechtfinden. Bei kleineren Websites (weniger als 1.000 Seiten) genügt es, Google nur auf Ihre Startseite aufmerksam zu machen, vorausgesetzt, Google kann über einen Pfad mit Links, der auf Ihrer Startseite beginnt, auf alle anderen Seiten zugreifen.
  • Es hilft, wenn sich auf einer anderen Seite, die Google bereits kennt, ein Link auf Ihre Seite befindet. Beachten Sie jedoch, dass Links in Anzeigen, Links, für die Sie auf anderen Websites bezahlen, Links in Kommentaren oder andere Links, die nicht den Google-Richtlinien für Webmaster entsprechen, nicht beachtet werden.
Google akzeptiert keine Zahlungen, um eine Website häufiger zu crawlen oder höher einzustufen. Falls Sie etwas anderes gehört haben, sind sie falsch informiert worden.

Indexierung

Nachdem eine Seite gefunden wurde, versucht Google zu verstehen, worum es auf der Seite geht. Dieser Vorgang wird Indexierung genannt. Google analysiert den Inhalt der Seite, katalogisiert die auf der Seite eingebetteten Bilder und Videodateien und versucht anderweitig, die Seite zu verstehen. Diese Informationen werden im Google-Index gespeichert, einer riesigen Datenbank, die aus unzähligen Computern besteht.

So verbessern Sie die Indexierung Ihrer Seiten:

  • Erstellen Sie kurze, aussagekräftige Titel für die Seiten.
  • Verwenden Sie Seitenüberschriften, die das Thema der jeweiligen Seite vermitteln.
  • Verwenden Sie Text statt Bildern, um Inhalte zu vermitteln. Google kann zwar Bilder und Videos einigermaßen verstehen, aber nicht so gut wie Text. Versehen Sie Ihre Videos und Bilder zumindest mit alternativem Text und anderen Attributen.

Aufnahme in die Suchergebnisse und Ranking

Wenn ein Nutzer eine Suchanfrage eingibt, versucht Google, auf der Basis zahlreicher Faktoren die relevanteste Antwort in seinem Index zu finden. Google versucht, die Ergebnisse mit der besten Qualität zu finden und andere Aspekte einzubeziehen, die den höchsten Nutzen und die treffendste Antwort liefern. Dabei werden Umstände beachtet wie der Standort des Nutzers, die Sprache und das verwendete Gerät, d. h. ob auf einem Computer oder Smartphone gesucht wird. Beispielsweise erhält ein Nutzer in Paris, der nach einem "Fahrradreparaturgeschäft" sucht, andere Antworten als ein Nutzer in Hongkong. Google akzeptiert keine Zahlungen, um eine Website höher einzureihen. Das Ranking erfolgt automatisch.

So verbessern Sie Ihre Aufnahme in die Suchergebnisse und das Ranking:

Die lange Antwort

Sie möchten mehr wissen? Bitte schön:

Die lange Antwort

Crawlen

Crawling bezeichnet den Prozess, durch den der Googlebot neue und aktualisierte Seiten aufruft, damit sie dem Google-Index hinzugefügt werden.

Wir setzen unzählige Computer ein, die täglich Milliarden von Webseiten durchsuchen ("crawlen"). Das Programm, das diese Seiten durchsucht, heißt Googlebot. Andere Bezeichnungen für solche Programme sind "Robot", "Bot" und "Spider". Der Googlebot bestimmt anhand eines algorithmischen Prozesses, welche Websites wann und wie oft durchsucht und wie viele Seiten von jeder Website abgerufen werden.

Der Crawling-Prozess von Google beginnt mit einer Liste von Webseiten-URLs, die aus vorhergehenden Crawling-Prozessen stammt und mit Sitemap-Daten von Webmastern vervollständigt wurde. Beim Besuch auf einer Seite findet der Googlebot Links auf der Seite und fügt sie der Liste der zu crawlenden Seiten hinzu. Neue Websites, Änderungen an bestehenden Websites und veraltete Links werden ermittelt und zur Aktualisierung des Google-Indexes verwendet.

Während des Crawlings rendert Google die Seite mit einer aktuellen Version von Chrome. Im Rahmen des Rendering-Prozesses werden alle gefundenen Seitenskripts ausgeführt. Wenn Ihre Website dynamisch generierte Inhalte enthält, sollten Sie sich an die Grundlagen von JavaScript-SEO halten.

Primäres/sekundäres Crawling

Google verwendet zum Crawlen von Websites zwei verschiedene Crawler: einen mobilen und einen Computer-Crawler. Bei jedem der beiden Typen wird simuliert, was passiert, wenn ein Nutzer Ihre Seite mit einem Gerät dieses Typs besucht.

Google verwendet einen Crawler-Typ (Mobilgerät oder Computer) als primären Crawler für Ihre Website. Alle Seiten Ihrer Website, die von Google gecrawlt werden, werden mit dem primären Crawler gecrawlt. Der primäre Crawler für alle neuen Websites ist der mobile.

Außerdem crawlt Google einige Seiten Ihrer Website mit dem anderen Crawler-Typ (Mobilgerät oder Computer) noch einmal. Das wird als sekundäres Crawling bezeichnet und dient dazu, festzustellen, wie gut Ihre Website mit dem anderen Gerätetyp funktioniert.

Wie entscheidet Google, welche Seiten nicht gecrawlt werden?

  • Seiten, die über robots.txt gesperrt sind, werden nicht gecrawlt, werden aber möglicherweise indexiert, wenn ein Link von einer anderen Seite auf sie verweist. Google kann mithilfe eines Links, der auf eine Seite verweist, Rückschlüsse auf den Inhalt dieser Seite ziehen und sie indexieren, ohne ihren Inhalt zu parsen.
  • Google kann nur Seiten crawlen, die auch für anonyme Nutzer zugänglich sind. Deshalb können keine Seiten gecrawlt werden, für die eine Anmeldung erforderlich ist oder eine anderweitige Zugriffsbeschränkung besteht.
  • Seiten, die bereits gecrawlt wurden und als Duplikate einer anderen Seite eingestuft werden, werden seltener gecrawlt.

So verbessern Sie das Crawling für Ihre Website

Mit den folgenden Methoden können Sie gewährleisten, dass Google die richtigen Seiten Ihrer Website findet.

Indexierung

Der Googlebot verarbeitet jede gecrawlte Seite, um den Inhalt der Seite zu erkennen. Dazu gehört die Verarbeitung von Textinhalten, wichtigen Inhalts-Tags und Attributen wie <title>-Tags und ALT-Attributen, Bildern, Videos und mehr. Der Googlebot kann viele verschiedene Inhaltstypen verarbeiten, aber nicht alle. Beispielsweise können wir den Inhalt einiger Rich Media-Dateien nicht verarbeiten.

Zwischen dem Crawlen und dem Indexieren ermittelt Google, ob eine Seite ein Duplikat oder kanonisch ist. Wird die Seite als Duplikat eingestuft, wird sie viel seltener gecrawlt. Ähnliche Seiten werden in einem Dokument gruppiert. Dabei handelt es sich um eine Gruppe mit mindestens einer Seite, die die kanonische Seite (die repräsentativste Seite der Gruppe) und alle gefundenen Duplikate enthält (die alternative URLs für dieselbe Seite oder alternative mobile bzw. Desktopversionen derselben Seite sein können).

Beachten Sie, dass Google Seiten mit einer noindex-Anweisung (Header oder Tag) nicht indexiert. Der Googlebot muss jedoch in der Lage sein, die Anweisung zu sehen. Wenn die Seite von einer robots.txt-Datei, einer Anmeldeseite oder anderweitig blockiert wird, ist es möglich, dass die Seite indexiert wird, selbst wenn Google sie nicht besucht hat.

So verbessern Sie die Indexierung Ihrer Webseiten

Es gibt viele Methoden, um Google zu helfen, den Inhalt Ihrer Seite zu verstehen:

Was ist ein "Dokument"?

Intern stellt Google das Web als (riesige) Menge an Dokumenten dar. Jedes Dokument repräsentiert eine oder mehrere Webseiten. Diese Seiten sind entweder identisch oder sehr ähnlich, haben aber im Wesentlichen denselben Inhalt, auf den über verschiedene URLs zugegriffen werden kann. Die verschiedenen URLs in einem Dokument können zu genau derselben Seite führen (z. B. können example.com/kleider/sommer/1234 und example.com?produkt=1234 dieselbe Seite anzeigen) oder derselben Seite mit kleinen Variationen, die für Nutzer auf verschiedenen Geräten (z. B. example.com/meineseite für Desktop-Nutzer und m.example.com/meineseite für mobile Nutzer) bestimmt ist.

Google wählt eine der URLs in einem Dokument aus und definiert sie als kanonische URL des Dokuments. Die kanonische URL des Dokuments ist die URL, die Google am häufigsten crawlt und indexiert. Die anderen URLs gelten als Duplikate oder Alternativen und können gelegentlich gecrawlt oder entsprechend der Nutzeranfrage bereitgestellt werden. Wenn z. B. die kanonische URL des Dokuments die mobile URL ist, wird Google wahrscheinlich weiterhin die Desktop-URL (alternative URL) für Nutzer bereitstellen, die auf einem Computer suchen.

In den meisten Berichten in der Search Console werden Daten der kanonischen URL des Dokuments zugeordnet. Einige Tools, z. B. das "URL-Prüftool", unterstützen das Testen alternativer URLs. Die Überprüfung der kanonischen URL sollte jedoch auch Informationen zu den alternativen URLs liefern.

Sie können Google mitteilen, welche URL Ihrer Meinung nach die kanonische URL ist, aber Google kann aus verschiedenen Gründen eine andere kanonische URL auswählen.

Im Folgenden finden Sie eine Übersicht über die Begriffe und ihre Verwendung in der Search Console:

  • Dokument: Eine Sammlung ähnlicher Seiten. Verfügt über eine kanonische URL und möglicherweise über alternative URLs, wenn Ihre Website doppelte Seiten aufweist. Die URLs im Dokument können von derselben oder einer anderen Organisation stammen (die Stammdomain, z. B. "google" in www.google.com). Google wählt die beste URL, die in den Suchergebnissen angezeigt werden soll, nach Plattform (mobil/Computer), Sprache des Nutzers oder Standort und vielen anderen Variablen aus. Google erkennt verwandte Seiten auf Ihrer Website durch organisches Crawlen oder durch von der Website implementierte Funktionen wie Weiterleitungen oder <link rel=alternate/canonical>-Tags. Ähnliche Seiten in anderen Organisationen können nur dann als alternative Seiten gekennzeichnet werden, wenn sie von Ihrer Website explizit codiert sind (durch Weiterleitungen oder Link-Tags).
  • URL: Die URL, über die auf einen bestimmten Inhalt einer Website zugegriffen wird. Die Website kann verschiedene URLs derselben Seite zuordnen.
  • Seite: Eine bestimmte Webseite, auf die über eine oder mehrere URLs zugegriffen wird. Je nach Plattform des Nutzers (Mobilgerät, Computer, Tablet usw.) gibt es verschiedene Versionen einer Seite.
  • Version: Eine Variante der Seite, die in der Regel als "Mobil", "Computer" und "AMP" kategorisiert wird. AMP kann jedoch auch mobile und Desktopversionen haben. Jede Version kann je nach Ihrer Websitekonfiguration eine weitere URL (example.com im Vergleich zu m.example.com) oder dieselbe URL haben. Wenn Ihre Website dynamische Bereitstellung oder responsives Webdesign verwendet, können mit derselben URL verschiedene Versionen derselben Seite aufgerufen werden. Sprachvarianten gelten nicht als unterschiedliche Versionen, sondern als unterschiedliche Dokumente.
  • Kanonische Seite oder URL: Die URL, die Google als die repräsentativste des Dokuments betrachtet. Google crawlt diese URL immer. Doppelte URLs im Dokument werden gelegentlich auch gecrawlt.
  • Alternative/doppelte Seite oder URL: Die Dokument-URL, die Google gelegentlich crawlt. Google stellt diese URLs auch bereit, wenn sie für den Nutzer und die Anfrage geeignet sind. So wird beispielsweise eine alternative URL für Desktop-Nutzer anstelle einer kanonischen mobilen URL für Desktop-Anfragen bereitgestellt.
  • Website: Wird normalerweise für eine konzeptionell verbundene Gruppe von Webseiten verwendet, manchmal aber auch als Synonym für eine Search Console-Property, obwohl eine Property auch nur als Teil einer Website definiert werden kann. Eine Website kann Subdomains und sogar Organisationen umfassen, die über richtig miteinander verknüpfte AMP-Seiten verfügen.

Seiten mit demselben Inhalt in verschiedenen Sprachen werden in verschiedenen Dokumenten gespeichert, die mithilfe von hreflang-Tags aufeinander verweisen. Aus diesem Grund ist es wichtig, hreflang-Tags für übersetzte Inhalte zu verwenden.

Ergebnisse bereitstellen

Gibt ein Nutzer eine Suchanfrage ein, durchsuchen unsere Computer den Index nach übereinstimmenden Seiten und geben die Ergebnisse zurück, die unserer Meinung nach am relevantesten für den Nutzer sind. Die Relevanz wird von Hunderten von Faktoren bestimmt und wir arbeiten laufend an der Verbesserung unseres Algorithmus. Google berücksichtigt bei der Auswahl und beim Ranking der Ergebnisse die Nutzerfreundlichkeit. Achten Sie deshalb darauf, dass Ihre Seite schnell geladen wird und für Mobilgeräte optimiert ist.

So verbessern Sie die Aufnahme Ihrer Seite in die Suchergebnisse

Eine noch längere Antwort

Hier finden Sie eine noch längere Antwort auf die Frage, wie die Google-Suche funktioniert, einschließlich Bildern und Videos.