Bestimmt eure kanonische URL

Freitag, 13. Februar 2009

Duplicate Content-Sorgen ade: Wir unterstützen jetzt ein Format, das es euch erlaubt, die bevorzugte Version eurer URLs bekanntzugeben. Falls eure Site gleichen oder sehr ähnlichen Content über verschiedene URLs verfügbar macht, bekommt ihr mit diesem Format eine größere Kontrolle darüber, welche URL in den Suchergebnissen angezeigt wird. Außerdem hilft dieses Format dabei, dass verschiedene Eigenschaften, wie z. B. die Linkpopularität, auf eure bevorzugte Version zusammengefasst werden.

Hier haben wir unser altes Beispiel einer Site, die schwedische Süßigkeiten verkauft . Stellt euch vor, dass eure bevorzugte Version der URL so aussieht:

https://www.example.com/product.php?item=swedish-fish

Eure User (und Googlebot) können die Seite jedoch über mehrere verschiedene (und nicht so simple) URLs erreichen. Selbst wenn die wesentlichen Informationen hinter diesen URLs die gleichen sind wie in eurer bevorzugten Version, kann es bei diesen anderen Versionen kleine Abweichungen im Content geben, die beispielsweise durch Sortierungsparameter oder die Kategorienavigation bedingt sind:

https://www.example.com/product.php?item=swedish-fish&category=gummy-candy
Oder es liegt gänzlich identischer Content vor, der aber verschiedene URLs aufgrund von Tracking-Parametern oder Session-IDs besitzt:

https://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678

Jetzt könnt ihr einfach einen <link> -Tag hinzufügen, um eure bevorzugte Version zu kennzeichnen:

<link rel="canonical" href="https://www.example.com/product.php?item=swedish-fish" />

Fügt dies in den <head> -Abschnitt eurer URLs mit dem Duplicate Content ein:
https://www.example.com/product.php?item=swedish-fish&category=gummy-candy
https://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678


Google wird nun erkennen, dass sich die Duplikate alle auf eine kanonische URL beziehen: https://www.example.com/product.php?item=swedish-fish . Alle weiteren URL-Eigenschaften, wie z. B. PageRank oder ähnliche Signale, werden ebenfalls auf die kanonische URL übertragen.

Dieser Standard kann von jeder Suchmaschine übernommen werden, die eure Site crawlt und indexiert.

Natürlich habt ihr vielleicht noch weitere Fragen. Joachim Kupke , Software-Ingenieur in unserem Indexing-Team, kann euch schon mal einige Antworten geben:

Ist rel="canonical" ein Hinweis oder eine Anweisung?
Es ist ein Hinweis, den wir sehr streng befolgen. In Verbindung mit weiteren Signalen werden wir eure bevorzugte Version in Betracht ziehen, wenn wir die relevanteste Seite zu einer bestimmten Suchanfrage ermitteln.

Kann ich einen relativen Pfad verwenden, um meine kanonische URL zu kennzeichnen, wie z. B. <link rel="canonical" href="product.php?item=swedish-fish" /> ?
Ja, relative Pfade werden erwartungsgemäß mit dem <link> -Tag unterstützt. Falls ihr einen <base> -Link in eurem Dokument aufgenommen habt, werden alle relativen Pfade anhand der <base>-URL aufgelöst.

Ist es in Ordnung, wenn die kanonische URL keine 100%-ige Kopie der Duplicate Content-URLs ist?
Wir tolerieren gewisse geringe Unterschiede - wenn z. B. die Sortierreihenfolge in einer Tabelle mit Produkten verschieden ist. Ebenso wissen wir, dass wir die kanonische URL und die Duplikate möglicherweise zu verschiedenen Zeitpunkten crawlen, so dass sich der Inhalt gegebenenfalls geringfügig unterscheidet. Dies ist vollkommen in Ordnung.

Was passiert, falls die rel="canonical"-URL einen 404-Fehler liefert?
Wir werden damit fortfahren euren Content zu indexieren und eine Heuristik anwenden, um die kanonische URL zu ermitteln. Wir empfehlen jedoch, für die kanonische URL eine tatsächlich existierende URL zu wählen.

Was passiert, falls die ref="canonical"-URL noch nicht indexiert wurde?
Wie mit allem öffentlich zugänglichem Content sind wir bemüht, eine benannte kanonische URL möglichst schnell zu finden und zu crawlen. Sobald diese indexiert wurde, werden wir den rel="canonical"-Hinweis unmittelbar in Betracht ziehen.

Kann es sich bei der rel="canonical"-URL um eine Weiterleitung handeln?
Ja, ihr könnt eine URL mit Weiterleitung als kanonische URL angeben. Wir werden die Weiterleitung dann wie gewöhnlich verarbeiten und versuchen, die URL zu indexieren.

Was passiert, wenn ich widersprüchliche rel="canonical"-Angaben mache?
Unser Algorithmus ist nachsichtig: Wir können Ketten von kanoischen Angaben folgen, jedoch empfehlen wir, dass ihr eure Links dahingehend updated, dass sie auf eine eindeutige kanonische URL verweisen, um die besten Ergebnisse zu gewährleisten.

Kann dieser Link-Tag dazu verwendet werden, um eine kanonische URL auf einer vollkommen verschiedenen Domain zu benennen?
Nein, um auf eine vollkommen verschiedene Domain zu verweisen, solltet ihr permanente Weiterleitungen (301) verwenden. Wir berücksichtigen momentan Angaben zur kanonischen URL auf Subdomains (also innerhalb einer Domain), aber nicht über verschiedene Domains hinweg. Ihr könnt also z. B. www.example.com vs. example.com vs. help.example.com verwenden, nicht jedoch example.com vs. example-widgets.com .

Klingt super - gibt's schon Beispiele?
Ja - wikia.com hat uns bei unseren Tests unterstützt. So könnt ihr beispielsweise im Quelltext der URL https://starwars.wikia.com/wiki/Nelvana_Limited erkennen, dass eine rel="canonical"-URL angegeben wurde: https://starwars.wikia.com/wiki/Nelvana .

Beide URLs sind fast identisch, mit der Ausnahme, dass die erste URL (also "Nelvana_Limited") eine kurze Nachricht im oberen Bereich enthält. Das ist ein gutes Beispiel für dieses neue Feature. Mittels rel="canonical" wurden die Eigenschaften der beiden URLs konsolidiert und in den Suchergebnissen taucht die von wikia.com bevorzugte Version auf.

Falls ihr weitere Fragen habt, könnt ihr diese gern als Kommentar hinterlassen. Und falls es euch nicht möglich ist, eine kanonische URL in eure Seiten einzubauen: Keine Sorge - davon unabhängig bemühen uns, eure bevorzuge Version im Fall von Duplicate Content zu ermitteln und alle Link-Eigenschaften entsprechend zu übertragen. So, wie wir das schon früher gemacht haben .

Post von Joachim Kupke, Senior Software Engineer, und Maile Ohye, Developer Programs Tech Lead (Übersetzung von Sven, Search Quality)