Behandlung von Duplicated Content mittels Canonical Tag

Behandlung von Duplicated Content mittels Canonical Tag

Trackback URL

Wie Sie die Kanonische URL in contentXXL sinnvoll nutzen

 

contentXXL bietet Ihnen die Möglichkeit Duplicated Content durch den Einsatz einer Canonical URL zu behandeln und so die Rankingsignale für Ihre Seite zu verbessern.

Der nachfolgende Artikel erläutert die Hintergründe, wie Duplicated Content entsteht, warum dieser vermieden werden sollte und welche Maßnahmen hierzu geeignet sind. Hierbei liegt der Schwerpunkt auf der Anwendung der Kanonischen URL sowie den entsprechenden Einstellungen in unserem Content Management System.

 

Vor dem Hintergrund der Bedeutung von Suchmaschinen – in Deutschland in allererster Linie Google – stellt sich für jeden Webmaster die Frage, wie die Inhalte der Seite bestmöglich für die Indizierung im Google Index aufbereitet werden können. Hierbei ist zwangsläufig auch die Auseinandersetzung mit dem Thema Duplicated Content nötig.

 

Was ist Duplicated Content?

Eine Antwort hierzu findet man direkt in der Search Console Hilfe von Google:

"Duplizierter Content sind im Allgemeinen umfangreiche Contentblöcke, die anderem Content auf derselben oder einer anderen Domain entsprechen oder auffällig ähneln“

Die Definition zeigt bereits, dass hier zwischen den beiden Formen „interner Duplicated Content“, d.h. duplizierte Inhalte auf der gleichen Domain, und „externer Duplicated Content“, d.h. duplizierte Inhalte auf unterschiedlichen Domains, unterschieden werden muss.

 

Wie kommt es zu duplizierten Inhalten?

Die Gründe für die Entstehung von doppelten Inhalten können vielfältig sein: Während externer Duplicated Content insbesondere durch die Syndizierung der eigenen Inhalte auf fremden Seiten (oder durch das Kopieren von Inhalten einer Seite) entsteht, gibt es für die Entstehung von internen Duplicated Content eine Vielzahl möglicher Gründe.

Dass identische Inhalte unter verschiedenen URLs der gleichen Domain vorkommen, kann z.B. folgende Ursachen haben:

  • Eine Website ist mit oder ohne führendes www. erreichbar
  • Eine Website ist mit oder ohne abschließenden Slash (Trailing Slash) erreichbar
  • Ein Aufruf ist auch mit Großbuchstaben möglich (und es gibt entsprechende Variationen in der Verlinkung)
  • Inhalte werden mittels Sortierparameter nur in eine andere Reihenfolge gebracht
  • Es existieren mehrere Versionen von Seiten bzw. Inhalten, z.B. eine Druckversion, eine eigene Mobilversion oder ähnliches.

Zudem kann Duplicated Content im Rahmen von Mehrfachveröffentlichungen entstehen, z.B. wenn ein und derselbe Inhalt auf verschiedene Seiten oder in verschiedene Kategorien veröffentlicht wird. Auch umfangreiche Textbausteine können dabei von Bedeutung sein.

Im Rahmen von Content Management Systemen, sind gerade flexible Mehrfachveröffentlichungen ein wichtiger Vorteil – Inhalte lassen sich so bequem verteilen und die CMS-Nutzer reduzieren ihren Aufwand in der Produktion -, sie sollten jedoch gegebenenfalls zur Vermeidung von internem Duplicated Content entsprechend behandelt werden.

 

Was ist eigentlich das Problem mit Duplicated Content?

Im Google Support findet sich hierzu folgende Aussage: „Google ist sehr darum bemüht, Seiten mit unterschiedlichen Informationen zu indizieren und anzuzeigen.“ Im Klartext heißt das, dass ein und derselbe Inhalt nicht zweimal in den Suchergebnissen erscheinen soll.

 

Problem von externem Duplicated Content

Zumindest die Gefahr von externen Duplicated Content wird hierdurch bereits ersichtlich. Google wird hier – nach eigener Aussage -  die Seite anzeigen, die am passendsten für die Suchanfrage erscheint. Und dies könnte möglicherweise nicht Ihre Seite sein. Die syndizierten Inhalte sollten aus diesem Grund immer einen Link auf die Originalfassung enthalten. Auch eine Meta-Angabe „noindex“ auf der externen Seite könnte eine Lösung darstellen, insofern dies durch Sie erreichbar ist. Wurden Inhalte ungefragt von Ihrer Seite kopiert, handelt es sich um eine Urheberrechtsverleztung. Mögliche Maßnahmen reichen hier von der Kontaktaufnahme zum Webmaster über die Meldung bei Google bis hin zu rechtlichen Maßnahmen.

Da Google mittlerweile Original und Kopie gut unterscheiden kann – ein mögliches Kriterium könnte zum Beispiel im Veröffentlichungsdatum liegen – dürften zumindest die Auswirkungen auf das Ranking in solchen Fällen nicht gravierend sein.

 

Problem von internem Duplicated Content

Nicht sofort erschließt sich die Problematik von internem Duplicated Content – es wäre doch okay, wenn zumindest die Hauptveröffentlichung angezeigt wird, oder? Und in den meisten Fällen dürfte dies auch so geschehen: Google weist zwar darauf hin, dass Seiten schlechter gerankt oder ganz aus dem Index entfernt werden können, wenn hinter der Mehrfachveröffentlichung ein Versuch steht, das Ranking zu manipulieren oder Nutzer zu täuschen, jedoch wird dies – auch von Google – in keinem der oben genannten Fälle angenommen. 

Wesentlich bedeutsamer erscheint daher, dass die duplizierten Inhalte die Konsolidierung von Rankingsignalen für die Suchmaschinen erschweren.

Unter anderem richtet sich die Stärke einer Seite nach der Anzahl und Qualität der eingehenden Links. So können sich im Falle von Duplicated Content die Links von externen Seiten folglich auf verschiedene URLs verteilen. Gerade auch vor diesem Hintergrund erscheint es sinnvoll die Linksignale auf eine bevorzugte URL zu konsolidieren. Hierzu kommt die Kanonische URL zum Einsatz.

 

Einsatz einer Canonical URL

Google empfiehlt in den Qualitätsrichtlinien, dass Sie als Seitenbetreiber aktiv dazu beitragen sollen, duplizierten Content zu vermeiden. Weiter heißt es, dass mithilfe Kanonischer URLs die Link- und Rankingsignale von Inhalten verbessert werden können. Somit empfiehlt es sich eine Canonical URL (oft auch als Canonical Tag bezeichnet) zu nutzen.

Zur Vermeidung von Duplicated Content mittels Kanonischer URL wird im Head-Bereich der betroffenen Seiten ein Canonical Tag notiert. Als Wert enthält es die bevorzugte URL, unter der der Inhalt indiziert werden soll.

Beispiel: der Aufruf folgender URLs führt zum Aufruf des gleichen Inhalts:


http://contentxxl.de/web-content-management.aspx/42_view-1/
http://contentxxl.de/web-content-management.aspx
http://contentxxl.de/Web-Content-Management.aspx/42_view-1/
http://contentxxl.de/Web-Content-Management.aspx

Im Quelltext wird nun in allen drei Varianten die gleiche Kanonische URL angegeben:


<link rel="canonical" href="http://www.contentxxl.de/web-content-management.aspx”>

 

Dies teilt der Suchmaschine die bevorzugte URL mit.

Abbildung: Prüfung der Text-Einzigartigkeit mit XOVI

(ohne bzw. mit Verwendung eines Canonical Tag)

 

 

 

Canonical URLs in contentXXL nutzen

Das contentXXL CMS bietet Ihnen verschiedene Möglichkeiten zum Einsatz einer Canonical URL.

 

Standardeinstellung

Die einfachste Möglichkeit besteht darin, unter „Administratoren à Portaleinstellungen à SEO“ die Funktion „Kanonische URLs verwenden“ zu aktivieren. Dies führt dazu, dass das contentXXL CMS automatisch ein Canonical Tag im Quelltext der Seite generiert. Hierzu wird die in den Portaleinstellungen angegebene Default-Base-URL herangezogen, d.h. wurde bei der Default-Base-URL ein führendes www. angegeben, zeigen die Canonical Tags der einzelnen Seiten auf die Version mit führendem www.

 

Beispiel:

Als Default-Base-URL haben Sie die Variante mit führendem www. gewählt.


http://www.ihredomain.de

Die URLs




http://ihredomain.de/ausflugsziele-muenchen.aspx
http://IhreDomain.de/Ausflugsziele-Muenchen.aspx
http://www.ihredomain.de/ausflugsziele-muenchen.aspx
http://www.IhreDomain.de/Ausflugsziele-Muenchen.aspx



zeigen dann mit einem einheitlichen Canonical Tag

<link rel=“canonical“ href=“http://www.ihredomain.de/ausflugsziele-muenchen.aspx“ />

einheitlich auf die bevorzugte Domain.

Diese Einstellung gleicht der Angabe einer bevorzugten Domain in der Google Search Console.

Da contentXXL automatisiert einen abschließenden Trailing-Slash entfernt und die kanonische URL einheitlich in Kleinschreibweise ausgibt, sind zudem auch diese Fälle von duplizierten Inhalten alleine mit der Aktivierung der Funktion abgedeckt.

Die absolute Mehrheit der gängigen Fälle ist also ohne manuelles Zutun behandelt!

Dennoch existieren – wie bereits beschrieben – weitere Möglichkeiten zur Erzeugung von duplizierten Inhalten, die einer spezielleren Behandlung bedürfen.

 

 

Manuelle Angabe der Kanonischen URL

Insbesondere durch Mehrfachveröffentlichungen oder im Rahmen von Content Relationship Management (z.B. bei der Übergabe von Kategorie-IDs in der URL) kommt es vor, dass identische Inhalte unter völlig verschiedenen URLs erreichbar sind.

Zum Beispiel könnte der gleiche Inhalt im Rahmen der Mehrfachveröffentlichung auch auf folgender Seite veröffentlicht worden sein:


http://ihredomain.de/muenchner-sehenswuerdigkeiten.aspx

Die Aktivierung der Kanonischen URL würde hier zwar bereits das Problem bezüglich der führenden Sub-Domain www. sowie die Fälle „Groß-/Kleinschreibung“ sowie „mit oder ohne Trailingslash“ für DIESE URL lösen, den Inhalt jedoch nicht auf die obengenannte bevorzugte URL


http://www.ihredomain.de/ausflugsziele-muenchen

zurückführen.

 

Für solche Fälle empfiehlt sich die manuelle Eingabe der passenden Canonical URL unter den SEO-Einstellungen der Seite oder des Artikels (Objekts).

 

Diese Angabe führt dazu, dass exakt die angegebene URL als kanonische URL verwendet wird.

In aller Regel empfiehlt sich dabei die Eingabe der Kanonischen URL auf der Objekt- also der Inhaltsebene. Besonders, wenn Artikel aus einer Listenansicht heraus geöffnet werden, ist es – wie gleich näher erläutert wird - wichtig, dass die Canonical URL auf Inhaltsebene vergeben wird

 

Mögliche Fehlerquellen bei der manuellen Vergabe

Besonderheiten in der Arbeit mit kanonischen URL in Einzel- und Listenansichten.

contentXXL bietet die Möglichkeit alle Beiträge eines Artikelmoduls als übersichtliche Liste darzustellen (Listenansicht) und die jeweiligen Artikel erst durch Klick auf einen „mehr-Link“ zu öffnen. Der Nutzer bleibt nach dem Klick technisch gesehen auf derselben Seite. Lediglich der vollständige Inhalt des Artikels sowie – soweit vergeben – die artikelspezifischen Meta-Angaben, die artikelspezifische Canonical URL sowie die artikelspezifische Named-URL werden geladen.

Dies bietet u.a. dem Vorteil, dass im System deutlich weniger Seiten angelegt werden müssen und dennoch optimale Voraussetzungen für eine Indizierung durch Suchmaschinen (eigene URL, eigene Metas) geschaffen werden können.

Im Hinblick auf die Canonical URL kann es dabei jedoch zu Fehlern kommen, wenn die manuelle Vergabe einer kanonischen URL nur auf Seitenebene, nicht jedoch auf Artikel-Ebene, erfolgt. Das Fehlen einer expliziten kanonischen URL auf Ebene der Inhalte / Objekte führt dann dazu, dass die einzelnen, aufgerufenen Beiträge die kanonische URL der Übersichtsseite erben. In aller Regel wird dies jedoch nicht die passende kanonische URL dafür sein.

Um dies zu vermeiden, achten Sie darauf, dass bei der Arbeit mit Listen- und Einzelansichten nicht nur auf Seitenebene eine kanonische URL vergeben wird, sondern bei manueller Vergabe immer eine explizite, passende Angabe auf Objektebene nötig ist.

 

Kanonische URLs bei mehrsprachigen Seiten

Beachten Sie, dass bei mehrsprachigen Auftritten und gleichzeitiger manueller Vergabe von Canonical URLs für jede Sprachversion eine eigene Canonical URL vergeben werden muss. Die Kanonische URL muss dabei auf die bevorzugte URL der jeweiligen Sprachversion verweisen. Die Eingabe einer sprachabhängigen Canonical URL erfolgt an gleicher Stelle durch Klick auf die Weltkugel.

 

Wie bereits erwähnt, sind manuelle Eingaben jedoch nur für besondere Fälle wie die erwähnten Mehrfachveröffentlichungen oder bei Einsatz von Kategorie-IDs in den URLs sinnvoll und notwendig. In anderen Fällen reicht in der Regel die Aktivierung der Canonical URL in den Portaleinstellungen. Die oben  bezeichneten Fehler können dabei nicht auftreten.

 

Weitere Hineweise zu Kanonischen URLs

Achten Sie darauf, dass die angegebene, Kanonische URL erreichbar ist und das adressierte Ziel keine Meta-Angabe „noindex“ enthält. Tippfehler bei der manuellen Eingabe der URL führen zwangsläufig zu einer falschen href-Angabe im Canonical Tag.

Wenn Sie bei der Erstellung die Kanonische URL manuell vergeben, prüfen Sie den Quelltext, ob das Tag auf die richtige URL verweist und diese richtig geschrieben ist. Die gängigen SEO-Tools – wie z.B. XOVI – zeigen ebenfalls Fehler in der Verwendung des Canonical Tags auf.

Bei Fragen zum Einsatz der Kanonischen URL in unserem Content Management System zögern Sie nicht uns zu kontaktieren.


Lassen Sie uns wissen, was Sie denken...

Kommentar erstellen

(Kommentare werden moderiert - bitte beachten Sie die Blogregeln!)

Kommentare (0)