<< Zurück zum eMinded-Magazin

Duplicate Content finden und vermeiden

Doppelt hält besser oder? Wenn es um eine gute Suchmaschinenoptimierung geht ist genau das Gegenteil der Fall. Hier ist es sehr wichtig einzigartigen Content bereit zu stellen. Warum doppelte Inhalte so gefährlich für das Ranking werden können und was genau Duplicate Content eigentlich ist, erfährst du hier.

Welche Arten von Duplicate Content gibt es?

 

Duplicate Content (DC) bezeichnet gleiche Inhalte auf Webseiten die über mehrere URLs gefunden werden können. Es ist sehr wichtig, dass Google einen bestimmten Inhalt immer genau einer URL zuordnen kann. Sollte das nicht der Fall sein und es gibt mehrere URLs, die zu dem gleichen Inhalt führen, steht Google vor der Entscheidung, welche URL nun für das Thema am relevantesten ist.

Das ist zum einem für die Suchmaschine verwirrend und zum anderen können dann auch unerwünschte Seiten im Index erscheinen.
Es wird grundsätzlich zwischen internem und externem DC unterschieden.

Interner Duplicate Content

Bereits wenn innerhalb der selben Website ein bestimmter Content über mehrere URLs erreicht werden kann, kann das von Google als Duplikate Content verstanden werden.

Beispielsweise Onlineshops haben häufig mit diesem Problem zu kämpfen, da verschiedene Links zum selben Produkt führen können. Hier ein Beispiel:

http://www.onlineshop.com/kategorie/schuhe/sneakers
http://www.onlineshop.com/sneakers

An dieser Stelle ist unbedingt eine konsistente interne Verlinkung notwendig.

Externer Duplicate Content

Auch bei Versionen der gleichen Website für verschiedene Länder ist Vorsicht geboten. Wenn eine Seite in verschiedenen Versionen  mit der Endung .at und einmal mit .de mit dem selben Inhalt auf Deutsch besteht, kann das als DC verstanden werden.

Liegt der Text in unterschiedlichen Sprachen vor, stellt das in der Regel kein Problem dar.

Eine Lösung dieses Problems stellt das Hreflang-Attribut dar. Mit diesem kann Google der Zusammenhang der unterschiedlichen Webseiten sowie die sprachliche bzw. geografische Ausrichtung verdeutlicht werden.

Warum ist Duplicate Content schlecht für SEO?

Google betont immer wieder, dass Webmaster erstklassige und einzigartige Webseiten für die User erstellen sollen um die Nutzererfahrung zu erhöhen. Aus dieser Aussage alleine kann Duplicate Content fast schon als Betrug gewertet werden, indem versucht wird, zu einem Thema so viele Seiten wie möglich zu erstellen.

Allerdings ist es auch Google bewusst, dass die große Mehrheit an Duplikaten nicht gewollt und häufig auch unbewusst entsteht, so dass in der Praxis so gut wie nie mit manuellen Maßnahmen aufgrund von manipulativen Absichten gerechnet werden muss.

Dennoch sollte man Google möglichst nicht vor diese Entscheidung stellen und vor allem den folgenden Punkt unmissverständlich verdeutlichen:

Welche Seite soll für welches Thema in den Index.

Ansonsten wird auch hier Google eine eigene Entscheidung treffen. Dies kann wie bereits erwähnt dazu führen, dass unerwünschte Seiten in den Index gelangen. Daraus können sich Schwankungen in den Rankings der gewünschten Seiten ergeben.

Wie kann ich Duplikate auf meiner Domain identifizieren?

Auf dem Markt gibt es eine Vielzahl von Tools und Programmen, die helfen sollen DC-Problematiken zu erkennen. Je nach Größe und Komplexität der Domain können diese zwar Sinn machen, aber häufig kann schon mit einer einfachen sowie kostenlosen Siteabfrage eine erste Überprüfung stattfinden.
Hierzu reicht der folgende Befehl in der Sucheingabe bei Google (Beispiel):

 

 

Durch diesen Befehl werden euch alle indexierten Seiten dieser Domain angezeigt. Hier lässt sich schon mal grob feststellen, ob sich unerwünschte Seiten bzw. Duplikate im Index befinden.

Soll nach einem bestimmten Thema wie zum Beispiel „Sneakers“ gesucht werden, lässt sich die Siteabfrage durch den Befehl „inurl:“ weiter eingrenzen. Anbei auch ein Beispiel:

 

 

Auf diese Weise bekommt Ihr alle Seiten im Index eurer Domain mit dem Bestandteil „Sneakers“ in der URL angezeigt. So lassen sich wunderbar Duplikate feststellen und die Problematik dahinter identifizieren. Mögliche Problematiken sind unter anderem

  • Seiten besitzen identische Meta-Tags
  • Seite ist sowohl mit als auch ohne „www“ aufrufbar
  • Seite ist sowohl über „http“ als auch über „https“ aufrufbar
  • Seite ist sowohl mit als auch ohne „Trailing Slash“ aufrufbar
  • Seite ist sowohl mit dargestellter Index-Datei als auch ohne aufrufbar
  • Seite ist auch mit Parametern aufrufbar

Diese Probleme können sowohl einzeln als auch in Kombination miteinander auftreten. Daher sollte nach einer ersten Identifizierung eine tiefere Analyse durch einen Fachmann erfolgen.

Wie kann man Duplicate Content vermeiden bzw. beheben?

Die Erkennung von DC ist der erste Schritt in die richtige Richtung. Sind die Probleme bekannt, kann eine Strategie für die Behebung von Duplikaten sowie für die zukünftige Vermeidung erstellt werden.

Pauschale Aussagen lassen sich zwar treffen, jedoch ist jede Domain einzigartig und erfordert daher auch eine angepasste Strategie!

So lassen sich Probleme durch Meta-Tags bereits durch eine strategische Ausrichtung der Titles und Descriptions lösen. Auch durch den Einsatz von Canonical-Tags lassen sich eine Vielzahl von Duplikaten wie zum Beispiel aus URLs mit Parametern beheben.

Schwieriger wird es schon, wenn Seiten sowohl über http als auch über https aufrufbar sind. Hier müssen noch viele weitere Punkte beachtet werden damit neben der Beseitigung von Duplikaten auch die Rankings der http-Versionen erhalten bleiben.

Wir haben eine jahrelange Erfahrung in der Beseitigung von Duplikaten und können Euch gerne bei jeder erdenklichen Frage beraten und unterstützen. Sprecht uns einfach an 😉

 

Teile diesen Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.