banner-bg
eminded

Duplicate Content finden und vermeiden

23.02.2023 | Julia Dauhrer | SEO

Teile diesen Beitrag
eminded

Duplicate Content

Doppelt hält besser, oder? Wenn es um gute Suchmaschinenoptimierung geht, ist genau das Gegenteil der Fall. Hier ist es relevant, einzigartigen Content bereit zu stellen. Warum doppelte Inhalte so gefährlich für das Ranking werden können und was Duplicate Content eigentlich ist, erfährst Du hier.

Welche Arten von Duplicate Content gibt es?

Duplicate Content bezeichnet gleiche Inhalte (vor allem Texte), die auf mehreren Seiten bzw. über mehrere URLs gefunden werden können.

Es ist wichtig, dass die Suchmaschine bzw. Google einen bestimmten Inhalt immer genau einer URL zuordnen kann. Ist das nicht der Fall und es gibt mehrere URLs, die zu dem gleichen Inhalt führen, steht Google vor der Entscheidung, welche URL nun für das Thema am relevantesten ist und für ein bestimmtes Keyword ranken soll. So kann es passieren, dass die Suchmaschine auch unerwünschte Seiten indexiert.

Grundsätzlich wird zwischen internem und externem Duplicate Content unterschieden.

Interner Duplicate Content

Bereits wenn innerhalb derselben Website ein bestimmter Content über mehrere URLs erreicht werden kann, interpretiert Google dies möglicherweise als Duplikate.

So haben beispielsweise Onlineshops häufig mit diesem Problem zu kämpfen, da verschiedene Links zum selben Produkt führen können. Hier ein Beispiel:

  • http://www.onlineshop.com/kategorie/schuhe/sneakers
  • http://www.onlineshop.com/sneakers

Externer Duplicate Content

Ist auf unterschiedlichen Domains identischer Content vorhanden, dann spricht man von externem Duplicate Content. So ist zum Beispiel bei länderspezifischen Versionen einer Website Vorsicht geboten. Wenn eine Seite einmal mit der Top-Level-Domain .at und einmal mit .de und jeweils demselben Inhalt auf Deutsch besteht, kann das als Duplicate Content verstanden werden.

Die Lösung dieses Problems stellt das Hreflang-Attribut dar. Mit diesem kann Google mitgeteilt werden, dass die .de-Version für User in Deutschland und die .at-Version für User in Österreich bestimmt ist. Alles zur korrekten Verwendung des hreflang-Attributs haben wir Dir übrigens in unserem Magazinartikel „hreflang: Was ist das eigentlich?“ zusammengefasst.

Warum ist Duplicate Content schlecht für SEO?

Google betont immer wieder, dass Webmaster erstklassige und einzigartige Webseiten für die User erstellen sollen. Allerdings ist auch Google bewusst, dass die große Mehrheit an Duplikaten nicht gewollt und häufig auch unbewusst entsteht. Wichtig ist in diesem Zusammenhang auch zu erwähnen, dass Google Websites, auf denen Duplikate zu finden sind, nicht abstraft – lies hierzu gerne auch den kürzlich erschienen Artikel von SEO Südwest.

Dennoch können Duplikate zu Problemen mit den Rankings führen – Google kann, wenn mehrere Seiten mit demselben Content existieren, womöglich nicht nachvollziehen, welche dieser Seiten nun diejenige ist, die in den Index soll. Mögliche Folgen im schlechtesten Falle:

  • Eine Seite, die Du eigentlich nicht im Index haben wolltest, wird indexiert – und sorgt im Worst Case für eine schlechtes Nutzererlebnis.
  • Umgekehrt: Die von Dir gewünschte Seite wird nicht indexiert.
  • Die rankende URL eines Keywords wechselt häufig….
  • …und daraus resultierend: Du hast mit starken Schwankungen in den Rankings bzw. bzgl. Deiner Positionen zu kämpfen.

Mache Dir also – wie eigentlich immer, wenn es um Deine Websitestruktur und SEO-Strategie geht – genaue Gedanken darüber, welche URL für welches Keyword indexiert werden soll.

Wie kann ich Duplikate auf meiner Domain identifizieren?

Es gibt eine Vielzahl an Tools, die Dir helfen, Duplicate Content und die Ursache(n) dieses Problems zu finden.

Copyscape

Du kannst mit diesem Tool prüfen, ob und wo auf anderen Websites Inhalte bestehen, die mit denen Deiner Website übereinstimmen. Zudem kannst Du Texte „nebeneinander legen“ und, falls vorhanden, identische Textpassagen hervorheben lassen. In limitiertem Umfang steht Dir dieses Tool kostenlos zur Verfügung.

Screaming Frog

Mit Hilfe des Screaming Frogs analysierst Du, ob Du ein Problem mit internem Duplicate Content bekommen könntest, indem Du Deinen Website-Crawl (im Tab „Inhalt“) in Bezug auf exakte Duplikate und Nahduplikate prüfst. Eine detaillierte Anleitung zum Vorgehen findest Du im Tutorial-Bereich von Screaming Frog.

Google Search Console

In der Google Search Console findest Du im Bericht zur Seitenindexierung eine Auflistung aller nicht indexierten Seiten Deiner Domain. Ist ein Duplikat der Grund für Dein Indexierungsproblem, so findest Du diese Info etwas weiter unten im Bericht.

Site-Abfrage

Je nach Größe und Komplexität der Domain ist die Verwendung der gerade genannten Tools sinnvoll. Häufig kann auch schon mit einer einfachen (und kostenlosen) Site-Abfrage eine erste Überprüfung durchgeführt werden.

Hierzu reicht der folgende Befehl in der Sucheingabe (Beispiel):

Mit diesem Befehl werden Dir alle indexierten Seiten dieser Domain angezeigt. Hier lässt sich bereits grob feststellen, ob sich unerwünschte Seiten bzw. interne Duplikate im Index befinden.

Soll nach einem bestimmten Thema wie zum Beispiel „Sneakers“ gesucht werden, lässt sich die Siteabfrage durch den Befehl „inurl:“ weiter eingrenzen. Anbei auch ein Beispiel:

Auf diese Weise werden Dir alle indexierten Seiten Deiner Domain mit dem Bestandteil „Sneakers“ in der URL angezeigt. Und es lassen sich wunderbar Duplikate finden und die Problematik dahinter identifizieren. Mögliche Quellen für Duplicate Content sind unter anderem:

  • Seiten besitzen identische Meta Tags
  • Seite ist sowohl mit als auch ohne „www“ aufrufbar
  • Seite ist sowohl über „http“ als auch über „https“ aufrufbar
  • Seite ist sowohl mit als auch ohne „Trailing Slash“ aufrufbar
  • Seite ist sowohl mit dargestellter Index-Datei als auch ohne aufrufbar
  • Seite ist auch mit Parametern aufrufbar

Diese Probleme können sowohl einzeln als auch in Kombination auftreten. Nach einer ersten Identifizierung von Duplikaten solltest Du dann analysieren, wie diese entstehen und Lösungen zur Behebung und Vermeidung von doppelten Inhalten erarbeiten.

Wie kann man Duplicate Content vermeiden bzw. beheben?

Pauschale Aussagen lassen sich zwar treffen, jedoch ist jede Domain einzigartig und erfordert daher eine individuelle Strategie zur Lösung des Problems. Mögliche Ansätze sind:

  • eine strategische Ausrichtung der Titles und Descriptions
  • Einsatz von Canonical Tags zur Markierung der wichtigsten URL zu einem bestimmten Thema (z.B. bei URLs mit Parametern)
  • Weiterleitungen (z.B. bei Duplikaten, die sich durch URLs mit und ohne www. bei gleichzeitig identischem Content ergeben)
  • Meta Tag „noindex“, mit welchem Du Seiten markierst, die nicht indexiert werden sollen
  • hreflang (siehe oben)
  • Vermeidung von Seiten mit ähnlichem Inhalt durch detaillierte Contentplanung
  • Vermeidung von Seiten mit identischem Inhalt durch die Umformulierung von Texten (anstatt der 1:1-Übernahme von Text bzw. Textblöcken)

Fazit – Wie Du Duplicate Content findest und vermeidest

Dass Google Websites mit Duplicate Content abstraft, ist ein Mythos. Jedoch können sich durch identische oder ähnliche Inhalte Probleme mit den Rankings und der Nutzererfahrung ergeben. Sowohl mit Hilfe von Tools als auch durch eine manuelle Prüfung Deiner Domain kannst Du Duplicate Content finden und dessen Ursachen identifizieren. Jedoch gibt es auch Möglichkeiten technischer und strategischer Art (z.B. Weiterleitungen, Canonical Tags und detaillierte Contentplanung), durch die Du doppelte Inhalte beheben und deren Entstehung im Bestfall von Anfang an vermeiden kannst.

Die Erkennung von DC ist der erste Schritt in die richtige Richtung. Sind die Probleme bekannt, kann eine Strategie für die Behebung von Duplikaten sowie für die zukünftige Vermeidung erstellt werden.

Teile diesen Beitrag
Über den Autor
eminded
Julia Dauhrer

Digital Marketing Managerin

Julia Dauhrer ist Digital Marketing Managerin bei eMinded und kümmert sich vor allem um SEO- & Content-Themen. Privat liebt sie Ausflüge in die Berge, leckeres Essen, gute Bücher & Sport.

Weitere Artikel von Julia

Weitere THEMEN
  • Das sind die Online Marketing Trends 2024

    b2b online-marketing

    Du möchtest wissen, welche Online Marketing Trends 2024 auf Dich zukommen? Wir zeigen Dir spannende Insights und Ergebnisse aus unserer Studie! 👉 Mehr dazu im Magazinartikel.

  • Die 3 wichtigsten Meta-Tags für SEO 

    seo

    Unternehmen können den Einsatz von Meta-Tags für sich nutzen, um eine höhere Klickrate zu erreichen und ihre Website in der Suchmaschine besser zu platzieren. Erfahre, welche Meta-Tags relevant für Dein Ranking sind und wie Du sie am besten einsetzt. Jetzt lesen!

  • Corporate Blogs: Darum sollten Unternehmen einen Blog führen

    b2b

    Sie sollten mittlerweile Bestandteil jeder erfolgreichen Unternehmenskommunikation sein: Corporate Blogs. Was sie genau sind und wie Du im B2B-Umfeld von ihnen profitieren kannst, erfährst Du hier.

Guide:
So schaffst auch DU über 500% ROAS

Damit behältst Du den Überblick!
JETZT DOWNLOADEN
close-link
Klick mich