Der neue otago Community Newsletter - jetzt anmelden!

Was ist Duplicate Content?
... und wie kann ich ihn vermeiden?

23.11.2020 |  Das Ziel einer Suchmaschine ist es, für jede Nachfrage möglichst einzigartige Inhalte („Unique Content“) anzubieten. Milchmädchenrechnung: Je besser das Angebot zur Suchintention passt, desto eher kehren Menschen zu dieser Suchmaschine zurück – doppelte Inhalte schaden diesem Geschäftsmodell und sind daher aus Suchmaschinen-Sicht zu vermeiden.

Suchmaschinen verstehen sich als Vermittler zwischen Angebot und Nachfrage. Die Nachfrage wird durch den Menschen definiert, der sich auf die Suche nach einem bestimmten Produkt oder einer bestimmten Dienstleistung begibt. Das Angebot, das diese Nachfrage zu befriedigen versucht, sind die zahlreichen (Unter-)Seiten Ihrer Website.

 

Was ist Duplicate Content?

Unter „Duplicate Content“ versteht man Inhalte, die in mehrfacher Version innerhalb derselben oder auf mehreren Domains existieren. Der Begriff „Content“ ist in diesem Zusammenhang jedoch größer zu denken, denn damit sind nicht nur die sichtbaren Texte einer URL gemeint. Vielmehr beinhaltet „Content“ jegliche Elemente einer (Unter-)Seite: Bilder, HTML- sowie CSS-Schnipsel und auch die einzelnen Elemente einer URL.

Hinweis: HTML- sowie CSS-Schnipsel sind alleine schon aufgrund der starken Verbreitung von Content-Management-Systemen wie WordPress in dutzender Ausführung vorhanden. Für die Bewertung von Duplicate Content spielt daher der (sichtbare) Text einer Seite die größte Rolle.

 

Wie entsteht Duplicate Content?

Duplicate Content kann schnell entstehen – häufig sogar ohne Ihr Wissen. Sei es durch den Vertrieb eines bestimmten Textes über mehrere Plattformen, oder aber durch das automatisierte Generieren zahlreicher URLs durch Filter. oder Sortierungs-Einstellungen des Shop-Systems. Nachfolgend unterteilen wir doppelte Inhalte daher in „Inhaltliche Duplikate“ sowie „Technische Duplikate“.

 

 

Inhaltliche Duplikate – wenn Texte doppelt existieren

Bei inhaltlichem doppelten Content geht es um die Inhalte selbst. Der Inhalt ist eines der wichtigsten Bewertungskriterien für die Positionierung einer URL im Internet.

 

Variante 1: Echter Duplicate Content

Wenn ein identisches Dokument unter unterschiedlichen URLs auffindbar ist, so spricht man von „echtem Duplicate Content“. Hierbei gleichen sich die Dokumente sowohl auf inhaltlicher, wie auch auf technischer Ebene und sind sozusagen eine Eins-zu-Eins- Kopie.
Solange Sie kein professionelles Scraping betreiben, werden Sie kein Problem mit echtem Duplicate Content bekommen. Scraping ist das manuelle oder automatisierte Kopieren von Inhalten anderer Websites.

 

Variante 2: Near Duplicate Content

Bei ähnlichem Duplicate Content werden meist einige Sätze ausgetauscht und das HTML- und/oder CSS-Layout angepasst. Hie und da ein paar Wörter ausgetauscht – fertig ist der „Near Duplicate Content“. Das reicht jedoch in der Regel nicht aus um diese Inhalte für Suchmaschinen als „Unique Content“ darzustellen.
Diese Art der doppelten Inhalte ist aus SEO-Sicht zu vermeiden. Unsere Empfehlung: Schreiben Sie ihre Texte stets selbst. Die Kernaussage darf sich überschneiden, ganze (Ab-)Sätze jedoch nicht.

 

Interner vs. Externer Duplicate Content

Duplicate Content kann sowohl innerhalb einer Domain sowie über unterschiedliche Domains verteilt auftreten. Das bedeutet, dass dieselben Inhalte sowohl auf der eigenen Seite, als auch auf anderen Seiten (nahezu) ident auffindbar sind.
Dieses Problem trifft häufig dann auf, wenn…

  • …Job-Beschreibungen von unterschiedlichen Portal gecrawled und verteilt werden.
  • …Immobilieninserate über unterschiedliche Plattformen vertrieben werden.
  • …Produktinformationen sowie -Beschreibungen auf unterschiedlichen Marktplätzen platziert werden.

 

Sie fragen sich sicher: Von all diesen Seiten, welche diese Inhalte vertreiben – welche wird besser ranken? Die Antwort ist aus SEO-Sicht eindeutig: Es kommt darauf an. Hier spielt nicht nur das Indexierungsdatum eine Rolle, sondern auch zahlreiche andere Parameter wie die Stärke sowie Verlinkung einer Domain im Internet.

In der Theorie gibt es einige SEO-Experten, die eine individuelle Detailseiten- Beschreibung empfehlen, um sich so von anderen (Vertriebs-)Plattformen abzusetzen. Das ist in der Praxis aus unserer Sicht jedoch nur selten möglich und wirtschaftlich zumeist nicht sinnvoll.

 

Unser Tipp: Analysieren Sie die Suchergebnisse. Bei oben genannten Beispielen wollen Suchmaschinen-Nutzerinnen einen Überblick über die verschiedensten Produkte, Immobilien oder Job-Inserate erhalten. Detailseiten entsprechen hier häufig nicht diesem „User Intent“ und haben dadurch in der Realität kaum eine Chance auf eine gute Platzierung.

Unterm Strich empfehlen wir jedenfalls stets im Kontext der eigenen Branche und in Relation zur Konkurrenz zu betrachten. Eine Isolation rein auf eine Duplicate-Content- Problematik ist hier nicht zielführend und ist in den seltensten Fällen der alleinige Grund für ein schlechtes Ranking.

 

 

Technische Duplikate – wenn URLs generiert werden

Inhaltlicher Duplicate Content ist in der Regel ein eher untergeordnetes Problem. Technischer Duplicate Content kann hingegen sehr wohl für Probleme sorgen. Doch was ist eigentlich ein technisches Duplikat? Im SEO unterscheiden wir hier zwischen zwei Möglichkeiten:

 

Technischer Duplicate Content: Funktionale URL Parameter

URL Parameter können Duplicate-Content-Probleme verursachen. Darunter fallen beispielsweise Facebook-Tracking-Parameter, aber auch funktionale Parameter in Shop- Systemen, die der Sortierung sowie Spezifizierung dienen.

Wenn Parameter zur Sortierung eingesetzt werden, so können zahlreiche unterschiedlichste URL-Variationen entstehen. Beispiel: Schuhe sind zumeist in unterschiedlichen Größen sowie Farben erhältlich. Die zahlreichen Kombinationsmöglichkeiten können so schnell zu einem exponentiellen URL-Wachstum führen:

  • https://www.test-shop.at/testkategorie/testprodukt?farbe=1&groesse=48
  • https://www.test-shop.at/testkategorie/testprodukt?farbe=1&groesse=47
  • https://www.test-shop.at/testkategorie/testprodukt?farbe=2&groesse=48

Sie sehen, wohin das führen kann. In solchen Fällen empfehlen wir oftmals eine Lösung, bei der sich die Produktvariationen nicht in der URL wiederfinden und auf Parameter verzichtet werden kann. Auch ist ein Einsatz der kanonischen URL zielführend – hiermit kann man Suchmaschinen über die präferierte URL informieren.

 

Technischer Duplicate Content auf Protokoll- und Subdomain-Ebene

Wenn Ihre Website sowohl unter verschiedenen Protokoll- sowie Subdomain- Variationen erreichbar ist, so haben Sie technisch betrachtet mehrere Versionen Ihrer Website. Jede der nachfolgenden Schreibweisen ist daher eine eigene Version Ihrer Seite:

  • https://www.testseite.at
  • https://testseite.at
  • http://testseite.at
  • http://www.testseite.at

Unsere Empfehlung: Definieren Sie eine präferierte Variante und leiten Sie alle anderen Versionen mittels permanenter Weiterleitung (Status Code 301) auf die vorab definierte Version weiter. Dies kann beispielsweise mit dem Tool httpstatus.io überprüft werden.

 

Technischer Duplicate Content durch Trailing Slashes

Bei Verzeichnissen sowie Dateien spielt auch das abschließende Slash („Trailing Slash“) eine wichtige Duplicate-Content-Rolle. Gemäß dem Webstandard werden nachfolgende URLs als einzigartig behandelt.

  • https://www.testseite.at/test
  • https://www.testseite.at/test/

Wenn diese beiden URLs dann über die gleichen Inhalte verfügen, kann dies schnell zu einem Duplicate-Content-Problem führen. Grundsätzlich erkennt der Google-Algorithmus dies bereits sehr gut und indexiert nur eine Variante.

Um jedoch etwaigen Anomalien vorzubeugen, empfehlen wir dennoch eine saubere Lösung durch eine permanente Weiterleitung auf die von Ihnen präferierte Schreibweise.

 

Ist Duplicate Content schlecht?

Duplicate Content kann zu Problemen führen – ja. Wir weisen jedoch explizit darauf hin, dass man hier zwischen Konsequenzen aus SEO-Sicht und aus Urheberrechtsschutz- Sicht unterscheiden muss.

 


Duplicate Content, der gegen den Urheberrechtsschutz verstößt

Wenn Sie Inhalte nahezu eins zu eins kopieren, ohne die Quelle Ihres Wissens anzugeben, dann ist das schlicht ein Plagiat und fällt damit unter das Urheberrecht. Der Inhaber der Inhalte kann dann Beschwerde gegen Sie einlegen und es können rechtliche Konsequenzen drohen – dies hat jedoch nichts mit der Suchmaschine per se zu tun.


 

Duplicate Content aus SEO-Sicht

Doppelte Inhalte, die sowohl inhaltlicher oder auch technischer Natur sind, können gewisse Nachteile für Suchmaschinen mit sich bringen. Dazu zählt:

Jede Website verfügt über ein „Crawling Budget“, auf das weder Sie noch wir Einfluss haben. Je mehr URLs Sie durch beispielsweise Parameter produzieren, desto mehr Aufwand müssen Suchmaschinen für das Crawling Ihrer Website betreiben – das ist jedoch meist nur bei wirklich großen Seiten (mit über 20.000 URLs) relevant.

Das größere Problem für die Duplicate Content betrifft die interne Verlinkung, die ein wichtiges Kriterium in der Gewichtung der einzelnen Unterseiten einer Domain darstellt. Wenn Duplicate-Content-URLs “Link Juice” von anderen Seiten erhalten, jedoch für Suchmaschinen nicht berücksichtigt werden, so können sie keine “Link Kraft” mehr weitergeben. Resultat: Der für die Vererbung des PageRanks wichtige „Link Juice“ geht verloren und die interne Verlinkung wird verwässert. 

 

 

Abstrafung durch Duplicate Content

Eine „Abstrafung“ durch Suchmaschinen existiert unserer Ansicht nicht, denn dies würde bedeuten, dass Suchmaschinen explizit URLs abwerten und bestrafen. Nur weil eine URL mit denselben Inhalten in Relation zu anderen URLs stärker gewichtet wird, ist das per se keine Abstrafung der schwächeren URLs.

Suchmaschinen ordnen den Inhalt einer bestimmten URL zu und gewichten dadurch eben manche URLs stärker, manche schwächer. Diese Gewichtung basiert jedoch auf mehreren Faktoren, unter anderem:

  • Wann wurde exakt dieser Inhalt erstmals im Suchmaschinen-Index aufgenommen?
  • Welche Seite hat zu diesem Thema eine höhere Authorität?
  • Welche Quellen werden gemäß Urheberrecht angeführt? Was ist die Primärquelle?

Unsere Empfehlung: Kopieren Sie keine Inhalte eins zu eins und vermeiden Sie Technischen Duplicate Content bestmöglichst, dann haben Sie weder aus Urheberrechts- Sicht, noch aus SEO-Sicht etwas zu befürchten.

 

 

Wie können Sie Duplicate Content vermeiden?

Duplicate Content ist nicht der Unheilbringer, für den er gerne gehalten wird. Gerade auf technischer Ebene kann es jedoch zu Problemen mit dem Crawling-Budget oder der internen Verlinkung kommen. Nachfolgend zeigen wir Ihnen, wie Sie doppelte Inhalte auch in Zukunft vermeiden können.

 

Inhaltlichen Duplicate Content vermeiden

Inhaltlicher Duplicate Content lässt sich am besten vermeiden, indem Sie stets für einzigartige Inhalte sorgen. Hierbei kann sich die Kernaussage mit anderen Dokumenten im Internet decken, die Strukturierung des Textes sowie die Wahl der Worte sollten Sie jedoch selbst übernehmen. Dadurch werden Sie kein inhaltliches Duplicate-Content- Problem bekommen.

 

Technischen Duplicate Content vermeiden

Technischer Duplicate Content kann auf mehrere Arten gelöst werden. Wir empfehlen eine der beiden Möglichkeiten:

 

Der Canonical Tag gegen Duplicate Content

Mittels dem „Canonical Tag“ können Sie Suchmaschinen auf die repräsentativste von mehreren doppelten Seiten hinweisen. Dadurch bleiben alle URL-Versionen weiterhin aufrufbar – Suchmaschinen selbst werden jedoch auf die „Hauptseite“ verwiesen.

Die Produkt-Variations-URL (zum Beispiel: https://www.test-shop.at/testkategorie/testprodukt?farbe=1?groesse=48) verweist mittels “canonical Tag” auf die Haupt-Seite des Produkts (zum Beispiel: https/www.test-shop.at/testkategorie/testprodukt).

Wenn Sie Suchmaschinen keinen ausdrücklichen Hinweis auf die kanonische URL geben, so können Suchmaschinen eine eigene Wahl treffen – die manchmal dann korrekt ist, manchmal aber eben auch nicht.

 

Permanente Weiterleitung gegen Duplicate Content

Mittels einer permanenten Weiterleitung (Status Code 301) können nicht mehr benötigte URLs aufgelassen werden. Das hat zwar einerseits den Vorteil, dass die für die interne Verlinkung so wichtige „Link Power“ weitergegeben wird. Andererseits jedoch auch den Nachteil, dass die Ursprungsseite gänzlich aufgelassen wird.

Dies ist insbesondere dann sinnvoll, wenn ein altes Produkt langfristig nicht mehr erhältlich ist und ein Folge-Produkt am Markt etabliert wurde.

 

 

Duplicate Content – ein ambivalentes Problem

Doppelte Inhalte können Ihrer Website schaden – jedoch sind die Konsequenzen nicht immer alleine im SEO-Bereich anzusiedeln. Insbesondre im E-Commerce-Bereich können sehr schnell zahlreiche URLs generiert werden, die potenziell die interne Verlinkung verwässern und den Link-Juice verebben lassen können. Hier können Sie durch gezielten Einsatz permanenter Weiterleitungen oder kanonischer URLs Herr über die Lage werden.

Gerade im inhaltlichen Duplicate-Content-Bereich ist es oftmals auch eine Kosten- Nutzen-Rechnung, denn gerade für größere Shop-Systeme ist es aus unserer Sicht wirtschaftlich oft nicht vertretbar Produktbeschreibungen zu individualisieren.

 

Lukas Pigal Sales otago

Sie wollen mehr über SEO wissen?

Wir beraten Sie gerne.

Jetzt Termin vereinbaren unter
office@otago.at oder
+43 1 996 210 50




Weitere Veranstaltungen