Du hast 40 Seiten. Google indexiert 12. Die anderen 28 existieren für Google nicht, weil sie sich zu ähnlich sind.

Das ist nicht Zufall. Das ist Duplicate Content. Eine stille SEO-Katastrophe, die deine Rankings kostet, ohne dass du sie je bemerken wirst.

Google nennt es diplomatisch „Canonical Issues". Was es bedeutet: Diese 28 Seiten sind unsichtbar für die Suchmaschine. Dein Traffic verliert bis zu 70 Prozent. Dein Linkjuice zerstreut sich wie Wasser auf 28 URLs, statt sich auf einer zu konzentrieren.

Die schlechte Nachricht: Duplicate Content ist alltäglich. Du brauchst nicht mal ein kaputtes System. Er entsteht unbemerkt durch die architektonische Naivität von URLs.

Die gute Nachricht: Canonical Tags sind die Antwort. Eine einzige Zeile HTML. Und plötzlich funktioniert wieder alles.

Was ist Duplicate Content? Die beiden Typen

Duplicate Content kommt in zwei Varianten: Exact Duplicates und Near-Duplicates.

Exact Duplicates sind pixel-identische Seiten. Derselbe Text, derselbe HTML, nur die URL ist anders. Das klassische Beispiel: www.beispiel.de und beispiel.de, beide existieren, sind aber inhaltlich identisch. Google weiß nicht, welche „die echte" ist und indexiert nur eine (oder keine).

Near-Duplicates sind tückischer. Sie sind zu 90 Prozent identisch. Das Template ist gleich, die Navigation ist gleich, nur ein Parameter hat sich geändert oder es ist eine leicht gekürzte Version. Google erkennt sie als „wahrscheinlich das gleiche" und indexiert nur die Version mit den höchsten Signalen, also nicht zwingend deine bevorzugte.

Beide Fälle haben die gleiche Konsequenz: Linkpower wird fragmentiert, Rankings werden verwässert, Traffic verschwindet.

Kernerkenntnis

Duplicate Content ist kein Strafdelikt. Es ist ein Adressproblem. Google weiß nicht, an welche URL es die Reputation deiner Seite ausliefern soll, also liefert es sie an niemanden vollständig.

Wie Duplicate Content entsteht (ohne dass du es merkst)

Erste Reaktion meistens: „Wieso sollte ich identische Seiten haben?" Die Antwort: Du hast sie schon, du siehst sie nur nicht.

URL-Varianten: Das www vs. non-www Problem

Die meisten Websites existieren unter mehreren URLs:

Das sind vier URLs. Der Inhalt ist identisch. Google sieht vier Seiten und weiß nicht, welche die „Hauptversion" ist.

Trailing Slashes

Auch ein simpler Schrägstrich am Ende erzeugt Duplikate:

Technisch sind das zwei URLs. Server behandeln sie manchmal als unterschiedlich. Google auch, und indexiert dann beide als eigenständige Seiten.

URL-Parameter und Session-IDs

Analytics-Parameter, Session-IDs, Tracking-IDs: Sie ändern die URL, aber nicht den Inhalt.

Jede URL ist eine neue Seite für Google. Der Inhalt ist identisch. Dein Linkjuice zersplittert sich über 50 Varianten.

Paginierung und Filter

E-Commerce ist ein klassischer Duplicate-Content-Ort:

Alle zeigen unterschiedliche Produkte, aber die ersten 10 Produkte sind auf jeder Seite gleich. Das ist Near-Duplicate Content.

Print-Versionen und mobile Varianten

Ältere Websites haben oft separate URLs für Print-Versionen oder mobile Ansichten:

Alle Varianten enthalten denselben Text. Google sieht drei Seiten.

Produktvarianten in Shops

Dein Shop hat ein Hemd in Blau, Rot und Grün:

95 Prozent der Beschreibung ist identisch. Nur Farbe und Preis ändern sich. Google sieht drei Produkte und fragmentiert die Linkpower auf alle drei Varianten.

Warum das SEO-Ranking zerstört

Das Problem ist nicht, dass Google dich bestraft. Das Problem ist, dass Google verwirrt ist.

Stell dir vor, du hast einen Artikel mit 50 Backlinks. Dann fragmentierst du ihn unbemerkt in 3 URL-Varianten. Jetzt hat jede Variante 17 Links. Ein einzelner Link zu jeder Variante ist schwächer als 50 Links zu einer Variante. Plötzlich rankst du schlechter, ohne dass du etwas gemacht hast.

Dazu kommt: Google indexiert pro Topic nur eine Version. Sie wählen die „beste", aber die beste ist nicht immer deine beste. Wenn Google die mobile Variante als Canonical wählt, dein Desktop aber die bessere ist, Pech. Du rankst mit der Mobile-Version, obwohl deine Desktop-Version stärker ist.

Zuletzt: Das Crawl-Budget zerfällt. Google hat nur eine begrenzte Anzahl Crawl-Anfragen pro Tag für deine Domain. Wenn die Hälfte davon auf Duplikate verschwendet wird, crawlt Google weniger neue Inhalte. Neue Inhalte indexieren langsamer. Neue Rankings entstehen langsamer.

Wie du Duplicate Content findest

1. Site-Suche in Google

Das schnellste Experiment:

site:deinedomain.de

Das zeigt alle indexierten Seiten. Zähle die Ergebnisse. Dann:

Kostenlos testen

threefor.one findet Canonical-Probleme und Duplicate Content automatisch, als Teil des vollständigen SEO-Scans.

Jetzt scannen →

Experiment: Der Duplicate-Content-Test

Gib site:deinedomain.de in Google ein. Zähle die Ergebnisse. Öffne die Google Search Console und schau unter „Seiten" wie viele Seiten indexiert sind. Liegt die Differenz über 20 Prozent, hast du ein Duplicate-Problem.

2 Minuten, keine Tools nötig

2. Google Search Console: Coverage Report

Noch besser: GSC zeigt dir explizit, welche Seiten Google nicht indexiert hat und warum.

Google sagt dir direkt: „Diese Seite ist ein Duplikat von dieser URL hier."

3. Screaming Frog: Der Heavy-Hitter

Für systematische Crawls: Screaming Frog ist dein Werkzeug.

Screaming Frog zeigt dir jedes Duplikat mit Links, Text-Länge und Ähnlichkeit. Du siehst sofort: „Diese 28 URLs sind identisch mit dieser hier."

Die Lösung: Canonical Tags

Ein Canonical Tag ist eine HTML-Zeile, die Google sagt: „Diese Seite ist ein Duplikat. Die echte Version ist diese hier."

Google respektiert das und indexiert nur die echte Version. Alle Links und Signale fließen zur Canonical URL. Das ist der Gamechanger.

Wie man einen Canonical Tag setzt

Im <head> deiner HTML:

<link rel="canonical" href="https://www.beispiel.de/artikel">

Das war's. Eine Zeile. Das ist ein Canonical Tag.

Übersetzung: „Diese Seite ist ein Duplikat. Die Canonical Version ist https://www.beispiel.de/artikel."

Self-Referential Canonicals

Die Best Practice: Jede Seite hat einen Canonical Tag, der auf sich selbst zeigt. Das ist die sicherste Variante, weil für jeden Content klar ist: „Das hier bin ich. Nicht zu verwechseln."

<link rel="canonical" href="https://www.beispiel.de/artikel"> <!-- Diese Zeile steht auf https://www.beispiel.de/artikel -->

Canonical bei Duplikaten

Wenn du Duplikate hast (z.B. www und non-www laufen parallel), dann:

<!-- Auf https://www.beispiel.de/artikel --> <link rel="canonical" href="https://www.beispiel.de/artikel"> <!-- Auf https://beispiel.de/artikel --> <link rel="canonical" href="https://www.beispiel.de/artikel"> <!-- Zeigt auf die www-Version -->

Beide Versionen zeigen auf die gleiche Canonical URL. Google indexiert nur eine.

Canonical bei Paginierten Inhalten

Bei Seite 1, 2, 3 gibt es zwei Strategien:

Strategie 1: Jede Seite referenziert sich selbst

<!-- Seite 1 --> <link rel="canonical" href="https://www.beispiel.de/artikel?page=1"> <!-- Seite 2 --> <link rel="canonical" href="https://www.beispiel.de/artikel?page=2">

Strategie 2: Alle Seiten zeigen auf Seite 1

<!-- Seite 2 --> <link rel="canonical" href="https://www.beispiel.de/artikel"> <!-- Zeigt auf Seite 1, nicht auf Seite 2 -->

Strategie 1 ist moderner. Strategie 2 war früher beliebt, fragmentiert aber trotzdem Rankings.

Problem Canonical-Lösung Oder: 301 Redirect?
www vs. non-www Alle zeigen auf www (oder umgekehrt) Ja: 301 redirect non-www → www
Trailing Slash Einigung auf /artikel oder /artikel/ Ja: 301 redirect /artikel → /artikel/
URL-Parameter (Analytics) Canonical ohne Parameter Nein: würde Traffic-Tracking zerstören
Produktvarianten Canonical auf Basis-URL Nein: würde Varianten unsichtbar machen
Print-Version Print zeigt auf Normal-Version Ja: 301 redirect /artikel?print → /artikel

Weitere Lösungen: 301 Redirects, noindex, hreflang

301 Redirect: Die permanente Umleitung

Ein 301 Redirect ist nicht dasselbe wie ein Canonical Tag. Redirect ist eine Umleitung. Der User und Google landen auf der neuen URL. Der alte Link-Saft fließt vollständig zur neuen Version.

Tools wie threefor.one scannen deine Seite in unter 60 Sekunden auf genau diese Probleme.

server redirect /artikel-alt.html → /artikel.html

Canonical hingegen sagt: „Zeigen Sie diese alte URL an, aber wissen Sie, dass die echte Version diese hier ist."

301 Redirect, wenn du eine alte URL loswirst (z.B. alte Kategorie). Canonical, wenn beide URLs parallel existieren müssen.

noindex: unsichtbar machen

Für Seiten, die nicht indexiert werden sollen:

<meta name="robots" content="noindex">

Das ist aggressiver als Canonical. Google indexiert die Seite gar nicht erst. Wird selten verwendet, manchmal für Filter-Kombinationen in E-Commerce sinnvoll.

hreflang: Für mehrsprachige Websites

Wenn du Deutsch und Englisch hast:

<!-- Auf der deutschen Seite --> <link rel="alternate" hreflang="de" href="https://www.beispiel.de/artikel"> <link rel="alternate" hreflang="en" href="https://www.example.de/en/article"> <!-- Auf der englischen Seite --> <link rel="alternate" hreflang="en" href="https://www.example.de/en/article"> <link rel="alternate" hreflang="de" href="https://www.beispiel.de/artikel">

hreflang sagt Google: „Es gibt mehrere Sprachversionen. Zeig jedem User die richtige Sprache."

Google bestraft Duplicate Content nicht. Es wählt einfach eine Version aus und ignoriert den Rest. Das Problem ist: Es wählt nicht immer die richtige. Google Search Central, 2024

Das ist der Kern: Google bestraft dich nicht für Duplikate. Es ignoriert sie einfach. Das klingt harmlos. Ist es aber nicht.

Wenn Google deine Desktop-Version ignoriert und die Mobile-Version indexiert, schlechter Tausch. Wenn Google deine englische Version indexiert und die deutsche ist besser, Pech. Wenn Google die Parameter-Version indexiert, obwohl die Parameter-freie Version stärker ist, Pech.

Canonical Tags sind deine Stimme in diesem Prozess. Canonical sagt: „Indexier diese Version, nicht diese." Google respektiert das in 99 Prozent der Fälle.

Der Unterschied zwischen Canonical und 301 Redirects

Das wird oft verwechselt. Hier die klare Unterscheidung:

Canonical ist subtil. 301 ist eine echte Umleitung.

Canonical, wenn URL-Varianten parallel existieren müssen (www und non-www gleichzeitig, Parameter-Versionen für Analytics). 301, wenn du eine alte Version abstellst und willst, dass alle zur neuen gehen.

Praktischer Checklisten-Check

Um Duplicate Content in deinem Projekt zu identifizieren:

Häufig gestellte Fragen

Verwandte Artikel

SEO-Audit-Anleitung: 12 Checks für 98 Prozent deiner Probleme, Ein vollständiger Audit-Prozess, in dem Duplicate Content ein kritischer Check ist.

Google SEO Grundlagen 2026: Was du wissen musst, Technisches SEO-Fundament mit Crawl-Budget, Indexierung, Rankings.

SEO-Leitfaden 2026: Content, Tech, Links, Conversions, Strategischer Überblick über Duplicate Content im größeren SEO-Kontext.

threefor.one, Kostenloser SEO-Audit, 19 Dimensionen, unter 60 Sekunden, keine Anmeldung.

Quellen