Duplicate Content: Warum Google dich ignoriert

Du hast 40 Seiten. Google indexiert 12. Die anderen 28 existieren für Google nicht, weil sie sich zu ähnlich sind.

Das ist nicht Zufall. Das ist Duplicate Content. Eine stille SEO-Katastrophe, die deine Rankings kostet, ohne dass du sie je bemerken wirst.

Google nennt es diplomatisch „Canonical Issues". Was es bedeutet: Diese 28 Seiten sind unsichtbar für die Suchmaschine. Dein Traffic verliert bis zu 70 Prozent. Dein Linkjuice zerstreut sich wie Wasser auf 28 URLs, statt sich auf einer zu konzentrieren.

Die schlechte Nachricht: Duplicate Content ist alltäglich. Du brauchst nicht mal ein kaputtes System. Er entsteht unbemerkt durch die architektonische Naivität von URLs.

Die gute Nachricht: Canonical Tags sind die Antwort. Eine einzige Zeile HTML. Und plötzlich funktioniert wieder alles.

Was ist Duplicate Content? Die beiden Typen

Duplicate Content kommt in zwei Varianten: Exact Duplicates und Near-Duplicates.

Exact Duplicates sind pixel-identische Seiten. Derselbe Text, derselbe HTML, nur die URL ist anders. Das klassische Beispiel: www.beispiel.de und beispiel.de, beide existieren, sind aber inhaltlich identisch. Google weiß nicht, welche „die echte" ist und indexiert nur eine (oder keine).

Near-Duplicates sind tückischer. Sie sind zu 90 Prozent identisch. Das Template ist gleich, die Navigation ist gleich, nur ein Parameter hat sich geändert oder es ist eine leicht gekürzte Version. Google erkennt sie als „wahrscheinlich das gleiche" und indexiert nur die Version mit den höchsten Signalen, also nicht zwingend deine bevorzugte.

Beide Fälle haben die gleiche Konsequenz: Linkpower wird fragmentiert, Rankings werden verwässert, Traffic verschwindet.

Kernerkenntnis

Duplicate Content ist kein Strafdelikt. Es ist ein Adressproblem. Google weiß nicht, an welche URL es die Reputation deiner Seite ausliefern soll, also liefert es sie an niemanden vollständig.

Wie Duplicate Content entsteht (ohne dass du es merkst)

Erste Reaktion meistens: „Wieso sollte ich identische Seiten haben?" Die Antwort: Du hast sie schon, du siehst sie nur nicht.

URL-Varianten: Das www vs. non-www Problem

Die meisten Websites existieren unter mehreren URLs:

https://www.beispiel.de/artikel
https://beispiel.de/artikel (ohne www)
http://www.beispiel.de/artikel (insecure)
http://beispiel.de/artikel (insecure + kein www)

Das sind vier URLs. Der Inhalt ist identisch. Google sieht vier Seiten und weiß nicht, welche die „Hauptversion" ist.

Trailing Slashes

Auch ein simpler Schrägstrich am Ende erzeugt Duplikate:

https://www.beispiel.de/artikel
https://www.beispiel.de/artikel/

Technisch sind das zwei URLs. Server behandeln sie manchmal als unterschiedlich. Google auch, und indexiert dann beide als eigenständige Seiten.

URL-Parameter und Session-IDs

Analytics-Parameter, Session-IDs, Tracking-IDs: Sie ändern die URL, aber nicht den Inhalt.

https://www.beispiel.de/artikel?utm_source=newsletter
https://www.beispiel.de/artikel?utm_source=social
https://www.beispiel.de/artikel?sessionid=abc123xyz

Jede URL ist eine neue Seite für Google. Der Inhalt ist identisch. Dein Linkjuice zersplittert sich über 50 Varianten.

Paginierung und Filter

E-Commerce ist ein klassischer Duplicate-Content-Ort:

https://www.shop.de/produkte
https://www.shop.de/produkte?page=2
https://www.shop.de/produkte?sort=preis
https://www.shop.de/produkte?farbe=blau&größe=M

Alle zeigen unterschiedliche Produkte, aber die ersten 10 Produkte sind auf jeder Seite gleich. Das ist Near-Duplicate Content.

Print-Versionen und mobile Varianten

Ältere Websites haben oft separate URLs für Print-Versionen oder mobile Ansichten:

https://www.beispiel.de/artikel (Desktop)
https://www.beispiel.de/artikel?print=true (Print-Version)
https://m.beispiel.de/artikel (Mobile Subdomain)

Alle Varianten enthalten denselben Text. Google sieht drei Seiten.

Produktvarianten in Shops

Dein Shop hat ein Hemd in Blau, Rot und Grün:

https://www.shop.de/hemd
https://www.shop.de/hemd?farbe=blau
https://www.shop.de/hemd?farbe=rot

95 Prozent der Beschreibung ist identisch. Nur Farbe und Preis ändern sich. Google sieht drei Produkte und fragmentiert die Linkpower auf alle drei Varianten.

Warum das SEO-Ranking zerstört

Das Problem ist nicht, dass Google dich bestraft. Das Problem ist, dass Google verwirrt ist.

Stell dir vor, du hast einen Artikel mit 50 Backlinks. Dann fragmentierst du ihn unbemerkt in 3 URL-Varianten. Jetzt hat jede Variante 17 Links. Ein einzelner Link zu jeder Variante ist schwächer als 50 Links zu einer Variante. Plötzlich rankst du schlechter, ohne dass du etwas gemacht hast.

Dazu kommt: Google indexiert pro Topic nur eine Version. Sie wählen die „beste", aber die beste ist nicht immer deine beste. Wenn Google die mobile Variante als Canonical wählt, dein Desktop aber die bessere ist, Pech. Du rankst mit der Mobile-Version, obwohl deine Desktop-Version stärker ist.

Zuletzt: Das Crawl-Budget zerfällt. Google hat nur eine begrenzte Anzahl Crawl-Anfragen pro Tag für deine Domain. Wenn die Hälfte davon auf Duplikate verschwendet wird, crawlt Google weniger neue Inhalte. Neue Inhalte indexieren langsamer. Neue Rankings entstehen langsamer.

Wie du Duplicate Content findest

1. Site-Suche in Google

Das schnellste Experiment:

site:deinedomain.de

Das zeigt alle indexierten Seiten. Zähle die Ergebnisse. Dann:

◆

Kostenlos testen

threefor.one findet Canonical-Probleme und Duplicate Content automatisch, als Teil des vollständigen SEO-Scans.

Jetzt scannen →

Experiment: Der Duplicate-Content-Test

Gib site:deinedomain.de in Google ein. Zähle die Ergebnisse. Öffne die Google Search Console und schau unter „Seiten" wie viele Seiten indexiert sind. Liegt die Differenz über 20 Prozent, hast du ein Duplicate-Problem.

2 Minuten, keine Tools nötig

2. Google Search Console: Coverage Report

Noch besser: GSC zeigt dir explizit, welche Seiten Google nicht indexiert hat und warum.

Öffne Google Search Console
Geh zu „Abdeckung"
Filtere nach „Nicht indexiert"
Lies die Gründe: „Dupliziert von" ist das rote Signal

Google sagt dir direkt: „Diese Seite ist ein Duplikat von dieser URL hier."

3. Screaming Frog: Der Heavy-Hitter

Für systematische Crawls: Screaming Frog ist dein Werkzeug.

Download: screamingfrog.co.uk
Crawl deine Domain
Geh zum Tab „Duplicate"
Sortiere nach „Duplicate Status"

Screaming Frog zeigt dir jedes Duplikat mit Links, Text-Länge und Ähnlichkeit. Du siehst sofort: „Diese 28 URLs sind identisch mit dieser hier."

Die Lösung: Canonical Tags

Ein Canonical Tag ist eine HTML-Zeile, die Google sagt: „Diese Seite ist ein Duplikat. Die echte Version ist diese hier."

Google respektiert das und indexiert nur die echte Version. Alle Links und Signale fließen zur Canonical URL. Das ist der Gamechanger.

Wie man einen Canonical Tag setzt

Im <head> deiner HTML:

Das war's. Eine Zeile. Das ist ein Canonical Tag.

Übersetzung: „Diese Seite ist ein Duplikat. Die Canonical Version ist https://www.beispiel.de/artikel."

Self-Referential Canonicals

Die Best Practice: Jede Seite hat einen Canonical Tag, der auf sich selbst zeigt. Das ist die sicherste Variante, weil für jeden Content klar ist: „Das hier bin ich. Nicht zu verwechseln."

<link rel="canonical" href="https://www.beispiel.de/artikel">
<!-- Diese Zeile steht auf https://www.beispiel.de/artikel -->

Canonical bei Duplikaten

Wenn du Duplikate hast (z.B. www und non-www laufen parallel), dann:

<!-- Auf https://www.beispiel.de/artikel -->
<link rel="canonical" href="https://www.beispiel.de/artikel">

<!-- Auf https://beispiel.de/artikel -->
<link rel="canonical" href="https://www.beispiel.de/artikel">
<!-- Zeigt auf die www-Version -->

Beide Versionen zeigen auf die gleiche Canonical URL. Google indexiert nur eine.

Canonical bei Paginierten Inhalten

Bei Seite 1, 2, 3 gibt es zwei Strategien:

Strategie 1: Jede Seite referenziert sich selbst

<!-- Seite 1 -->
<link rel="canonical" href="https://www.beispiel.de/artikel?page=1">

<!-- Seite 2 -->
<link rel="canonical" href="https://www.beispiel.de/artikel?page=2">

Strategie 2: Alle Seiten zeigen auf Seite 1

<!-- Seite 2 -->
<link rel="canonical" href="https://www.beispiel.de/artikel">
<!-- Zeigt auf Seite 1, nicht auf Seite 2 -->

Strategie 1 ist moderner. Strategie 2 war früher beliebt, fragmentiert aber trotzdem Rankings.

Problem	Canonical-Lösung	Oder: 301 Redirect?
www vs. non-www	Alle zeigen auf www (oder umgekehrt)	Ja: 301 redirect non-www → www
Trailing Slash	Einigung auf /artikel oder /artikel/	Ja: 301 redirect /artikel → /artikel/
URL-Parameter (Analytics)	Canonical ohne Parameter	Nein: würde Traffic-Tracking zerstören
Produktvarianten	Canonical auf Basis-URL	Nein: würde Varianten unsichtbar machen
Print-Version	Print zeigt auf Normal-Version	Ja: 301 redirect /artikel?print → /artikel

Weitere Lösungen: 301 Redirects, noindex, hreflang

301 Redirect: Die permanente Umleitung

Ein 301 Redirect ist nicht dasselbe wie ein Canonical Tag. Redirect ist eine Umleitung. Der User und Google landen auf der neuen URL. Der alte Link-Saft fließt vollständig zur neuen Version.

Tools wie threefor.one scannen deine Seite in unter 60 Sekunden auf genau diese Probleme.

server redirect /artikel-alt.html → /artikel.html

Canonical hingegen sagt: „Zeigen Sie diese alte URL an, aber wissen Sie, dass die echte Version diese hier ist."

301 Redirect, wenn du eine alte URL loswirst (z.B. alte Kategorie). Canonical, wenn beide URLs parallel existieren müssen.

noindex: unsichtbar machen

Für Seiten, die nicht indexiert werden sollen:

Das ist aggressiver als Canonical. Google indexiert die Seite gar nicht erst. Wird selten verwendet, manchmal für Filter-Kombinationen in E-Commerce sinnvoll.

hreflang: Für mehrsprachige Websites

Wenn du Deutsch und Englisch hast:

<!-- Auf der deutschen Seite -->
<link rel="alternate" hreflang="de" href="https://www.beispiel.de/artikel">
<link rel="alternate" hreflang="en" href="https://www.example.de/en/article">

<!-- Auf der englischen Seite -->
<link rel="alternate" hreflang="en" href="https://www.example.de/en/article">
<link rel="alternate" hreflang="de" href="https://www.beispiel.de/artikel">

hreflang sagt Google: „Es gibt mehrere Sprachversionen. Zeig jedem User die richtige Sprache."

Google bestraft Duplicate Content nicht. Es wählt einfach eine Version aus und ignoriert den Rest. Das Problem ist: Es wählt nicht immer die richtige. Google Search Central, 2024

Das ist der Kern: Google bestraft dich nicht für Duplikate. Es ignoriert sie einfach. Das klingt harmlos. Ist es aber nicht.

Wenn Google deine Desktop-Version ignoriert und die Mobile-Version indexiert, schlechter Tausch. Wenn Google deine englische Version indexiert und die deutsche ist besser, Pech. Wenn Google die Parameter-Version indexiert, obwohl die Parameter-freie Version stärker ist, Pech.

Canonical Tags sind deine Stimme in diesem Prozess. Canonical sagt: „Indexier diese Version, nicht diese." Google respektiert das in 99 Prozent der Fälle.

Der Unterschied zwischen Canonical und 301 Redirects

Das wird oft verwechselt. Hier die klare Unterscheidung:

Canonical: „Diese Seite existiert, aber die echte Version ist woanders. Zeig denen, die herkamen, diese alte Seite. Aber indexier nur die echte Version."
301 Redirect: „Diese Seite existiert nicht mehr. Leite alle Besucher zur neuen Seite weiter. Der User sieht die alte URL nicht."

Canonical ist subtil. 301 ist eine echte Umleitung.

Canonical, wenn URL-Varianten parallel existieren müssen (www und non-www gleichzeitig, Parameter-Versionen für Analytics). 301, wenn du eine alte Version abstellst und willst, dass alle zur neuen gehen.

Praktischer Checklisten-Check

Um Duplicate Content in deinem Projekt zu identifizieren:

Gib site:deinedomain.de in Google ein. Zähle Ergebnisse.
Öffne Google Search Console. Geh zu „Abdeckung". Filtere nach „Nicht indexiert".
Liegt die Differenz über 20 Prozent, hast du fast immer Duplicate Content.
Crawle mit Screaming Frog (kostenlos bis 500 URLs). Geh zum Tab „Duplicate".
Check: Existiert deine Domain unter www und non-www parallel? 301 redirect oder Canonical Tag.
Check: Werden URL-Parameter (utm_, sessionid) für Tracking verwendet? Canonical setzt diese weg.
Check: Hast du Print-Versionen oder Filter-Parameter? Canonical oder noindex.
Check: Haben alle Seiten einen Canonical Tag? (Selbst-referenziell ist ok).

Häufig gestellte Fragen

: Ja. Canonical Tags sagen nicht „indexier diese Seite nicht." Sie sagen „diese Seite ist eine Kopie, die echte Version ist woanders." Google crawlt und indexiert die Duplikat-Seite trotzdem. Der Unterschied: Beim Ranken werden Signale auf die Canonical URL konsolidiert.
: Ja. Das ist häufig: Du hast www.beispiel.de und beispiel.de. Beide zeigen auf www-Version via Canonical. Oder du hast deinseite.de und deinseite-alt.de (alte Domain). Beide zeigen auf die neue Version.
: Google ignoriert falsche oder widersprüchliche Canonical Tags meist einfach. Du bekommst keine „Bestrafung" im klassischen Sinne. Aber wenn alle deine Seiten auf die gleiche Canonical URL zeigen (falsch), wird nur eine indexiert. Das ist nicht böse, aber ineffektiv.
: Best Practice: Ja. Selbst-referenziell (jeder Post zeigt auf sich). Das verhindert, dass jemand die Seite mit ?page=1 oder &utm_source=twitter anhängt und Google die Varianten als unterschiedliche Inhalte behandelt.
: Nein. Wenn du einen 301 Redirect setzt, braucht die alte Seite keinen Canonical Tag mehr. Der Redirect ist definit. Der Canonical kommt erst danach.
: Nach 4–8 Wochen: Schau in GSC unter „Abdeckung". Die Zahl der nicht indexierten Seiten sinkt. Screaming Frog zeigt weniger Duplikate. Site-Suche und GSC rücken näher zusammen. Und: Dein Traffic steigt, weil der Linkjuice jetzt konzentriert ist statt fragmentiert.

Duplicate Content: Warum Google deine Seite ignoriert

Was ist Duplicate Content? Die beiden Typen

Wie Duplicate Content entsteht (ohne dass du es merkst)

URL-Varianten: Das www vs. non-www Problem

Trailing Slashes

URL-Parameter und Session-IDs

Paginierung und Filter

Print-Versionen und mobile Varianten

Produktvarianten in Shops

Warum das SEO-Ranking zerstört

Wie du Duplicate Content findest

1. Site-Suche in Google

2. Google Search Console: Coverage Report

3. Screaming Frog: Der Heavy-Hitter

Die Lösung: Canonical Tags

Wie man einen Canonical Tag setzt

Self-Referential Canonicals

Canonical bei Duplikaten

Canonical bei Paginierten Inhalten

Weitere Lösungen: 301 Redirects, noindex, hreflang

301 Redirect: Die permanente Umleitung

noindex: unsichtbar machen

hreflang: Für mehrsprachige Websites

Der Unterschied zwischen Canonical und 301 Redirects

Praktischer Checklisten-Check

Häufig gestellte Fragen

Verwandte Artikel

Quellen

Was ist Duplicate Content? Die beiden Typen

Wie Duplicate Content entsteht (ohne dass du es merkst)

URL-Varianten: Das www vs. non-www Problem

Trailing Slashes

URL-Parameter und Session-IDs

Paginierung und Filter

Print-Versionen und mobile Varianten

Produktvarianten in Shops

Warum das SEO-Ranking zerstört

Wie du Duplicate Content findest

1. Site-Suche in Google

2. Google Search Console: Coverage Report

3. Screaming Frog: Der Heavy-Hitter

Die Lösung: Canonical Tags

Wie man einen Canonical Tag setzt

Self-Referential Canonicals

Canonical bei Duplikaten

Canonical bei Paginierten Inhalten

Weitere Lösungen: 301 Redirects, noindex, hreflang

301 Redirect: Die permanente Umleitung

noindex: unsichtbar machen

hreflang: Für mehrsprachige Websites

Der Unterschied zwischen Canonical und 301 Redirects

Praktischer Checklisten-Check

Häufig gestellte Fragen

Verwandte Artikel

Quellen

Weiterlesen