Du hast 40 Seiten. Google indexiert 12. Die anderen 28 existieren für Google nicht — weil sie sich zu ähnlich sind.
Das ist nicht Zufall. Das ist Duplicate Content. Eine stille SEO-Katastrophe, die deine Rankings kostet, ohne dass du sie je bemerken wirst.
Google nennt es diplomatisch "Canonical Issues". Was es wirklich bedeutet: Diese 28 Seiten sind unsichtbar für die Suchmaschine. Dein Traffic verliert 70 Prozent. Dein Linkjuice zerstreut sich wie Wasser auf 28 URLs, statt sich auf einer zu konzentrieren.
Die schlimme Nachricht: Duplicate Content ist alltäglich. Du brauchst nicht mal ein kaputtes System. Er entsteht unbemerkt durch die architektonische Naivität von URLs.
Die gute Nachricht: Canonical Tags sind die Antwort. Eine einzige Zeile HTML. Und plötzlich funktioniert wieder alles.
Was ist Duplicate Content? Die beiden Typen
Duplicate Content kommt in zwei Varianten: Exact Duplicates und Near-Duplicates.
Exact Duplicates sind pixel-identische Seiten. Derselbe Text, derselbe HTML, nur die URL ist anders. Das klassische Beispiel: www.beispiel.de und beispiel.de — beide existieren, sind aber inhaltlich identisch. Google weiß nicht, welche "die echte" ist und indexiert nur eine (oder keine).
Near-Duplicates sind tückischer. Sie sind zu 90 Prozent identisch. Das Template ist gleich, die Navigation ist gleich, nur ein Parameter hat sich geändert oder es ist eine leicht gekürzte Version. Google erkennt sie als "wahrscheinlich das gleiche" und indexiert nur die Version mit den höchsten Signalen — was nicht unbedingt deine bevorzugte Version ist.
Beide Fälle haben die gleiche Konsequenz: Linkpower wird fragmentiert, Rankings werden verwässert, Traffic verschwindet.
Wie Duplicate Content entsteht (ohne dass du es merkst)
Du denkst wahrscheinlich: "Wieso sollte ich identische Seiten haben?" Die Antwort: Wahrscheinlich hast du sie schon.
URL-Varianten: Das www vs. non-www Problem
Die meisten Websites existieren unter mehreren URLs:
https://www.beispiel.de/artikelhttps://beispiel.de/artikel(ohne www)http://www.beispiel.de/artikel(insecure)http://beispiel.de/artikel(insecure + kein www)
Das sind vier URLs. Der Inhalt ist identisch. Google sieht vier Seiten und weiß nicht, welche die "Hauptversion" ist.
Trailing Slashes
Auch ein simpler Schrägstrich am Ende erzeugt Duplikate:
https://www.beispiel.de/artikelhttps://www.beispiel.de/artikel/
Technisch sind das zwei URLs. Server behandeln sie manchmal als unterschiedlich. Google auch — und indexiert möglicherweise beide als eigenständige Seiten.
URL-Parameter und Session-IDs
Analytics-Parameter, Session-IDs, Tracking-IDs: Sie ändern die URL, aber nicht den Inhalt.
https://www.beispiel.de/artikel?utm_source=newsletterhttps://www.beispiel.de/artikel?utm_source=socialhttps://www.beispiel.de/artikel?sessionid=abc123xyz
Jede URL ist eine neue Seite für Google. Der Inhalt ist identisch. Dein Linkjuice zersplittert sich über 50 Varianten.
Paginierung und Filter
E-Commerce ist ein klassischer Duplicate-Content-Ort:
https://www.shop.de/produktehttps://www.shop.de/produkte?page=2https://www.shop.de/produkte?sort=preishttps://www.shop.de/produkte?farbe=blau&größe=M
Alle zeigen unterschiedliche Produkte, aber die ersten 10 Produkte sind auf jeder Seite gleich. Das ist Near-Duplicate Content.
Print-Versionen und mobile Varianten
Ältere Websites haben oft separate URLs für Print-Versionen oder mobile Ansichten:
https://www.beispiel.de/artikel(Desktop)https://www.beispiel.de/artikel?print=true(Print-Version)https://m.beispiel.de/artikel(Mobile Subdomain)
Alle Varianten enthalten denselben Text. Google sieht drei Seiten.
Produktvarianten in Shops
Dein Shop hat ein Hemd in Blau, Rot und Grün:
https://www.shop.de/hemdhttps://www.shop.de/hemd?farbe=blauhttps://www.shop.de/hemd?farbe=rot
95 Prozent der Beschreibung ist identisch. Nur Farbe und Preis ändern sich. Google sieht drei Produkte und fragmentiert die Linkpower auf alle drei Varianten.
Warum das SEO-Ranking zerstört
Das Problem ist nicht, dass Google dich bestraft. Das Problem ist, dass Google verwirrt ist.
Stellt dir vor, du hattest einen Artikel mit 50 Backlinks. Dann fragmentierst du ihn unbemerkt in 3 URL-Varianten. Jetzt hat jede Variante 17 Links. Ein einzelner Link zu jeder Variante ist schwächer als 50 Links zu einer Variante. Plötzlich rankst du schlechter — ohne dass du etwas gemacht hast.
Dazu kommt: Google kann nur eine Version pro Topic crawlen und indexieren. Es wählt die "beste", aber die beste ist nicht immer deine beste. Wenn Google die mobile Variante als Canonical wählt, dein Desktop aber die bessere ist — Pech. Du rankst mit der Mobile-Version, obwohl deine Desktop-Version stärker ist.
Lastly: Der Crawl-Budget zerfällt. Google hat nur X Crawl-Anfragen pro Tag für deine Domain. Wenn die Hälfte davon auf Duplikate verschwendet wird, crawlt Google weniger neue Inhalte. Neue Inhalte indexieren langsamer. Neue Rankings entstehen langsamer.
Wie du Duplicate Content findest
1. Site-Suche in Google
Das schnellste Experiment:
Das zeigt alle indexierten Seiten. Zähle die Ergebnisse. Dann:
threefor.one findet Canonical-Probleme und Duplicate Content automatisch — als Teil des vollständigen SEO-Scans.
Jetzt scannen →Experiment: Der Duplicate-Content-Test
Gib site:deinedomain.de in Google ein. Zähle die Ergebnisse. Öffne die Google Search Console und schau unter "Seiten" wieviele Seiten indexiert sind. Wenn die Differenz größer als 20 Prozent ist — du hast ein Duplicate-Problem.
2. Google Search Console: Coverage Report
Noch besser: GSC zeigt dir explizit, welche Seiten Google nicht indexiert hat und warum.
- Öffne Google Search Console
- Geh zu "Abdeckung"
- Filtere nach "Nicht indexiert"
- Lies die Gründe: "Dupliziert von" ist das rote Signal
Google sagt dir direkt: "Diese Seite ist ein Duplikat von dieser URL hier."
3. Screaming Frog: Der Heavy-Hitter
Für systematische Crawls: Screaming Frog ist dein Werkzeug.
- Download: screamingfrog.co.uk
- Crawl deine Domain
- Geh zu "Duplicate" Tab
- Sortiere nach "Duplicate Status"
Screaming Frog zeigt dir jedes Duplikat mit Links, Text-Länge und Ähnlichkeit. Du siehst sofort: "Diese 28 URLs sind identisch mit dieser hier."
Die Lösung: Canonical Tags
Ein Canonical Tag ist eine HTML-Zeile, die Google sagt: "Diese Seite ist ein Duplikat. Die echte Version ist diese hier."
Google respektiert das und indexiert nur die echte Version. Alle Links und Signale fließen zur Canonical URL. Das ist der Gamechanger.
Wie man einen Canonical Tag setzt
Im <head> deiner HTML:
Das war's. Eine Zeile. Das ist ein Canonical Tag.
Was es bedeutet: "Diese Seite ist möglicherweise ein Duplikat. Die Canonical Version ist https://www.beispiel.de/artikel."
Self-Referential Canonicals
Die Best Practice: Jede Seite hat einen Canonical Tag, der auf sich selbst zeigt. Das ist die sicherste Variante, weil es für jeden Content klar ist: "Das hier bin ich. Nicht zu verwechseln."
Canonical bei Duplikaten
Wenn du wirklich Duplikate hast (z.B. www und non-www laufen parallel), dann:
Beide Versionen zeigen auf die gleiche Canonical URL. Google indexiert nur eine.
Canonical bei Paginierten Inhalten
Bei Seite 1, 2, 3 gibt es zwei Strategien:
Strategie 1: Jede Seite referenziert sich selbst
Strategie 2: Alle Seiten zeigen auf Seite 1
Strategie 1 ist moderner. Strategie 2 war früher beliebt, fragmentiert aber trotzdem Rankings.
| Problem | Canonical-Lösung | Oder: 301 Redirect? |
|---|---|---|
| www vs. non-www | Alle zeigen auf www (oder umgekehrt) | Ja: 301 redirect non-www → www |
| Trailing Slash | Einigung auf /artikel oder /artikel/ | Ja: 301 redirect /artikel → /artikel/ |
| URL-Parameter (Analytics) | Canonical ohne Parameter | Nein: würde Traffic-Tracking zerstören |
| Produktvarianten | Canonical auf Basis-URL | Nein: würde Varianten unsichtbar machen |
| Print-Version | Print zeigt auf Normal-Version | Ja: 301 redirect /artikel?print → /artikel |
Weitere Lösungen: 301 Redirects, noindex, hreflang
301 Redirect: Die permanente Umleitung
Ein 301 Redirect ist nicht dasselbe wie ein Canonical Tag. Redirect ist eine Umleitung. Der User und Google landen auf der neuen URL. Der alte Link-Saft fließt vollständig zur neuen Version.
Tools wie threefor.one scannen deine Seite in unter 60 Sekunden auf genau diese Probleme.
Canonical hingegen sagt: "Zeigen Sie diese alte URL an, aber wissen Sie, dass die echte Version diese hier ist."
Wann 301 Redirect?: Wenn du eine alte URL loswirst (z.B. alte Kategorie). Wann Canonical?: Wenn beide URLs parallel existieren und müssen.
noindex: Die unsichtbar machen
Für Seiten, die nicht indexiert werden sollen:
Das ist aggressiver als Canonical. Google indexiert die Seite gar nicht erst. Wird selten verwendet, manchmal für Filter-Kombinationen in E-Commerce sinnvoll.
hreflang: Für mehrsprachige Websites
Wenn du Deutsch und Englisch hast:
hreflang sagt Google: "Es gibt mehrere Sprachversionen. Zeigen Sie jedem User die richtige Sprache."
Google bestraft Duplicate Content nicht. Es wählt einfach eine Version aus und ignoriert den Rest. Das Problem ist: Es wählt nicht immer die richtige. Google Search Central, 2024
Das ist der Kern: Google bestraft dich nicht für Duplikate. Es ignoriert sie einfach. Das klingt harmlos. Ist es aber nicht.
Wenn Google deine Desktop-Version ignoriert und die Mobile-Version indexiert — schlechter Tausch. Wenn Google deine englische Version indexiert und die deutsche ist besser — Pech. Wenn Google die Parameter-Version indexiert, obwohl die Parameter-freie Version stärker ist — Pech.
Canonical Tags sind deine Stimme in diesem Prozess. Canonical sagt: "Indexier diese Version, nicht diese." Google respektiert das in 99 Prozent der Fälle.
Der Unterschied zwischen Canonical und 301 Redirects
Das wird oft verwechselt. Hier die klare Unterscheidung:
- Canonical: "Diese Seite existiert, aber die echte Version ist woanders. Zeigen Sie denen, die herkamen, diese alte Seite. Aber indexieren Sie nur die echte Version."
- 301 Redirect: "Diese Seite existiert nicht mehr. Leiten Sie alle Besucher zur neuen Seite weiter. Der User sieht nicht die alte URL."
Canonical ist subtil. 301 ist eine echte Umleitung.
Wann Canonical?: URL-Varianten müssen parallel existieren (www und non-www gleichzeitig, Parameter-Versionen für Analytics). Wann 301?: Du stellst eine alte Version ab und willst dass alle zur neuen gehen.
Praktischer Checklisten-Check
Um Duplicate Content in deinem Projekt zu identifizieren:
- Gib
site:deinedomain.dein Google ein. Zähle Ergebnisse. - Öffne Google Search Console. Geh zu "Abdeckung". Filtere nach "Nicht indexiert".
- Liegt die Differenz über 20 Prozent? Duplicate Content ist wahrscheinlich.
- Crawle mit Screaming Frog (kostenlos bis 500 URLs). Geh zum "Duplicate" Tab.
- Check: Existiert deine Domain unter www und non-www parallel? 301 redirect oder Canonical Tag.
- Check: Werden URL-Parameter (utm_, sessionid) für Tracking verwendet? Canonical setzt diese weg.
- Check: Hast du Print-Versionen oder Filter-Parameter? Canonical oder noindex.
- Check: Haben alle Seiten einen Canonical Tag? (Selbst-referenziell ist ok).
Häufig gestellte Fragen
Werden Seiten mit Canonical Tags noch indexiert?
Ja. Canonical Tags sagen nicht "indexiert diese Seite nicht." Sie sagen "diese Seite ist eine Kopie, die echte Version ist woanders." Google crawlt und indexiert die Duplikat-Seite trotzdem. Der Unterschied: Beim Ranken werden Signale auf die Canonical URL konsolidiert.
Kann ich Canonical auf eine andere Domain zeigen?
Ja. Das ist häufig: Du hast www.beispiel.de und beispiel.de. Beide zeigen auf www-Version via Canonical. Oder du hast deinseite.de und deinseite-alt.de (alte Domain). Beide zeigen auf die neue Version.
Bestraft Google mich, wenn ich Canonical falsch nutze?
Google ignoriert falsche oder widersprüchliche Canonical Tags meist einfach. Du bekommst keine "Bestrafung" im klassischen Sinne. Aber wenn alle deine Seiten auf die gleiche Canonical URL zeigen (falsch), wird nur eine indexiert. Das ist nicht böse, aber ineffektiv.
Braucht ein Blog jeden Post Canonical Tags?
Best Practice: Ja. Selbst-referenziell (jeder Post zeigt auf sich). Das verhindert, dass jemand die Seite mit ?page=1 oder &utm_source=twitter anhängt und Google die Varianten als unterschiedliche Inhalte behandelt.
Kann ich Canonical kombinieren mit 301 Redirects?
Nein. Wenn du einen 301 Redirect setzt, braucht die alte Seite keinen Canonical Tag mehr. Der Redirect ist definit. Der Canonical kommt erst danach.
Woran erkenne ich, dass mein Duplicate-Content-Problem gelöst ist?
Nach 4-8 Wochen: Schau in GSC unter "Abdeckung". Die Zahl der nicht indexierten Seiten sollte sinken. Screaming Frog zeigt weniger Duplikate. Site-Suche und GSC sollten näher zusammenrücken. Und: Dein Traffic sollte steigen, weil der Linkjuice jetzt konzentriert ist statt fragmentiert.
Verwandte Artikel
SEO-Audit-Anleitung: 12 Checks für 98 Prozent deiner Probleme — Ein vollständiger Audit-Prozess, in dem Duplicate Content ein kritischer Check ist.
Google SEO Grundlagen 2026: Was du wirklich wissen musst — Technisches SEO-Fundament mit Crawl-Budget, Indexierung, Rankings.
SEO-Leitfaden 2026: Content, Tech, Links, Conversions — Strategischer Überblick über Duplicate Content im größeren SEO-Kontext.
threefor.one — Kostenloser SEO-Audit — 19 Dimensionen, unter 60 Sekunden, keine Anmeldung.
Quellen
- Google Search Central. (2024). "Duplicate content issues and how to handle them." https://developers.google.com/search/docs/advanced/crawling/duplicate-content
- Moz. (2024). "Canonicalization: A Practical Guide to SEO Canonical Tags." https://moz.com/learn/seo/canonicalization
- Ahrefs. (2024). "Duplicate Content: How to Find and Fix It." https://ahrefs.com/blog/duplicate-content/
- Search Engine Journal. (2023). "The Ultimate Guide to Canonical Tags and How They Affect SEO." https://www.searchenginejournal.com/canonical-tags-seo/
- Google. (2023). "Google's Handling of Duplicate Content in Search Results." Web.dev Documentation.
- Screaming Frog. (2024). "SEO Spider: Duplicate Content Detection." https://www.screamingfrog.co.uk/