WHILE.CHAT·WORK · SEO·11 MIN·Max Götte
Duplicate Content: Warum Google dich ignoriert
work · SEOJuni 202611 Min. LesezeitMax Götte

Duplicate Content: Warum Google dich ignoriert

Du hast 40 Seiten. Google indexiert 12. Die anderen 28 existieren für Google nicht, weil sie sich zu ähnlich sind.

Das ist nicht Zufall. Das ist Duplicate Content. Eine stille SEO-Katastrophe, die deine Rankings kostet, ohne dass du sie je bemerken wirst.

Google nennt es diplomatisch „Canonical Issues". Was es bedeutet: Diese 28 Seiten sind unsichtbar für die Suchmaschine. Dein Traffic verliert bis zu 70 Prozent. Dein Linkjuice zerstreut sich wie Wasser auf 28 URLs, statt sich auf einer zu konzentrieren.

Die schlechte Nachricht: Duplicate Content ist alltäglich. Du brauchst nicht mal ein kaputtes System. Er entsteht unbemerkt durch die architektonische Naivität von URLs.

Die gute Nachricht: Canonical Tags sind die Antwort. Eine einzige Zeile HTML. Und plötzlich funktioniert wieder alles.

// 01 / 09Was ist Duplicate Content? Die beiden Typen

Duplicate Content kommt in zwei Varianten: Exact Duplicates und Near-Duplicates.

Exact Duplicates sind pixel-identische Seiten. Derselbe Text, derselbe HTML, nur die URL ist anders. Das klassische Beispiel: www.beispiel.de und beispiel.de, beide existieren, sind aber inhaltlich identisch. Google weiß nicht, welche „die echte" ist und indexiert nur eine (oder keine).

Near-Duplicates sind tückischer. Sie sind zu 90 Prozent identisch. Das Template ist gleich, die Navigation ist gleich, nur ein Parameter hat sich geändert oder es ist eine leicht gekürzte Version. Google erkennt sie als „wahrscheinlich das gleiche" und indexiert nur die Version mit den höchsten Signalen, also nicht zwingend deine bevorzugte.

Beide Fälle haben die gleiche Konsequenz: Linkpower wird fragmentiert, Rankings werden verwässert, Traffic verschwindet.

// 02 / 09Wie Duplicate Content entsteht (ohne dass du es merkst)

Erste Reaktion meistens: „Wieso sollte ich identische Seiten haben?" Die Antwort: Du hast sie schon, du siehst sie nur nicht.

URL-Varianten: Das www vs. non-www Problem

Die meisten Websites existieren unter mehreren URLs:

  • https://www.beispiel.de/artikel
  • https://beispiel.de/artikel (ohne www)
  • http://www.beispiel.de/artikel (insecure)
  • http://beispiel.de/artikel (insecure + kein www)

Das sind vier URLs. Der Inhalt ist identisch. Google sieht vier Seiten und weiß nicht, welche die „Hauptversion" ist.

Trailing Slashes

Auch ein simpler Schrägstrich am Ende erzeugt Duplikate:

  • https://www.beispiel.de/artikel
  • https://www.beispiel.de/artikel/

Technisch sind das zwei URLs. Server behandeln sie manchmal als unterschiedlich. Google auch, und indexiert dann beide als eigenständige Seiten.

URL-Parameter und Session-IDs

Analytics-Parameter, Session-IDs, Tracking-IDs: Sie ändern die URL, aber nicht den Inhalt.

  • https://www.beispiel.de/artikel?utm_source=newsletter
  • https://www.beispiel.de/artikel?utm_source=social
  • https://www.beispiel.de/artikel?sessionid=abc123xyz

Jede URL ist eine neue Seite für Google. Der Inhalt ist identisch. Dein Linkjuice zersplittert sich über 50 Varianten.

Paginierung und Filter

E-Commerce ist ein klassischer Duplicate-Content-Ort:

  • https://www.shop.de/produkte
  • https://www.shop.de/produkte?page=2
  • https://www.shop.de/produkte?sort=preis
  • https://www.shop.de/produkte?farbe=blau&größe=M

Alle zeigen unterschiedliche Produkte, aber die ersten 10 Produkte sind auf jeder Seite gleich. Das ist Near-Duplicate Content.

Print-Versionen und mobile Varianten

Ältere Websites haben oft separate URLs für Print-Versionen oder mobile Ansichten:

  • https://www.beispiel.de/artikel (Desktop)
  • https://www.beispiel.de/artikel?print=true (Print-Version)
  • https://m.beispiel.de/artikel (Mobile Subdomain)

Alle Varianten enthalten denselben Text. Google sieht drei Seiten.

Produktvarianten in Shops

Dein Shop hat ein Hemd in Blau, Rot und Grün:

  • https://www.shop.de/hemd
  • https://www.shop.de/hemd?farbe=blau
  • https://www.shop.de/hemd?farbe=rot

95 Prozent der Beschreibung ist identisch. Nur Farbe und Preis ändern sich. Google sieht drei Produkte und fragmentiert die Linkpower auf alle drei Varianten.

// 03 / 09Warum das SEO-Ranking zerstört

Das Problem ist nicht, dass Google dich bestraft. Das Problem ist, dass Google verwirrt ist.

Du hast einen Artikel mit 50 Backlinks. Dann fragmentierst du ihn unbemerkt in 3 URL-Varianten. Jetzt hat jede Variante 17 Links. Ein einzelner Link zu jeder Variante ist schwächer als 50 Links zu einer Variante. Plötzlich rankst du schlechter, ohne dass du etwas gemacht hast.

Dazu kommt: Google indexiert pro Topic nur eine Version. Sie wählen die „beste", aber die beste ist nicht immer deine beste. Wenn Google die mobile Variante als Canonical wählt, dein Desktop aber die bessere ist, Pech. Du rankst mit der Mobile-Version, obwohl deine Desktop-Version stärker ist.

Zuletzt: Das Crawl-Budget zerfällt. Google hat nur eine begrenzte Anzahl Crawl-Anfragen pro Tag für deine Domain. Wenn die Hälfte davon auf Duplikate verschwendet wird, crawlt Google weniger neue Inhalte. Neue Inhalte indexieren langsamer. Neue Rankings entstehen langsamer.

// 04 / 09Wie du Duplicate Content findest

1. Site-Suche in Google

Das schnellste Experiment:

site:deinedomain.de

Das zeigt alle indexierten Seiten. Zähle die Ergebnisse. Dann:

2. Google Search Console: Coverage Report

Noch besser: GSC zeigt dir explizit, welche Seiten Google nicht indexiert hat und warum.

  • Öffne Google Search Console
  • Geh zu „Abdeckung"
  • Filtere nach „Nicht indexiert"
  • Lies die Gründe: „Dupliziert von" ist das rote Signal

Google sagt dir direkt: „Diese Seite ist ein Duplikat von dieser URL hier."

3. Screaming Frog: Der Heavy-Hitter

Für systematische Crawls: Screaming Frog ist dein Werkzeug.

  • Download: screamingfrog.co.uk
  • Crawl deine Domain
  • Geh zum Tab „Duplicate"
  • Sortiere nach „Duplicate Status"

Screaming Frog zeigt dir jedes Duplikat mit Links, Text-Länge und Ähnlichkeit. Du siehst sofort: „Diese 28 URLs sind identisch mit dieser hier."

// 05 / 09Die Lösung: Canonical Tags

Ein Canonical Tag ist eine HTML-Zeile, die Google sagt: „Diese Seite ist ein Duplikat. Die echte Version ist diese hier."

Google respektiert das und indexiert nur die echte Version. Alle Links und Signale fließen zur Canonical URL. Das ist der Gamechanger.

Wie man einen Canonical Tag setzt

Im <head> deiner HTML:

<link rel="canonical" href="https://www.beispiel.de/artikel">

Das war's. Eine Zeile. Das ist ein Canonical Tag.

Übersetzung: „Diese Seite ist ein Duplikat. Die Canonical Version ist https://www.beispiel.de/artikel."

Self-Referential Canonicals

Die Best Practice: Jede Seite hat einen Canonical Tag, der auf sich selbst zeigt. Das ist die sicherste Variante, weil für jeden Content klar ist: „Das hier bin ich. Nicht zu verwechseln."

<link rel="canonical" href="https://www.beispiel.de/artikel">
<!-- Diese Zeile steht auf https://www.beispiel.de/artikel -->

Canonical bei Duplikaten

Wenn du Duplikate hast (z.B. www und non-www laufen parallel), dann:

<!-- Auf https://www.beispiel.de/artikel -->
<link rel="canonical" href="https://www.beispiel.de/artikel">

<!-- Auf https://beispiel.de/artikel -->
<link rel="canonical" href="https://www.beispiel.de/artikel">
<!-- Zeigt auf die www-Version -->

Beide Versionen zeigen auf die gleiche Canonical URL. Google indexiert nur eine.

Canonical bei Paginierten Inhalten

Bei Seite 1, 2, 3 gibt es zwei Strategien:

Strategie 1: Jede Seite referenziert sich selbst

<!-- Seite 1 -->
<link rel="canonical" href="https://www.beispiel.de/artikel?page=1">

<!-- Seite 2 -->
<link rel="canonical" href="https://www.beispiel.de/artikel?page=2">

Strategie 2: Alle Seiten zeigen auf Seite 1

<!-- Seite 2 -->
<link rel="canonical" href="https://www.beispiel.de/artikel">
<!-- Zeigt auf Seite 1, nicht auf Seite 2 -->

Strategie 1 ist moderner. Strategie 2 war früher beliebt, fragmentiert aber trotzdem Rankings.

Canonical vs. 301 Redirect je Problemfall Problem Canonical-Lösung Oder: 301 Redirect? www vs. non-www Alle zeigen auf www (oder umgekehrt) Ja: 301 redirect non-www → www Trailing Slash Einigung auf /artikel oder /artikel/ Ja: 301 redirect /artikel → /artikel/ URL-Parameter (Analytics) Canonical ohne Parameter Nein: würde Traffic-Tracking zerstören Produktvarianten Canonical auf Basis-URL Nein: würde Varianten unsichtbar machen Print-Version Print zeigt auf Normal-Version Ja: 301 redirect /artikel?print → /artikel

// 06 / 09Weitere Lösungen: 301 Redirects, noindex, hreflang

301 Redirect: Die permanente Umleitung

Ein 301 Redirect ist nicht dasselbe wie ein Canonical Tag. Redirect ist eine Umleitung. Der User und Google landen auf der neuen URL. Der alte Link-Saft fließt vollständig zur neuen Version.

Tools wie threefor.one scannen deine Seite in unter 60 Sekunden auf genau diese Probleme.

server redirect /artikel-alt.html → /artikel.html

Canonical hingegen sagt: „Zeigen Sie diese alte URL an, aber wissen Sie, dass die echte Version diese hier ist."

301 Redirect, wenn du eine alte URL loswirst (z.B. alte Kategorie). Canonical, wenn beide URLs parallel existieren müssen.

noindex: unsichtbar machen

Für Seiten, die nicht indexiert werden sollen:

<meta name="robots" content="noindex">

Das ist aggressiver als Canonical. Google indexiert die Seite gar nicht erst. Wird selten verwendet, manchmal für Filter-Kombinationen in E-Commerce sinnvoll.

hreflang: Für mehrsprachige Websites

Wenn du Deutsch und Englisch hast:

<!-- Auf der deutschen Seite -->
<link rel="alternate" hreflang="de" href="https://www.beispiel.de/artikel">
<link rel="alternate" hreflang="en" href="https://www.example.de/en/article">

<!-- Auf der englischen Seite -->
<link rel="alternate" hreflang="en" href="https://www.example.de/en/article">
<link rel="alternate" hreflang="de" href="https://www.beispiel.de/artikel">

hreflang sagt Google: „Es gibt mehrere Sprachversionen. Zeig jedem User die richtige Sprache."

// 07 / 09Google bestraft nicht, Google ignoriert

Google bestraft Duplicate Content nicht. Es wählt einfach eine Version aus und ignoriert den Rest. Das Problem ist: Es wählt nicht immer die richtige. Google Search Central, 2024

Das ist der Kern: Google bestraft dich nicht für Duplikate. Es ignoriert sie einfach. Das klingt harmlos. Ist es aber nicht.

Wenn Google deine Desktop-Version ignoriert und die Mobile-Version indexiert, schlechter Tausch. Wenn Google deine englische Version indexiert und die deutsche ist besser, Pech. Wenn Google die Parameter-Version indexiert, obwohl die Parameter-freie Version stärker ist, Pech.

Canonical Tags sind deine Stimme in diesem Prozess. Canonical sagt: „Indexier diese Version, nicht diese." Google respektiert das in 99 Prozent der Fälle.

// 08 / 09Der Unterschied zwischen Canonical und 301 Redirects

Das wird oft verwechselt. Hier die klare Unterscheidung:

  • Canonical: „Diese Seite existiert, aber die echte Version ist woanders. Zeig denen, die herkamen, diese alte Seite. Aber indexier nur die echte Version."
  • 301 Redirect: „Diese Seite existiert nicht mehr. Leite alle Besucher zur neuen Seite weiter. Der User sieht die alte URL nicht."

Canonical ist subtil. 301 ist eine echte Umleitung.

Canonical, wenn URL-Varianten parallel existieren müssen (www und non-www gleichzeitig, Parameter-Versionen für Analytics). 301, wenn du eine alte Version abstellst und willst, dass alle zur neuen gehen.

// 09 / 09Praktischer Checklisten-Check

Um Duplicate Content in deinem Projekt zu identifizieren:

  • Gib site:deinedomain.de in Google ein. Zähle Ergebnisse.
  • Öffne Google Search Console. Geh zu „Abdeckung". Filtere nach „Nicht indexiert".
  • Liegt die Differenz über 20 Prozent, hast du fast immer Duplicate Content.
  • Crawle mit Screaming Frog (kostenlos bis 500 URLs). Geh zum Tab „Duplicate".
  • Check: Existiert deine Domain unter www und non-www parallel? 301 redirect oder Canonical Tag.
  • Check: Werden URL-Parameter (utm_, sessionid) für Tracking verwendet? Canonical setzt diese weg.
  • Check: Hast du Print-Versionen oder Filter-Parameter? Canonical oder noindex.
  • Check: Haben alle Seiten einen Canonical Tag? (Selbst-referenziell ist ok).

Häufig gestellte Fragen

Verwandte Artikel

SEO-Audit-Anleitung: 12 Checks für 98 Prozent deiner Probleme, Ein vollständiger Audit-Prozess, in dem Duplicate Content ein kritischer Check ist.

Google SEO Grundlagen 2026: Was du wissen musst, Technisches SEO-Fundament mit Crawl-Budget, Indexierung, Rankings.

SEO-Leitfaden 2026: Content, Tech, Links, Conversions, Strategischer Überblick über Duplicate Content im größeren SEO-Kontext.

threefor.one, Kostenloser SEO-Audit, 19 Dimensionen, unter 60 Sekunden, keine Anmeldung.

Quellen

  • Google Search Central. (2024). "Duplicate content issues and how to handle them." https://developers.google.com/search/docs/advanced/crawling/duplicate-content
  • Moz. (2024). "Canonicalization: A Practical Guide to SEO Canonical Tags." https://moz.com/learn/seo/canonicalization
  • Ahrefs. (2024). "Duplicate Content: How to Find and Fix It." https://ahrefs.com/blog/duplicate-content/
  • Search Engine Journal. (2023). "The Ultimate Guide to Canonical Tags and How They Affect SEO." https://www.searchenginejournal.com/canonical-tags-seo/
  • Google. (2023). "Google's Handling of Duplicate Content in Search Results." Web.dev Documentation.
  • Screaming Frog. (2024). "SEO Spider: Duplicate Content Detection." https://www.screamingfrog.co.uk/

MG

Max Götte

SEO Strategist · Founder · while.chat

SEO-Berater aus Bochum. Schreibt über technisches SEO, Local SEO und Generative Engine Optimization für KMU im DACH-Raum. Kein Newsletter (noch nicht), aber erreichbar per Mail.

about → hello@while.chat mehr artikel

FAQ

Werden Seiten mit Canonical Tags noch indexiert?

Ja. Canonical Tags sagen nicht „indexier diese Seite nicht." Sie sagen „diese Seite ist eine Kopie, die echte Version ist woanders." Google crawlt und indexiert die Duplikat-Seite trotzdem. Der Unterschied: Beim Ranken werden Signale auf die Canonical URL konsolidiert.

Kann ich Canonical auf eine andere Domain zeigen?

Ja. Das ist häufig: Du hast www.beispiel.de und beispiel.de. Beide zeigen auf www-Version via Canonical. Oder du hast deinseite.de und deinseite-alt.de (alte Domain). Beide zeigen auf die neue Version.

Bestraft Google mich, wenn ich Canonical falsch nutze?

Google ignoriert falsche oder widersprüchliche Canonical Tags meist einfach. Du bekommst keine „Bestrafung" im klassischen Sinne. Aber wenn alle deine Seiten auf die gleiche Canonical URL zeigen (falsch), wird nur eine indexiert. Das ist nicht böse, aber ineffektiv.

Braucht ein Blog jeden Post Canonical Tags?

Best Practice: Ja. Selbst-referenziell (jeder Post zeigt auf sich). Das verhindert, dass jemand die Seite mit ?page=1 oder &utm_source=twitter anhängt und Google die Varianten als unterschiedliche Inhalte behandelt.

Kann ich Canonical kombinieren mit 301 Redirects?

Nein. Wenn du einen 301 Redirect setzt, braucht die alte Seite keinen Canonical Tag mehr. Der Redirect ist definit. Der Canonical kommt erst danach.

Woran erkenne ich, dass mein Duplicate-Content-Problem gelöst ist?

Nach 4–8 Wochen: Schau in GSC unter „Abdeckung". Die Zahl der nicht indexierten Seiten sinkt. Screaming Frog zeigt weniger Duplikate. Site-Suche und GSC rücken näher zusammen. Und: Dein Traffic steigt, weil der Linkjuice jetzt konzentriert ist statt fragmentiert.