SEO & PR

Duplicate Content erkennen und vermeiden — was doppelte Inhalte für SEO bedeuten

Duplicate Content kann ganze Webseiten aus dem Google-Index werfen — auch unbeabsichtigt. Hier die 6 typischen Ursachen, wie Sie sie erkennen und mit kanonischen Tags wirksam beheben.

3 Min LesezeitVon newsflow24-Redaktion

Duplicate Content — also identische oder fast identische Inhalte auf verschiedenen URLs — ist eines der häufigsten SEO-Probleme. Schlimmstenfalls werden ganze Webseiten aus dem Google-Index gewertet oder massiv im Ranking abgewertet. Hier die 6 typischen Ursachen, wie Sie Duplicate Content erkennen und mit den richtigen Tools beheben.

Was ist Duplicate Content genau?

Google unterscheidet:

Duplicate-Content-frei mit eigenem Text pro Pressemitteilung.

Bei newsflow24 verfasst du pro Veröffentlichung einen eigenen Text — keine Duplicate-Content-Risiken, voller dofollow-Backlink-Wert.

  • Internal Duplicate Content: Gleiche Inhalte auf verschiedenen URLs der EIGENEN Domain
  • External Duplicate Content: Gleiche Inhalte auf verschiedenen Domains
  • Near-Duplicate: Sehr ähnliche, aber nicht identische Inhalte

Alle drei Varianten können SEO-Schaden verursachen. Mehr zur Google-Logik in der offiziellen Canonicalization-Doku.

Die 6 typischen Ursachen für Duplicate Content

1. Pressemitteilungs-Massenverteilung

Klassischer Fall: Identische Pressemitteilung wird auf 50-100 Online-Portalen veröffentlicht. Google sieht das als Duplicate Content und wertet ALLE Vorkommen ab. Mehr im Artikel Stolperfallen in der Online-PR.

Lösung: Pro Portal eigene Variante schreiben. Aufwand: 15-20 Min pro Variante. Ergibt zwar weniger Veröffentlichungen, aber jede mit voller SEO-Wirkung.

2. WWW + ohne WWW

www.firma.de und firma.de sind technisch zwei verschiedene URLs. Wenn beide indexiert werden — Duplicate Content.

Lösung: 301-Redirect von einer auf die andere Variante. Plus: Canonical-Tag auf jeder Seite zur bevorzugten URL.

3. HTTP + HTTPS

Wenn die Webseite sowohl unter http:// als auch unter https:// erreichbar ist — Duplicate.

Lösung: 301-Redirect von HTTP auf HTTPS. Heute Standard.

4. URL-Parameter (Tracking, Session-IDs)

firma.de/produkt und firma.de/produkt?utm_source=newsletter werden als verschiedene URLs gewertet — gleicher Inhalt.

Lösung: Canonical-Tag auf die saubere URL ohne Parameter setzen.

5. Druck-Versionen / Mobile-Subdomain

firma.de/artikel + firma.de/artikel/print + m.firma.de/artikel — drei verschiedene URLs für denselben Inhalt.

Lösung: Canonical-Tags + responsive Webseite (statt separater Mobile-Subdomain).

6. Mehrere Sprach-Versionen ohne hreflang

firma.de/de/artikel + firma.com/en/article — wenn die englische Version eine maschinelle Übersetzung ohne signifikante Änderungen ist, kann Google das als Duplicate werten.

Lösung: hreflang-Tags pro Sprach-Version + signifikant verschiedene Inhalte (nicht nur Wort-für-Wort-Übersetzung).

Tools zur Erkennung

ToolFunktionKosten
Google Search ConsoleCoverage-Report zeigt Duplicate-IssuesKostenlos
Screaming Frog SEO SpiderCrawled die ganze Webseite, findet DuplicatesKostenlos bis 500 URLs
SistrixDuplicate-Content-ModulAb 100 €/Monat
CopyscapeExternal Duplicate Content (anderswo im Web)Ab $0,05 pro Suche
SitelinerInternal Duplicate ContentKostenlos bis 250 Seiten

Lösung: Canonical-Tag im Detail

Der Canonical-Tag sagt Google: „Diese URL ist die bevorzugte Variante, alle anderen ähnlichen URLs sind Duplikate, ranke nur diese."

Implementation im HTML-Head:

<link rel="canonical" href="https://www.firma.de/saubere-url" />

Wichtig: Canonical-Tag muss auf jeder Seite gesetzt sein (auch auf der Original-Seite, dann self-referencing). Sonst weiß Google nicht, was kanonisch ist.

Spezialfall: Pressemitteilung auf eigener Webseite UND Online-Portalen

Ein häufiges Szenario: Sie veröffentlichen eine PM auf Ihrem eigenen Newsroom + zusätzlich auf einem externen Online-Portal. Frage: Duplicate Content?

Ja — wenn der Text 1:1 identisch ist. Nein — wenn beide Versionen leicht unterschiedlich sind.

Best Practice:

  • Newsroom-Version: Vollständig, mit allen Details
  • Portal-Version: Eigene Headline, leicht angepasster Body, ggf. ergänzende Bilder
  • Newsroom-Version setzt Canonical-Tag auf sich selbst (self-referencing)

Wie schnell wirkt sich Duplicate Content aus?

  • Bei wenigen Duplicates: Oft kein direkter Schaden — Google wählt einfach eine Variante
  • Bei systematischer Massen-Duplicate (z.B. 50 Pressemitteilungen): Indexierung verzögert sich, Ranking sinkt
  • Bei Spam-artigem Massen-Duplicate: Manuelle Penalty möglich (Domain-weit)

Erholung nach Duplicate-Content-Strafe

Wenn eine Webseite wegen Duplicate Content abgewertet wurde:

  1. Alle Duplicate-URLs identifizieren
  2. Canonical-Tags konsequent setzen
  3. Überflüssige Duplicate-URLs mit 301-Redirect auf Hauptseite leiten
  4. Über Search Console die Re-Indexierung anfordern
  5. Geduld: Erholung dauert typischerweise 4-12 Wochen

Pro-Tipp: Duplicate-Content-Audit jährlich

Auch saubere Webseiten entwickeln über die Zeit Duplicate-Issues — durch CMS-Updates, neue Subdomains, A/B-Tests. Jährlicher Audit (z.B. mit Screaming Frog) deckt Probleme auf, bevor sie SEO-Schaden verursachen.

Mehr zur Vermeidung in der Pressemitteilungs-Praxis im Artikel Pressemitteilung verbreiten — die effektive Online-Strategie.

Duplicate-Content-frei mit eigenem Text pro Pressemitteilung.

Bei newsflow24 verfasst du pro Veröffentlichung einen eigenen Text — keine Duplicate-Content-Risiken, voller dofollow-Backlink-Wert.