Slownik SEO – Technical SEO

Duplicate content (zduplikowana treść)

Duplicate content (zduplikowana treść) to identyczna lub bardzo podobna treść pojawiająca się na wielu URL – w obrębie jednej domeny (wewnętrzny duplikat) lub na różnych domenach (zewnętrzny duplikat/plagiat). Wewnętrzny duplicate content dezorientuje Google przy wyborze wersji do zaindeksowania, rozmywa autorytet między duplikatami i może prowadzić do filtrowania przez algorytm Panda.

Czas czytania: ok. 5 minutKategoria: Technical SEO

Czym jest duplicate content i jakie ma skutki?

Duplicate content to sytuacja gdy ta sama lub bardzo podobna treść istnieje pod wieloma URL. Google musi wtedy wybrać którą wersję zaindeksować i rankingować – niekoniecznie tę którą Ty preferujesz. Skutki: rozmycie autorytetu linków (linki prowadzą do różnych URL z tą samą treścią zamiast koncentrować się na jednej), problemy z indeksowaniem (Google może wykluczyć niektóre wersje z indeksu) i potencjalnie niższe rankingi dla powielonej treści. Nie każdy duplikat to kara – Google stara się wybrać najlepszą wersję bez penalizowania właściciela strony.

Wewnętrzny duplicate content
Ta sama treść pod wieloma URL tej samej domeny: strony produktów w wielu kategoriach WooCommerce, paginacja, parametry URL (filtry, sortowanie, sesje), HTTP i HTTPS wersje, www i non-www.
Zewnętrzny duplicate content
Ta sama treść na różnych domenach: syndykacja artykułów, scraping przez inne strony, kopiowanie opisów produktów od producenta. Dla syndykacji rozwiązaniem jest cross-domain canonical lub noindex na syndikowanj wersji.
Duplicate content a thin content
Choć powiązane, to różne problemy. Thin content to treść o niskiej wartości. Duplicate content to treść o prawidłowej wartości ale dostępna pod wieloma URL. Panda penalizuje oba, ale z różnych powodów.
Narzędzia wykrywania
Siteliner.com – skanuje domenę i wykrywa wewnętrzne duplikaty. Screaming Frog – identyfikuje strony z identyczną treścią. Copyscape – wykrywa zewnętrzne kopie Twojej treści na innych domenach.

Jak rozwiązywać problemy z duplicate content?

Rozwiązanie zależy od źródła duplikatu. Każdy typ wymaga innego podejścia – nie ma jednej metody. Kluczowe jest zidentyfikowanie źródła przez audyt techniczny i zastosowanie odpowiedniego rozwiązania.

  • 1Dla parametrów URL (filtry, sesje, UTM): canonical na wersję bez parametrów lub blokada parametrów w GSC (Google Search Console ma narzędzie do zarządzania parametrami URL)
  • 2Dla paginacji: canonical na pierwszą stronę kategorii, lub canonical self-referencing na każdą stronę paginacji (zależy od strategii – sprawdź co mają konkurenci w top 10)
  • 3Dla produktów w wielu kategoriach WooCommerce: canonical wskazujący na preferowaną wersję URL produktu – Yoast SEO obsługuje to automatycznie
  • 4Dla syndykacji treści: upewnij się że portal który przejął Twój artykuł ma canonical wskazujący na Twój oryginalny URL lub ma strony syndykowane na noindex
  • 5Dla HTTP/HTTPS i www/non-www: przekierowania 301 na preferowaną wersję + self-referencing canonical na każdej stronie. To fundamentalna konfiguracja którą powinna mieć każda strona

Najczestsze bledy

Ponizej najczestsze bledy zwiazane z tematem duplicate content (zduplikowana treść), ktore warto znac i unikac.

  • Panikowanie przy każdym duplikacie – nie każdy duplikat to kara – Google jest w stanie obsłużyć wiele typów duplikatów bez penalizowania strony. Duplikaty wynikające z normalnego działania e-commerce (filtry, paginacja) nie są karą – wymagają zarządzania przez canonicale, ale nie grożą filtrem Panda jeśli są obsługiwane.
  • Blokowanie ważnych stron w robots.txt żeby uniknąć duplikatów – Blokowanie przez robots.txt zapobiega crawlowaniu, ale nie rozwiązuje problemu duplikatu – Google może dowiedzieć się o zduplikowanej stronie z innych źródeł. Lepszym rozwiązaniem jest canonical lub noindex na zduplikowanej stronie.
  • Brak reakcji na scraping i zewnętrzne kopie treści – Jeśli inna strona kopiuje Twoją treść i Google uzna kopię za oryginalną (np. jeśli kopia jest na starszej domenie z wyższym autorytetem), możesz stracić rankingi. Monitoruj przez Copyscape i zgłaszaj plagiat do Google (DMCA takedown) jeśli problem jest poważny.
  • Tworzenie stron 'doorway pages’ z podobną treścią pod różne miasta – Strony '/uslugi-seo-krakow/’, '/uslugi-seo-warszawa/’, '/uslugi-seo-gdansk/’ z identyczną treścią poza nazwą miasta to klasyczny duplicate content i thin content w jednym. Każda strona lokalna wymaga unikalnej, wartościowej treści specyficznej dla danej lokalizacji.

Czesto zadawane pytania

Ponizej odpowiedzi na najczesciej zadawane pytania dotyczace tematu Duplicate content (zduplikowana treść).

Czy duplicate content to kara od Google?
Nie bezpośrednio. Google oficjalnie mówi że nie karze za duplicate content per se – stara się wybrać najlepszą wersję do zaindeksowania. Problemy pojawiają się gdy: rozmyty autorytet linków między duplikatami obniża rankingi wszystkich wersji, Google wybiera złą wersję do zaindeksowania, lub duplicate content jest wynikiem celowej manipulacji (scraping, doorway pages). Zarządzanie duplikatami przez canonicale i przekierowania jest standardową praktyką a nie odpowiedzią na karę.
Jak znaleźć duplikaty na własnej stronie?
Narzędzia: (1) Siteliner.com – bezpłatne narzędzie skanujące domenę i raportujące procent zduplikowanej treści per strona, (2) Screaming Frog – po crawlu, eksportuj strony i posortuj po title lub description żeby wykryć duplikaty meta tagów, (3) Ahrefs Site Audit – raport Duplicate Content, (4) GSC – raport Pokrycie pokazuje 'Duplicate without canonical’ i 'Duplicate, submitted URL not selected as canonical’ jako wykluczone strony.
Jak duży procent zduplikowanej treści jest problemem?
Nie ma sztywnej granicy procentowej. Kilkanaście procent treści wspólnej między stronami (np. stopka, nawigacja, standardowe fragmenty opisów) jest normalne. Problemem jest gdy główna treść (body content) strony jest identyczna lub niemal identyczna z inną stroną. Jeśli Siteliner pokazuje strony z 70-90% podobną treścią – to wymaga działań. Jeśli podobieństwo wynika ze standardowych elementów szablonu (header, footer) – to nie jest duplicate content w sensie SEO.
Czy opisy produktów producenta to duplicate content?
Tak – opisy produktów kopiowane od producentów lub dystrybutorów są identyczne na dziesiątkach lub setkach sklepów. Google nie może i nie chce rankingować wszystkich jednakowo – faworyzuje sklepy z unikalnymi opisami. Dla sklepów e-commerce tworzenie unikalnych opisów kluczowych produktów to priorytetowa inwestycja w SEO. Przynajmniej przepisanie opisów producenta własnymi słowami jest lepsze niż kopiowanie verbatim.

Powiazane hasla w slowniku SEO

Duplicate content (zduplikowana treść) jest powiazane z wieloma innymi pojeciami SEO.

Powiazane artykuly na blogu

Jesli chcesz dowiedziec sie wiecej, zajrzyj do ponizszych artykulow.