Duplicate content to w największym skrócie identyczna treść pojawiająca się w sieci na więcej niż jednej stronie internetowej. Innymi słowy jeśli ten sam tekst pojawia się pod różnymi adresami URL, mamy wtedy do czynienia z powielaniem treści. Co ważne, taka treść może być skopiowana w obrębie jednej domeny; mówimy wówczas o duplikacji wewnętrznej. Gdy jednak te same teksty znajdują się na różnych domenach, mamy do czynienia z duplikacją zewnętrzną.
Czym jest duplicate content?
Czy jego obecność jest równoznaczna ze złymi praktykami marketingowymi?
Pierwszym skojarzeniem, które może przyjść do głowy po usłyszeniu frazy „zduplikowana treść”, jest po prostu kradzież tekstu z jednej witryny i umieszczenie go na innej. Jest to jedna z metod stosowanych w marketingu typu Black Hat SEO. Co więcej, niektóre szacunki sprzed kilku lat mówią, że statystycznie na co czwartej stronie znajdującej się w sieci można znaleźć zduplikowaną treść. Tym niemniej faktem jest, że w większości przypadków duplicate content powstaje w zasadzie przypadkowo, bez jakichkolwiek złych intencji. Najlepiej omówić tę kwestię na konkretnych przykładach.
Wewnętrzna duplikacja treści
Wyobraźmy sobie następującą sytuację: jesteśmy właścicielami strony https://przykladowadomena.pl. Okazuje się jednak, że na naszą stronę można również wejść z adresów:
- http://przykladowadomena.pl
- https://www.przykladowadomena.pl
- http://www.przykladowadomena.pl
- https://przykladowadomena.pl/index
Jeżeli nie wykonamy odpowiednich przekierowań 301 w pliku .htaccess lub nie zdefiniujemy strony kanonicznej (o tym wspomnimy w dalszej części tekstu), to każdy z wyżej wymienionych adresów będzie traktowany przez algorytm Google’a jako osobna strona. Co w praktyce oznacza, że to robot samodzielnie wybierze wersję kanoniczną i to ją będzie indeksował najczęściej, pozostałe strony traktując jak duplikat.
Bardzo częstym zjawiskiem jest także zwykłe kopiowanie tekstów w obrębie jednej witryny. Mamy z nim do czynienia chociażby w sklepach internetowych, gdzie identyczne opisy kategorii produktów lub samych produktów znajdują się na różnych podstronach i pod różnymi URL-ami. Jest to doskonały przykład wewnętrznej duplikacji treści.
Poza tym jeżeli udostępnimy wersję strony do druku, wówczas także możemy stworzyć duplicate content. Aby temu zapobiec, wystarczy w wersji do druku użyć meta tagu „noindex”. Wtedy nie zostanie ona zaindeksowana, a tym samym nie znajdzie się w wynikach wyszukiwania.
Zewnętrzny duplicate content
W tym przypadku zasada jest prosta: ta sama treść znajduje się na różnych witrynach. Najczęstsze powody takiego stanu rzeczy to:
- Treść została nielegalnie skopiowana.
- Dany tekst, na przykład opis produktu, oryginalnie pochodzi od jego twórcy, wydawcy lub dystrybutora. A my nie tworzymy nowego opisu, tylko korzystamy z gotowego. Tak samo, jak nasza konkurencja.
- Ta sama treść trafiła na naszą stronę i na wpis w serwisie społecznościowym.
- Treść została skopiowana jako cytat, ale nie oznaczono tego w żaden sposób w kodzie strony. Dotyczy to również wszelkiego rodzaju notatek prasowych czy artykułów sponsorowanych.
Zewnętrzny duplicate content a pozycjonowanie
Jeżeli przyjrzymy się bliżej wytycznym Google’a, to zauważymy, że zewnętrzna duplikacja treści nie jest zbyt dobrym rozwiązaniem. Owszem, bezpośrednia kara za zgłoszoną kradzież tekstu jest oczywistością. Okazuje się jednak, że Google może również nałożyć karę na witrynę w sytuacji, gdy uzna, że obecność powielonej treści ma za cel manipulację wynikami wyszukiwarki. I chociaż taka sytuacja nie zdarza się zbyt często, to być może któraś z przyszłych zmian w algorytmach Google’a znacznie zwiększy częstotliwość nakładania filtrów na strony zawierające zduplikowane teksty.
Jak się przed tym chronić?
- Jeżeli posiadamy sklep internetowy, to po prostu warto tworzyć unikalne opisy produktów lub usług, a przynajmniej synonimizować te „oficjalne”, oczywiście zgodnie z zasadami poprawnej polszczyzny.
- Jeżeli umieszczamy na naszej stronie teksty skopiowane z innych witryn – komunikaty prasowe, nowinki branżowe itp. – oznaczmy to w kodzie strony. Służy do tego znacznik <blockquote>. Jeśli natomiast chcemy w podobny sposób oznaczyć źródło danej informacji, na przykład link do źródła cytowanego tekstu, użyjmy atrybutu <cite>.
Pamiętajmy przy tym, że roboty Google’a nie odróżniają, który tekst jest wersją oryginalną, a gdzie została opublikowana jego kopia. Teoretycznie może się więc zdarzyć, że nasz oryginalny tekst ostatecznie zostanie uznany za kopię, a ktoś, kto skopiował naszą pracę, osiągnie wyższą pozycję w wyszukiwarce Google. Aby temu zapobiec, warto co jakiś czas uruchomić narzędzia antyplagiatowe. Można również poszukać ewentualnego plagiatu na własną rękę. Wystarczy w tym celu wkleić w polu wyszukiwarki fragment naszego tekstu – 20 do 30 słów – w cudzysłowie; cudzysłów jest tutaj kluczowy. Następnie wciskamy „enter” i już wiemy, czy ktoś powiela nasze opisy produktów lub jakąkolwiek inną treść, która do nas należy.
Jeżeli uda nam się wykryć tego rodzaju kradzież treści, wówczas kontaktujemy się z właścicielami strony i prosimy o usunięcie spornego tekstu. Jak to nie przyniesie rezultatu, wówczas informujemy Google o całej sprawie.
Oddaj swoją stronę w ręce ekspertów
Wewnętrzna duplikacja treści a optymalizacja pod kątem SEO
Kopiowanie treści w obrębie jednej witryny także może mieć negatywny wpływ na jej pozycję w wyszukiwarce. W praktyce oznacza to, że jeśli nie ustalimy kanonicznej strony, roboty Google’a zrobią to za nas. Może to skutkować wyświetlaniem w wynikach wyszukiwania innej wersji strony niż ta, na której zależy nam najbardziej.
Co w takim wypadku należy zrobić? Powinno się użyć tagu kanonicznego.
Wróćmy do wyżej zaprezentowanego przykładu „https://przykladowadomena.pl„. Jeżeli chcemy, aby to właśnie strona znajdująca się pod tym adresem była indeksowana i uznawana przez algorytmy za najważniejszą, w sekcji <head> pozostałych wersji stron wklejamy kod:
<link rel=”canonical” href=”https://przykladowadomena.pl” />.
Warto jednak pamiętać, że należy bardzo uważać ze stosowaniem tagu „canonical”. Ta zaledwie jedna linijka kodu może dość mocno nadwyrężyć pracę, jaką włożyliśmy w pozycjonowanie swojej witryny. Dlatego jeżeli nie jesteśmy pewni, czy postępujemy słusznie i nie do końca wiemy, co robimy, warto poprosić specjalistów o pomoc (nasz audyt SEO zawiera dokładne informacje o wdrożeniu tagów kanonicznych na stronie). W przeciwnym wypadku może się okazać, że część naszej witryny w zasadzie zniknie z wyników wyszukiwania.