Duplicate Content (Çift/Tekrarlı İçerik) Problemine Yol Açan Durumlar ve Çözüm Yolları
Bu içerik konuk yazarımız Onur Soylan tarafından yazılmıştır. Duplicate content, internet ortamında yer alan bir içeriğin birden farklı URL'de bulunmasından kaynaklanan bir sorundur.
SEO performansını olumsuz etkileyen bu durum, karşımıza iki farklı şekilde çıkmaktadır.
1) External duplicate content: Herhangi bir içeriğin birkaç farklı internet sitesinde yer alması, external duplicate content olarak adlandırılır. Yaptığınız aramalarda bu terim karşımıza site-dışı çift içerik, yinelenen içerik, kopya içerik olarak da çıkmaktadır.
2) Internal duplicate content: Siteniz içerisinde yer alan bir içeriğin tamamının ya da bir kısmının birden fazla sayfanızda bulunması internal duplicate content (site-içi çift içerik, yinelenen içerik, tekrar eden içerik) problemini doğurmaktadır. Sitenizin iyi bir performans göstermesini ve arama sonuçlarında iyi pozisyonlarda listelenmesini istiyorsanız içeriğinize önem vermelisiniz. Başkalarının üretmiş olduğu içerikleri sitenizde yayımlamak, sizi hiçbir zaman iyi yerlere getirmeyecektir. Özellikle e-ticaret sitelerinde sıkça karşılaştığımız, ürün açıklamalarında üreticinin kendi internet sitesinde paylaşmış olduğu ürün özellerinin tamamının kopyala-yapıştır yapılarak yayımlanması, arama motoru sonuçlarındaki performansınızı olumsuz etkileyecektir.
Kullanıcıya aradığı bilgiyi verin Arama motorları botları, web'de yer alan her içeriği tarama ve veritabanına kaydetmek üzere programlanmıştır. Sahip olduğu algoritma sayesinde kullanıcılara yapılan sorguya en yakın sonucu sunabilmektedir. Bunu yaparken ziyaretçilere ilk 10 sırada aynı içeriği göstermek yerine, farklı seçenekleri göstermeyi tercih eder. Bu yüzden rakiplerinizden farklı ve yapılan sorguya en uygun içeriğe sahip olmaya özen göstermelisiniz. Internal duplicate content bazen internet sitesi sahiplerinin kolaya kaçmasından, bazen de yazılımsal hatalardan kaynaklanmaktadır. Kötü hazırlanan bir internet sitesi hiç beklemediğiniz internal duplicate content problemlerini beraberinde getirebilir.
Etiket Sayfalarındaki Hatalar:
İnternet siteniz içerisinde yer alan yüzlerce blog yazısını veya ürünü kullanıcılara ve arama motorlarına en iyi şekilde sunmanın yolu kategorilere ayırmaktır. Doğru kullanıldığında fayda görebileceğiniz bu sistem, manipüle edilmek istendiğinde ise hiç beklemediğiniz sonuçlara yol açabilir. Etiket sistemi, içeriklerinizi kategorilendirmenizi kolaylaştıran bir seçenek olarak karşımıza çıkmaktadır.
Hepimizin bildiği bir haber sitesinde yer alan etiketlere göz atalım: alanadi.com/iphone-6-satisa-sunuldu Haberin altında yer alan etiketlerin, kullanıcılardan çok arama motorları için oluşturulmuş olduğunu bir bakışta anlayabiliyoruz. Bu işlem aranma hacmi en yüksek anahtar kelimeler kullanarak, daha fazla organik trafik elde etmek amacıyla oluşturulmuştur. Uygulanan bu yanlış etiket sistemi, internet sitelerinin performansını olumsuz etkilemekte ve anahtar kelimelerde rakiplerine göre çok daha alt sıralarda yer almasına neden olmaktadır.
Örnekte yer alan haber sitesinde, yaratılan her etiket sayfasının (örn:alanadi.com/etiket/iphone-6-cikti-mi) yalnızca URL ve Title'ın farklı olması, etiket sayfası ile asıl sayfa arasında %95'in üzerinde benzerlik oranına yol açmaktadır.
Önümüzdeki Panda güncellemesinde arama motorlarını manipüle etmeye yönelik oluşturulan etiket sayfalarına sahip haber siteleri dahil olmak üzere tüm sitelerin organik kanalda büyük yara alacağını ve trafiklerinin büyük ölçüde yok olacağına inanıyorum.
Tip: 150 sayfaya kadar ücretsiz analiz yapan Siteliner aracını kullanarak siteniz içerisindeki yinelenen içerik yoğunluğunu ölçebilirsiniz. Sitenizin tamamı için bu analizi yapmak istiyorsanız Siteliner Premium hesap satın almanız gerekiyor.
Kategori sayfalarındaki yinelenen içeriklerin önüne nasıl geçilir?
Öncelikle, yukarıda örnekte olduğu gibi onlarca etiket sayfası oluşturmak yerine, doğru kategorizasyonu yapabilmek için doğru kelime gruplarını belirlemeniz gerekiyor. iPhone 6'nın satışa çıktığını belirten haberde kullanılabilecek etiketler; iPhone (iphone haberleri), iPhone 6 (iPhone 6 habereri), Apple (Apple haberleri), teknoloji (teknoloji haberleri). iPhone ile ilgili yayımlanan her haberde bu etiketleri kullanarak oluşturacağınız sayfalarda birden fazla haber görüntüleneceği için ilgili aramalarda listelenmenizi kolaylaştıracaktır.
Aksi halde yalnızca bu habere özel oluşturulan etiket sayfasında yalnızca 1 haber listelenecek ve içerik yönünden oldukça zayıf (thin content) sayfalara sahip olmanız kaçınılmaz olacaktır. Özel bir Title ve URL dışında kalan kısımların tamamının site içerisinde yinelenmesi (haber başlıkları ve kısa açıklamalar) organik kanalda başarı göstermeniz için yeterli olmayabilir. En fazla trafik beklediğiniz bu sayfalarda kullanıcılara fayda sağlayacak, içerik yönünden zenginleştirecek içerik alanlarının oluşturulması gerekmektedir. Böylece sayfanızın özgünlük oranını optimum seviyeye çekebilirsiniz.
WWW ve Non-WWW Sorunu:
Sitenize hem www'lu hem de www'suz versiyondan ulaşılabiliyor olması, duplicate sayfaların bulunduğu anlamına gelmektedir. Tüm içeriklerinizin iki farklı URL’den erişilebiliyor olması duplicate page content, duplicate title ve duplicate description gibi problemleri de beraberinde getirmektedir. www ve non-www sorununun önüne geçebilmek için dilediğiniz formu Google Webmaster Tools üzerinden seçebilir ve kullanabilirsiniz.
Çözüm:
Ziyaretçilerinizin ve diğer arama motorlarının bu durumu net bir şekilde anlayabilmesi için, tüm URL'lerinizin tercih ettiğiniz forma 301 yönlendirmesi ile yönlendirilmesi gerekmektedir. Örn: www.domain.com -> 301 redirection to domain.com www.domain.com/iphone-6-satisa-sunuldu -> 301 redirection to domain.com/iphone-6-satisa-sunuldu
HTTP ve HTTPS Sorunu:
Google, 2015 Ağustos ayında yapmış olduğu bildiride, güvenliğin kendileri için önceliklendirilmiş bir konu olduğunu ve HTTPS güvenli bağlantısının bir ranking faktörü olacağını belirtmişti.
Şimdilik global aramaların yalnızca %1'ini etkileyen bu kararın verilmesinde 2 önemli başlığın yer aldığını belirtmek isteriz: Sitenizin ve ziyaretçilerinizin gizliliğini korumak. Sıralamalarda kaliteli içeriğin çok daha fazla etkisinin olduğunun altını çizen Google, güvenlik konusuna önümüzdeki dönemlerde daha fazla önem vereceğini de belirtmektedir. HTTP'den HTTPS protokolüne geçişlerde dikkat edilmesi gereken bir diğer konu duplicate sayfaların oluşmaması için yönlendirmelerin doğru bir şekilde yapılması gerektiğidir.
Çözüm:
Yapılan yönlendirme HTTP versiyondan HTTPS versiyona 301 yönlendirmesi ile yapılmalıdır. Not: Yapılan yanlış yönlendirmeler, organik trafiğinizi olumsuz etkileyebilir. Bu yüzden SEO performansınız yüksek ise güvenliği sağlamak adına yalnızca ödeme ve kullanıcı bilgileri istenilen sayfalarda HTTPS protokolünü tercih edin.
Slash Sorunu:
URL'lerin sonunda slash olmalı mı, yoksa olmamalı mı konusu birçoğumuzun aklını karıştıran konulardan biri. domain.com/en/ (dizin olduğunu belirtmektedir) domain.com/ornek-yazi (dosya olduğunu belirtmektedir) Google, Webmaster blog'unda yaptığı açıklamada slash'lı veya slash'sız formun sorun ya da dezavantaj yaratmadığını belirtmektedir ancak yine de çift içerik problemini önlemek için içeriğe yalnızca bir URL'den ulaşılabiliyor olmak gerekmektedir. Wordpress gibi hazır içerik yönetimi sistemlerinde bu özellik default olarak gelmektedir. İnternet sitenizin yazılımı sizin tarafından yazılmış ise, her iki URL'in status code'larını kontrol etmekte fayda var :)
Not: Kontrolleriniz sonucunda, aynı içerik her iki versiyonda da ulaşılıyor ise (200 kodunu veriyorsa) tüm sayfalarda aynı problemin olması muhtemeldir.
Çözüm:
Belirlediğiniz versiyona, diğer versiyondan 301 yönlendirmesi yapılmalıdır. Not: Bu case’de canonical uygulamak doğru bir çözüm yolu değildir. Link juice bu yöntemle aktarılacak olsa da iki farklı URL’e kullanıcılar tarafından ulaşılabiliyor olması karışıklığa sebep olacaktır.
Parametreler:
Sitenizin sosyal medya tanıtımları, mail kampanyaları, affilate programları ve site içi filtrelemede karşımıza çıkan parametreler, çift sayfa problemine yol açan bir diğer konudur. Aynı içeriğin farklı URL'lerde bulunması kopya içerik sorununu doğurmaktadır. domain.com/iphone-6-satisa-sunuldu domain.com/iphone-6-satisa-sunuldu?utm_source=twitter domain.com/iphone-6-satisa-sunuldu?a_aid=123456 domain.com/iphone-6-satisa-sunuldu?fiyat=artan
Çözüm:
Birbirine oldukça benzer sayfalarda çift sayfa problemini önlemek için canonical etiketi kullanılır. Tüm parametre sayfalarında asıl sayfaya uygulanacak canonical tag'i bu problemi çözecektir.
Örnek: domain.com/iphone-6-satisa-sunuldu?utm_source=twitter sayfasının head bölümüne eklenecek <link rel="canonical" href="domain.com/iphone-6-satisa-sunuldu" /> kodu bu problemin üstesinden gelmemizi sağlayacaktır.
Büyük - Küçük Harf Sorunu:
URL'lerde hem büyük harf hem de küçük harfli versiyonun bulunması, çift sayfa problemine yol açan bir başka durumdur. Arama motorları bu iki sayfayı ayrı olarak değerlendirdiğinde, ikisinde de aynı içeriğin bulunduğunu görecektir. Örn: domain.com/iPhone-6-Satisa-Sunuldu domain.com/iphone-6-satisa-sunuldu
Çözüm:
URL'lerinizin tamamında küçük harf kullanmaya özen gösterin. Hem büyük harf hem de küçük harfin bulunduğunu tespit ettiğinizde, sayfa değerinin tek bir sayfada toplanması için 301 yönlendirmesi yaparak çift sayfa problemini ortadan kaldırabilirsiniz. Fakat test aşamasındaki internet sitenizde bu problemi tespit ettiyseniz, bu tür farklı sayfaların oluşmaması için önlem almak yerinde olacaktır.
Arama Sayfaları:
Site içerisinde bulunan arama kutucuğu, kullanıcıların hızlı bir şekilde istediği ürün ya da kategoriye ulaşmasını sağlar. Kullanıcı deneyimi bakımından oldukça önemli arama sayfaları (örn:domain.com/search/?query=cep-telefonu) ile diğer statik sayfalar (domain.com/kategori/cep-telefonu) arasında büyük bir benzerlik olacağından ve arama sayfası için özelleştirilmiş bir içerik alanı olmadığından arama sayfaları botlara kapatılmalıdır.
Çözüm:
Arama sayfalarına eklenecek meta noindex, nofollow etiketi botların bu sayfalara ulaşmasını engelleyecektir.
Sonuç:
İnternet sitenizde duplicate content problemine yol açan sayfaları tespit edebilmek için Google’ın ücretsiz Webmaster Tools aracını kullanabilirsiniz. Search Appearance bölümünde > HTML Improvements kısmından site içinde çift içeriğin kullanıldığı sayfaların bir kısmına ulaşabilirsiniz. Yukarıda bahsettiğim problemlerin tamamını rapor halinde görebilmek için Moz’un Crawl Test aracını ya da Deepcrawl’un Website Crawler aracını kullanabilirsiniz. Site dışı duplicate problemlerinin tespitinde ise Copyscape aracı tüm web’i tarayarak, içeriklerinizin hangi internet sitelerinde kullanıldığını tespit etmenize yardımcı olacaktır. Merak ettiğiniz konuları yorum kısmından paylaşabilirsiniz :)