ARAMA MOTORU OPTİMİZASYONU

Google News’ta Sıralamayı Anlamak ve Patentlere Göre Yorumlamak

SAMET ÖZSÜLEYMAN

11 Ağu, 2020

Google, anlık haber ihtiyacını karşılamak amacıyla binlerce sitenin birçok farklı bölge ve dile göre haber sitelerini listelemek için Google Haberler dizinini oluşturmuştu. Yıllar içerisinde bu dizinde yer alan siteleri kısmen de olsa daha kaliteli hale getirmek ve sıralamayı da kullanıcı ihtiyaçlarına uygun hale getirmek için Google bazı patentler almıştır.

Makalede size Google News dizinine başvuru ya da kayıt gibi bilgilerin aksine haber sitelerinin sıralamasını Google nasıl yapıyor? Bu sıralamada kullanılan faktörler nelerdir? Gibi birçok soruyu çeşitli patent ve kaynaklara dayandırarak anlatmaya çalışacağım. Patentlerde yer alan sıralamayla alakalı kelimelere en ince ayrıntısına kadar olabildiğince değinmek istiyorum.

Google sıralama faktörlerinin patentlerde anlatılan detayların yanı sıra zaten geçerli olduğunu, mobil uyumluluk, AMP, site hızı ya da diğer teknik SEO konularında geliştirmelerinizi sürekli yapmanız gerektiğini de hatırlatmak isterim.

Google, 29 Ekim 2019 tarihindeki Systems and methods for improving the ranking of news articles isimli patentinde haber sitelerinin sıralanması ile ilgili birçok bilgi vermektedir. 

Yerel bir haber aradığınızda örneğin “Samsun Haberleri” gibi bu kelimeye özel listelenen haber sitelerinin aynı kalitede olmayacağını Google açıkça belirtmektedir. Bununla ilgili örneklerinde de BBC ya da CNN daha yüksek kaliteli siteler olarak patente lanse edilmektedir.[1]

Kaliteyi daha iyi tespit edebilmek için gelişmiş yöntemlere ihtiyaç duyulmaktadır. Aşağıda belirteceğim faktörlerin en az birine veya birden fazla kritere göre Google algoritması kendi karar verme yetkisini kullanarak bu siteleri sıralayacaktır.

Haber kaynaklarını yukarıdaki görselde “Source” kısmında görebiliyoruz.[2] Buradaki 310 ile belirtilen tablo içinde yer alan haber kaynakları 1 site ya da 1’den daha fazla site olabilir. Bunların sayısı belirsiz bir şekilde N sayısına kadar gidebilir. “Source Rank” kısmında da aşağıda açıklanan faktörlere göre algoritma tarafından sitelere atanan değerleri içermektedir. Türkçe bir örnekle bunu aşağıdaki gibi açıklayabiliriz; (siteler ve sayılar tamamen örnektir) 

Tüm patentin ana hatlarıyla özetini ise aşağıdaki şekil bize gösteriyor. Haber kaynaklarını sıralamak için algoritmanın nasıl çalıştığı patentte aşağıdaki gibi yer almaktadır.[2] 

Üretilen Haber Sayısı

Belirli bir zaman aralığında üretilen genel ve yerel haberlerin sayısı sinyal olarak kullanılabilir.[1] 

Daha fazla kullanıcıyı çekmek ve mevcut okuyucu kitlenize güncel haberleri sunmak için ürettiğiniz haber sayısının da önemi vardır. Burada üretilen haberlerin elbette bu makalede belirttiğim üzere kaliteli ve olabildiğince özgün haberleri de barındırması sıralamada size fayda getirecektir. 

Ziyaretçi gözünden de bu duruma bakıldığında haber sitesine her girildiğinde sürekli aynı haberlerin görünmesi pek tercih edilen bir durum değildir. Ayrıca Google, üretilen bu haberlerin hangi (spor, ekonomi ya da siyaset) gibi hangi kategorilere girdiğini makine öğrenimi ile sınıflandırabilmektedir.

Orijinal Haberler

Orijinal olarak adlandırılan ve tespit edilen haberlerin sayısı pozitif bir sinyal olarak kullanılabilir.[1] 

Orijinal haberden örnek verecek olursak; trend olmuş ya da kendi trendini kendi yaratabilecek potansiyele sahip ilgili konu üzerine yapılan orijinal çalışmalar veya raporlamalardır. Bu tür özgün/özel haberleriniz, sitenizin kalitesinin de artmasına katkı sağlayacaktır.

Makalenin Ortalama Uzunluğu

Haber kaynağının kalitesini belirlemek için uygulanan yöntemlerden birisi haber makalesinin ortalama uzunluğu ile ilgili olabilir. [1]  Kullanıcılara daha fazla detay veren haberlerin sıralamasının doğal olarak yükselmesi beklenebilir. 

Daha fazla derinlemesine içerik barındıran sayfaların haliyle ortalama kelime uzunluğu da fazla olacaktır. Elbette burada sırf uzun makale görünmesi açısından sürekli soru soran, kullanıcılara değer katmadan üretilen haber içeriklerinden bahsetmiyorum.

Son Dakika Haber Puanı

Haber sitesinin bulunduğu konular üzerine ürettiği içerikler eğer çok yeniyse ve bu konuda tutarlı bir uygulama sergileniyorsa bu durum algoritma tarafından pozitif bir sinyal olarak algılanabilir. 

Breaking news score kavramını biraz daha açacak olursam örneğin bir siyasetçinin açıklamasını hızlı bir şekilde girilmesi bunun çok basit bir örneği olabilir. Başka bir uygulamada ise COVID-19 ile ilgili Sağlık Bakanı’nın açıklamalarını aktarmak yine bu örnekler arasında yer alabilir;

Kullanıcılar bu tür açıklamaları genelde hemen okuyup tüketmek isterler bu yüzden son dakika haberlerini olabildiğince hızlı ziyaretçilerinize aktarmanız faydalı olacaktır. Haberleri aktarırken kişilerin yaptıkları açıklamaların doğru olması gerektiğini de unutmayın, açıklamaları lütfen teyit edin ve kullanıcılara yanlış bilgiler aktarmayın.

Personel Sayısı

Haber kaynağında çalışan personel sayısını Google sıralama faktörü olarak kullanabilir. [1] Gerçek hayat örneklerine de bakıldığında haber/gazete şirketlerinin daha fazla personeli bulunması olay yerlerine daha hızlı gidebilecekleri ve daha hızlı ve farklı görüş ile bakış açılarını aktarabileceklerini göstermektedir.

Örneğin IHA’nın zaten bu konudaki personel ve bilgi aktarımı konusunu sanırım ekstra anlatmama gerek yok. Birçok bölgede aktif muhabirleri ile haberleri servis ediyorlar. Tabii diğer ajanslar veya gazete sitelerini de bu kapsamda düşünebilirsiniz.

Google, harici kaynaklarda haber sitesiyle ilişkilendirilen gazetecilerin isimlerini de personel sayısı belirlemede kullanabilir.

Fiziksel Büro Sayısı

Haber kaynaklarının fiziksel büroları ya da ofisleri haber kaynaklarını sıralarken algoritma tarafından kullanılabilir.[1] 

Haber kaynaklarının toplandığı fiziksel büroları bu bağlamda düşünebilirsiniz. Aşağıda yer alan örnek Türkiye bürolarını gösteriyor. Eğer yabancı bir ülkede yayın yapıyorsanız o ülkeye ait fiziksel bir adres oluşturmanız ve bunu açıkça göstermeniz faydalı olabilir.

Ülkelerden Gelen Ziyaretçi Trafiği

Haber kaynaklarına giden trafiğin ne kadarı, hizmet verdiği dile ait kullanıcılardan geldiği başka bir uygulamada algoritma tarafından kullanılabilir.[1] 

Türkiye’de yayın yapan bir web sitesine gelen trafiğin büyük bir bölümünün doğal olarak Türkiye’deki kullanıcılardan gelmesi beklenir. Rusya kökenli olsa bile örneğin Sputnik Türkiye sitesine gelen trafiğin Türkçe içerik ürettiği için Türkiye’deki ziyaretçi kitlesinden gelmesi önemlidir;

Her ne kadar patentte açık bir şekilde yer almasa bile Google, eyalet ya da şehir bazlı olarakta bu trafiği analiz edip sıralamada kullanabilir.

Dil Bilgisi

Haber kaynaklarının ürettiği içerikler, dil bilgisine uygunluğu ve okuma düzeyleri metrikleri açısından Google tarafından kullanılabilir.[1] 

Yazım doğruluğu, yazının dil bilgisi kurallarına uyup uymadığı ve okuma düzeylerini ölçmek için Google otomatik testler sonucunda ilgili haber kaynağına bir puan verip, o puanı sıralamada kullanabilir. Bu yüzden oluşturulan haberlerin minimum seviyede hata barındırması ve okuma düzenin iyi olmasına dikkat edilmesi faydalı olacaktır. 

Okunabilirlik analizine biraz kafa yormak isterseniz büyük çalışmalar yapmış Ender Ateşman’ın “Türkçe’de Okunabilirliğin Ölçülmesi”[5]  isimli çalışmasına bakmanızı öneririm.

Tiraj İstatistikleri

Gazetelerin tiraj istatistikleri kalite tespiti için kullanılabilir.[1] 

Sadece online yayın yapan haber sitelerin, hem fiziksel olarak gazete üreten hem de online haber üreten sitelere göre şansı bu metriğe dayanarak maalesef biraz daha az olduğunu belirtebilirim.

Gazete tiraj bilgilerini tamamen örnek görsel amacıyla aşağıda belirtmeye çalıştım.[3]  Çok fazla satış yapan gazetelerin kullanıcıları tarafından sevildiğini ve sabit bir kitlesi olduğunu yorumlayabiliriz.

Tiraj istatistikleriyle beraber örneğin Nielsen Netratings gibi sitelerden elde edilen verilerin de haber kaynağının kalite göstergesi belirleme konusunda faydalanılabilecek kaynak arasında yer aldığı patentte açıklanmaktadır.

Tıklanma Sayısı

Haber sitesine giden bağlantıların hangi kullanıcılar tarafından tıklandığı başka bir uygulama modelinde kullanılabilir.[1] Bu sayede en sık ziyaret edilen haber kaynakları, pek fazla bilinmeyen yerel haber kaynakları yerine tercih edilebilir. En sık ziyaret edilen haber kaynaklarına kullanıma bağlı olarak bir değer atanabilir ve sıralamada bu değer kullanılabilir.

Elbette bu metrikteki manipülasyonu önlemek amacıyla Google, buradaki birçok veriyi normalleştirip kullanılacağını da yine patentinde bahsetmektedir.

Uluslararası Çeşitlilik

Uluslararası çeşitliliğe sahip siteler daha kaliteli olarak görünebilir.[1] 

CNN örneğinden ilerleyecek olursak, Türkiye’de faaliyet gösteren CNN Türk sitesinin bu faktörle uyuştuğundan söz edebiliriz. (Elbette bunun gibi birçok site de örnek gösterilebilir) CNN, uluslararası medyada yıllardır faaliyet gösteriyor ve bu durum haber kaynağının pozitif kalite sinyali göndermesinde etkili olabilir.

Haber sitesi sahibi ya da danışmanı olarak rakiplerinizi analiz ederken yukarıda bahsettiğim konulara da değinmenizi öneririm. Yeni açılan birçok haber sitesi maalesef kısa sürede başarı yakalamak istediği için bahsettiğim konuları bazen görmezden gelebiliyor. Bu konulardaki eksiklerinizi rakiplerinizle kıyaslayarak aksiyon planları ve yeni planlar oluşturabilirsiniz.

Kullanıcı Görüşleri

Kullanıcıların okumaktan zevk aldığı ya da sıklıkla ziyaret ettiği haber kaynakları ya da dergiler bir sinyal olarak kullanılabilir.[1] 

Kullanıcı görüşlerinden de aslında Google, ziyaretçilerini mutlu eden haber kaynaklarını bu verileri kullanarak çok rahat bir şekilde anlayabilir. Siyaset, ekonomi, sağlık ya da spor gibi konularda ziyaretçileri memnun eden haber sitelerine Google’ın güveneceğini aslında buradan da çıkarabiliriz. 

Okumaktan zevk alınan siteleri biraz daha açıklayacak olursam; politika haberleri ziyaretçilerinin daha çok hoşuna giden ya da futboldaki transfer haberleri çok daha doğru bilgileri barındıran haber siteleri bu kapsamda değerlendirilebilir.

Haber Kaynaklarının Değerlendirilmesi

Haber ajanslarının başka ajanslar tarafından değerlendirilmesi de kullanılabilir.[1] 

Patentte de yer aldığı gibi örneğin gazete/haber siteleri, kazandıkları Pulitzer[4] ödüllerinin sayısına bağlı olarak karşılaştırılabilir ve bu sonuç sıralamada kullanılabilir. Belirttiğim bu maddenin kısmen de olsa E.A.T. ile alakalı olduğunu söyleyebilirim. 

Türkiye’deki örneklere bakacak olursak haber sitelerinin aldığı alakalı ödülleri bu bağlamda değerlendirebiliriz. Elbette daha otoriter kaynakların verdiği ödüllerin değerinin de fazla olacağını düşünüyorum.

Belirttiğim maddenin devamı niteliğinde olabilecek başka bir açıklamada da “Başka bir uygulamada, değerlendiricilere haber kaynaklarından çeşitli makaleler gösterilebilir ve her kaynağa bir puan vermeleri istenebilir. Atanan bu puan bir metrik olarak alınabilir” denilmektedir. Bu kısımdan da E-A-T kılavuzunda yer alan arama motoru değerlendiricilerinin siteleri değerlendirmeleri arasında paralel bir ilişki kurabiliriz.

Backlinks

Haber sitesine giden link sayısı başka bir metrik olarak kullanılabilir.[1] 

Haber yayıncılarının elde ettiği backlinklerin sıralamada kullanılabileceği belirtilmektedir. Aslında bu sürpriz ya da şaşırdığımız bir açıklama değil. Sizin de yazıyı okurken aklınızda bulunması gerektiğini istediğim linklerin de kullanılabileceğini paylaşmak istedim.

Backlinklerle beraber sosyal medyada haberlerinizin paylaşılması, retweet edilmesi ve yorumlanması da en çok okunan haberler kısmında kullanılan önem puanında kullanılan bir diğer metrik olduğunu hatırlatmak isterim.[6] 

Haber Kaynağının Yaşı

Haber kaynağının yaşı halkın güven ölçüsü olarak alınabilir ve metrik olarak kullanılabilir.[1] 

Domain yaşı üzere bildiğiniz gibi neredeyse sürekli sorular Google çalışanlarına iletilmektedir. Patentte yer alan bu kısımda ise haber kaynağının yaşının eski olması (elbette kesin kullanılacak denilmiyor) metrik olarak kullanılabileceğinden bahsediliyor. 

Ülkemizde ve dünyada 1900’lü yılların başından bu zamana kadar varlıklarını sürdüren haber kaynaklarını bu bağlamda düşünebilirsiniz.

Coğrafi Alandaki Uzmanlık

Belirli bir coğrafi alandaki yayıncının uzmanlığı sıralamada kullanılabilir.[6]

Belirli coğrafi alanlarda yayıncıların ürettiği haberler o coğrafi bölgede daha uzman olduklarının bir işareti sayılabilir. Örneğin “Samsun” ile ilgili yerel haber siteleri yerine genel bir haber sitesi olup o coğrafi bölgeyi de kapsayan kaliteli içerikler üreten haber sitesi sıralamada yer alabilir. O coğrafi bölgede Google gözünde yaptığı haberlerle artık kaliteli ve uzman hale gelmiştir.

Patentlerle ilgili bilgileri ve kişisel yorumlarımı belirttikten sonra biraz daha diğer G-News konularına girip yazımı sonlandırmak istiyorum.

Hatırlatma yapmak gerekirse Google haberler için yayıncı merkezi 10 Aralık 2019 tarihinde değişmişti, artık yayıncılar için daha anlaşılabilir ve kolay panel amaçlanmıştı. Son zamanlarda birçok açıklamada artık AMP’nin Top Stories için zorunlu olmadığı belirtildi; ama benim önerim sitelerinizde hatasız AMP kullanarak ziyaretçilerinize daha hızlı bir deneyim sunmayı düşünebilirsiniz.

Birkaç ufak öneri;

-Haberlerinizde yayın tarihini açık bir şekilde gösterin, ayrıca bu tarihleri AMP sayfalarınıza da eklemeyi unutmayın.

-NewsArticle schema işaretlemesini, haber detay sayfalarınızda hatasız olacak şekilde kullanabilirsiniz.

-Kullandığınızı düşünüyorum; lakin yine de henüz kullanmıyorsanız Google haberler için site haritası oluşturmayı düşünmelisiniz. Hatta burada sadece en kaliteli haberlerinizi bile sergilemeyi düşünebilirsiniz.

-Haber başlıklarının, manşetlerin ve haber içeriklerinde kullandığınız anahtar kelimelerin birbirleriyle tutarlı olmasına özen gösterin. Özellikle Google’ın Vision API ile görüntülerin içindeki birçok nesne ile yazıyı okuyabildiğini unutmayın;

Google’ın belirttiği diğer sıralama faktörleri de aşağıdaki gibidir;

  • İçeriğin alaka düzeyi,
  • Belirginlik,
  • Yetkinlik,
  • Güncellik,
  • Konum,
  • Dil.

Yukarıdaki maddelere ek olarak patentte atıfta bulunulan başlıkları da kendi siteleriniz özelinde değerlendirebilirsiniz.

Sona Doğru

Google siteleri sıralarken bazen belirttiği metriklerin ortalamasını kullanarak bir değer atayıp, bu değere göre siteleri sıralayabilir. Örneğin X sitesi; tiraj istatistiklerinde 1, uluslararası çeşitlilikte 2 ve fiziksel büro sayısında 6. sırada ise X sitesinin bu metriklere dayanarak ortalaması (1+2+6)/3=3 olacaktır. Başka bir uygulamada ise Google bu değerleri yüzdelik olarak da hesaplayıp kullanabilir.

Patentlerde açıklanan yöntemlerin bir kısmını veya hepsini haber kaynaklarının kalitesini değerlendirmek için algoritma kendisi kullanabilir ya da bazı haber kaynakları için en iyi N sayıda metriği kullanabilir. Burada N bir pozitif sayı olup örneğin 6 tam sayısı ile ifade edilebilir. Bu sayede yerel/yeni haber siteler için henüz hesaplanamayan değerleri de algoritmanın kullanmamasını sağlayabilir.

Kaynaklar:

1-http://patft.uspto.gov

2-https://pdfpiw.uspto.gov/.

3-gazetetirajlari.com

4-https://www.pulitzer.org

5-http://www.atesman.info/

6-https://patents.justia.com/