ARAŞTIRMA & ANALİZLER

(Araştırma) Patentlerle Google’ın Yeni Güncellemesi: Hummingbird

YİĞİT KONUR

28 Eyl, 2013

penguen-yazi-dizisiUzun bir etkinlik sürecinin ardından herkese merhaba! Türkiye'nin ilk uluslarası SEO etkinliği SEOZONE'13 hazırlıkları dahilinde çok fazla ilgilenemediğimiz blogumuza tekrardan bir dönüş yapmanın heyecanı içindeyim. Bugün Google 15. yaş gününü kutluyorken, doğum gününden bir gün önce (26 Eylül 2013) Google'ın kıdemli başkan yardımcısı Amit Singhal yaptığı açıklamayla Hummingbird güncellemesini duyurdu! Google'ın 15. yaş kutlamalarına gölge düşürecek kadar sarsıcı bir etki yaratan bu haber tüm internet medyasında kısa sürede yayıldı. Bu güncellemenin bu kadar çok ilgi görmesinin en temel sebebi Amit'in belirttiği üzere sorguların %90'ının etkilenmiş olduğuna yönelikti. Geçtiğimiz günlerde Google'ın Analytics sonuçlarında da görüldüğü üzere arama trafiğinin tamamının (not provided) olarak işaretlenmesi sonrasında, bir çok çarpıcı haberi art arda yayınlayan Google'ın bu güncelleme ile neler yapmak istediği de haliyle ilgi odağı oldu. Malum tüm Google güncellemeleri sonrası ortalığı saran bilgi kirliliğine önceden müdahale edebilmek ve doğru bilgiyi sağlayabilmek için sektördeki tüm otorite kaynakları araştırarak, sonuçları sizler için derledik. Umuyorum faydalı bir araştırma yazısına imza atabilmişimdir!

Google'ın verdiği %90 istatistiği gerçekten doğru mu?

Öncelikle belirtmem gerekir ki, bu konu hakkında şu anda elde edilen çok fazla bilgi yok. Her Google güncellemesi sonrasında olduğu gibi, piyasada yer alan sınırlı sayıda bilgiye dayanarak açıklamalar yapmak ve analizlerimizi sürdürerek çıkarımlarımızı paylaşmak zorundayız. Bu güncellemeyi diğerlerinden ayıran şey, genellikle Matt Cutts'tan duymaya alıştığımız bu gelişmelerin başka bir ağızdan çıkması ve aslında bu güncellemenin yaklaşık 1 aydır yayında olmuş olması?! Amit'in açıklamasına göre bu güncelleme yazın son aylarında arama indeksine dahil oldu ve bugüne değin halen aktif durumda ancak bu güncellemeye ilişkin duyuru ilk kez yayınlandı. Değişimin %90 seviyelerinde olduğunun belirtilmesi bence SEO dünyası adına oldukça çarpıcı, ancak SEO meraklıları olarak Google arama ekibinin bizle her zaman "çok doğru" bilgiler paylaştığına yönelik zaman zaman bazı tereddütlerimiz de olabiliyor. Bu yüzden durumu tarafsız bir kaynaktan incelemek için MozCast'teki son 30 günde oluşan hareketleri inceleyelim.

MozCast Değişimleri

Bilmeyenler için kısa bir dipnot, MozCast adından da anlaşılacağı üzere partnerimiz Moz tarafından üretilen ücretsiz bir araç. Belirli arama sorgularının genel değişimini sürekli olarak takip ederek, size bu değişimi günlük hava durumu şeklinde esprili bir dil ile iletiyor.

Sıkı MozCast takipçileri aslında yukarıda gördüğümüz son 30 günde arama sonuçlarının çok değişken olmadığının ve aramaların %90'ını etkileyecek bir istatistiğin olmadığını kolaylıkla anlayabilirler. Birbiriyle çelişen bu istatistiklerin sonuçlarını değerlendirirken, bu aramaların sadece belirli arama sonuçlarını değerlendirerek yapıldığını gözardı etmemiz gerekiyor. Kişisel olarak daha önce EMD güncellemeleri sırasında Dr.Pete'in lansmanını yaptığı Delta10 metrikleri dahilinde üretilen bu istatistiklerde, anahtar kelimelerin bir çoğunun short-tail olarak tabir edilen kısa kelimeler için takip edildiğini düşünüyorum. %90 istatistiğinin Google tarafından verildiğini düşünürsek, varolan tüm arama indeksinin ve sorguların değerlendirildiği çıkarımını yapmak mümkün. Konuyu şimdi de Google'ın perspektifi ile değerlendirmek için internetteki arama oranlarını kelime sayılarına göre oranlayan bu istatistiği inceleyelim:

Long Tail kelimeler ve kısa kelimerin karşılaştırması

Bu istatistikler gösteriyor ki, aslında günümüzde yapılan aramaların yaklaşık %70'i tamamen long-tail kelimelerden oluşuyor. Fat-Head olarak belirtilen en yüksek rekabet oranına sahip kısa arama sorguları (1-2 kelime)(örneğin ayakkabı) en yüksek rekabete ve çok yüksek arama miktarlarına sahip olsa da, Chunky-Middle olarak ifade edilen (2-4 kelime)(örneğin ucuz ayakkabı) orta seviye uzunluktaki kelimeler ve long-tail olarak bilinen (4+ kelime)(örneğin ucuz kırmızı ayakkabı modelleri) uzun aramalar pazarın büyük kısmını oluşturuyor. Yani Google'ın burada kastettiği %90'lık değişim büyük olasılıkla genel olarak uzun sorguları içeriyor olabilir.

Knowledge Graph ve Hummingbird Güncellemesi İlişkisi

Bu çıkarımı doğrulayabilmek adına yapılan basın açıklamasını okuduğumuzda, "arama sonuçlarının oluşturulan sistem ile Google tarafında daha anlaşılır olması" adına çok önemli değişimler olduğu vurgulanıyor. Kısa bir sorguda kullanıcının arama davranışının ve aramayı yapmaktaki asıl amacının anlaşılmasının oldukça güç olduğunu değerlendirirsek, bu güncellemenin aslında insanların taleplerini daha net biçimde ifade ettiği uzun olan kelime öbekleri (long-tail) için geçerli olduğunu doğrulayabiliriz. Konunun biraz daha detaylarına indiğimizde, detayları tam olarak anlamak için Hummingbird'ün habercisi olarak ifade edebileceğimiz Knowledge Graph sonuçlarını incelememiz gerekiyor.

 Knowledge Graph için Bir Örnek (Steve Jobs)

Örnekte görüldüğü üzere Knowledge Graph sayeinde Steve Jobs ile ilgili herhangi bir sorguda, kişiyle ilgili ihtiyaç duyabileceğimiz bazı detaylara sağ tarafta yer alan yeni kutuda görebiliyoruz. Görülen o ki, Google bir süredir uyguladığı bu yeni model ile kullanıcılardan geçerli not almış olmalı, çünkü bu alana yönelik yatırımlarını Hummingbird gibi algoritmik düzenlemelerle halen sürdürüyor. Burada vurgulanması gereken temel şey: Google'ın Hummingbird güncellemesinin zaten halihazırda bir süredir yayında olan sorguların Knowledge Graph ile olan ilişkisini artık tüm web indeksiyle buluşturmak istemesi. Daha net bir tabirle: "kullanıcının isteklerini Knowledge Graph'e iletmek için sorguları daha farklı bir teknoloji ile analiz eden Google, artık bu teknolojiyi sadece Knowledge Graph için değil tüm Web'de geçerli kılmak için çalışacak".

Bu durumun biraz kompleks göründüğünün farkındayım, bunu aklınızda daha net bir biçimde özetleyebilmek için proje müdürümüz Mehmet ile birlikte ofiste bir video hazırladık:

Bu videoda örneklemek istediğimiz en temel şey, Google'ın yeni inovasyonu olan diyalog etkileşimli sorguların artık bir çok soruya cevap verir hale geldiği. Videoyu izlediğinizde sizin de göreceğiniz üzere, ilk sorguda "Steve Jobs hakkında bilgi sorguluyoruz" hemen ardından gelen sorgularda, artık ilgili kişiyi belirtmeksizin "ne zaman vefat etti" diye sorduğumuz zaman Google'ın doğrudan bir önceki sorgumuz ile eşleştirme yaptığını görüyoruz. Hemen ardından "çocuğu var mı?" sorusuna yanıt olarak yine Steve Jobs hakkında ilgili bilgiyle geri dönüş alıyoruz. Son olarak "boyu ne kadardı" sorusunda da yine kişiyi belirtmeksizin aramamıza rağmen ilgili bilginin bize ulaştığını görüyoruz. Search Engine Land tarafından "diyalog etkileşimli sorgular" olarak tanımlanan bu durum aslında Hummingbird'ün vizyonunu ve amacını bize doğrudan açıklıyor.

Bu aslında Michael King'in SEOZONE'da yaptığı "İleri Seviye SEO" adlı sunumda da bahsettiği yeni nesil SEO fırsatlarına (Siri Optimization, Car Dashboard Optimization, Google Glass Optimization) yeni bir kapı açıyor. Bir Google Glass kullanıcısı olarak videoda bahsettiğimiz konularda arama yaptığınızı ele alalım. Her yeni soruda, Steve Jobs'ın adını tekrar eder miydiniz? Bu kesinlikle kullanıcı deneyimini çok aşağı çeken bir detay olurdu. Bu yüzden Google, Hummingbird ve benzeri güncellemelerle kullanıcıların sorgularında aslında ne demek istediğini çok daha yakından ve semantik düzende anlamlandırmaya çalışıyor. Hummingbird güncellemesinde oluşan en temel durum, eskiden sadece Knowledge Graph sonuçlarıyla ilişkilendirmek için yapılan bu düzenlemeler artık tüm Web'e yayılmış oluyor. Yani Google arama sorgularımızda ne demek istediğimizi, yeni geliştirmeleri dahilinde çok daha iyi anlayacak ve arama ögeleri arasındaki ilişkileri değerlendirerek daha nokta atışı çözümleri size sunmaya çalışacak.

Örneklerle Sorgu Ayırma Teknolojisini Değerlendirelim

Bu süreçlerle ilgili aklımızda daha net bir projeksiyon çizmek adına örnekler üzerinden ilerleyelim. Andorid & iOS akıllı telefonu olan okuyucularımızın Google Now'ı yüklemelerini rica edeceğim. Sadece İngilizce desteği olan bu uygulama ile sesli olarak sorunuzu yönelterek, bir arkadaşınızın doğum gününü sorabilir ya da geçtiğimiz ay bisikletle kaç kilometre yol katettiğinizi öğrenebilirsiniz. Bilim kurgu filmlerinde görmeye alıştığımız, teknolojik cihaz ve insan etkileşimi adına gerçekten çarpıcı olan bu uygulama henüz istenilen kadar stabil çalışmıyor ve isteklerinizi algılamıyor. Ancak bu uygulamanın pazarda var olması bile aslında Google'ın büyük hayaline ait ipuçlarını veriyor ve Google'ın aramaları daha anlamlı kılmak için neden üstün bir gayret sergilediğini daha iyi anlayabiliyoruz.

Bu durumun Hummingbird ile ilişkisinin daha net algılanması için örnek bir sorgu üzerinden ilerleyelim. [şu an açık olan ve evime en yakın pizzacılar] sorgusunun yapılması durumunda ortaya çıkacak sonuçların mantığını incelersek Hummingbird'ün nasıl çalıştığını çok daha iyi anlayabiliriz. Ancak önce bu sorgunun Google tarafında yaratabileceği alt değerleri 5 adımda ele alalım:

  1. Pizza ile ilişkili olan tüm restorantlar (pizza kelimesi geçiyor, yemek ile ilişkili ve restorantı tetikliyor)
  2. Ankara'da yer alan tüm pizzacılar (aramanın yapıldığı konum Ankara olduğu için sonuçlar filtreleniyor)
  3. Şu an açık olan pizzacılar (Google Places, Yelp ya da Foursquare'den pizzacıların çalışma saatleri alınıyor)
  4. Bulunduğum saat içerisinde halen çalışıyor olan pizzacılar (sorgunun yapıldığı saat ile eşleşenler listeleniyor)
  5. Buradaki pizzacılar arasında evime en yakın olanlar (sorgunun yapıldığı konuma en yakın olanlar listeleniyor)

Bu sorgu içerisinde elde edilebilecek bu değerlerin bu şekilde genelden spesifiğe indirgenmesi sonucunda nihayet aradığımız pizzayı bularak karnımızı doyurmamız mümkün! Tipik bir Google sorgusunda, sadece bu kelimeleri içeren sayfaların belirli kurallara göre sorgulanacağını düşünebilirdik (sorguda yer alan "evime yakın" vb. kelimeleri içeren web siteleri), ancak Hummingbird buradaki tüm arama ögeleri arasındaki ilişkiyi tespit ederek gerçek anlamda aradığınız veriye ulaşmanızı sağlamaya çalışıyor.

Sorgu Ayırma Teknolojisine Ait Patent Araştırmaları

Anlattıklarım konusunda fazla hayalci olduğumu yada komplo teorileri yarattığımı düşünmemeniz adına dünyaca ünlü arama patenti analisti Bill Slawski'nin paylaştığı bulguları inceleyebilirsiniz. Arama ögeleri arasındaki ilişkileri inceleyen "Synonym identification based on co-occurring terms" adlı patent işin arka planını merak eden bir çok ileri seviye SEO meraklısını heyecanlandıracaktır. Bu yazıya mahsus olarak patente ilişkin aşağıda yer alan görsel üzerinden kısa bir inceleme yaparak, patent incelemesi konusunda tecrübesi olmayan okuyucularımıza yardımcı olmaya çalışacağım. Burası biraz karmaşık gelebilir ancak detaylı anlatmaya gayret ettiğim bu çalışmada, numaralandırmaya dikkat ederek bir kaç kez okursanız kolayca anlayacağınıza inanıyorum.

Patent görselini adım adım inceleyerek detaylandıralım

Hummingbird Algoritması Olduğu Düşünülen Patentten Bir Alıntı

Patent araştırmalarına aşina olmayanlar için bunun bir sistemin çalışma akışı olduğunu belirtmekte fayda var. Aklınızı çok karıştırmadan üstteki akışın ne anlama geldiğini maddeleyerek açıklayacağım.

  • En altta 130 numarada gördüğünüz üzere bu Google'ın kullanıyor olduğu düşünülen Search System (Arama Sistemi).
  • Ortada gördüğünüz 120 numaralı bulut, şu an bu yazıyı okumanızı sağlayan internet bağlantınız.
  • Bulutun üstünde kalan 100-120 arası numaralandırılan her şey sizin bilgisayarınız ve ona ait cihazlar.
  • Bulutun altında kalan yapı ise Google'ın her arama sonucunda çalıştırdığı varsayılan sorgu ayırma sisteminin bir şeması.
  • 105 numarada gördüğünüz "Original Query" (arama sorgusu) ile Google'ın arama sistemine isteğinizi doğrudan iletiyorsunuz.
  • Sizin arama sorgunuz 140 numarada gördüğünüz "Search System Front-end" (arama karşılama birimi) tarafından alınıyor.
  • Eğer parçalara ayrılması gereken bir sorgu yolladıysanız, bu sorgu 170 numaralı "Query Reviser Engine" (sorgu revize motoruna) gönderiliyor.
  • 170 numaralı bu merkezde arama sorgunuz ilgili parçalara bölünerek, detaylı analiz edilmek üzere 180 numaralı Synonym Engine (eş anlamlılar motoruna) gönderiliyor.
  • 180 numaralı eş anlamlı motoru ilgili sorguları belirli kurallar eşliğinde zenginleştirerek arama için hazır hale getirmek için çalışıyor.
  • Eş anlamlılar motoruna bağlı çalışan 190 numaralı Query Logs (sorgu kayıtları) daha önceden yaptığınız arama sorgularındaki -varsa- benzerlikleri ve ilişkileri sorguya ekleyerek zenginleştiriyor.
  • 185 numaralı Synonym Rules (benzerlik kuralları) benzerliğin sınırlarını belirliyor. Örneğin: [bodrum'da yüzmek] aramasını yaptıysanız, "yüzmek" kelimesinin "bodrum" ile beraber kullanıldığını gördüğü için "koyun derisi yüzmek" anlamındaki "yüzmek" ile karıştırmaksızın alternatiflerini yaratıyor.
  • 192 numaralı Adjacent Context (yakın içerikler) birimi ise bu konu hakkında internette bulunan genel içeriği inceleyerek, [bodrum koyları] ya da [akdeniz koyları] gibi ilişkili kelimeleri tespit ederek sorguyu zenginleştiriyor.
  • 194 numaralı Floating Context (dalgalı içerikler) bu alanla ilgili daha önceden oluşturulan içerikler ne tip kullanıcı eklemeleriyle zenginleştirildiyse (bodrum koyları hakkındaki bir forum tartışmasına yazılan yorumlar gibi) ilgili alanları değerlendirerek sorguyu zenginleştiriyor.
  • Tüm bu işlemlerin sonunda çok daha nitelikli ve güçlü bir hale gelen arama sorgusu tekrardan 140 numaralı arama karşılama alanına geri dönüyor.
  • Buradan 150 numaralı  Search Engine (arama motoru) (geniş bir veride arama yapan araç anlamındaki arama motoru) aracılığıyla, 160 numaradaki Index Database (arama indexi) içerisinde detaylı olarak taranıyor.
  • Burada elde edilen sonuçlar ise tamamen farklı bir vaka analizinde incelenmesi gereken sıralama filterelerinden geçerek 120 numaralı buluttan yani internetten tekrar dönerek arama sonucu sayfası aracılığıyla bilgisayarlarınıza ulaşıyor!

(yasal not: yukarıda yer alan iş akışına ait tüm detaylar benim tarafımdan, kendi tecrübe, bilgi birikimi ve gözlemlerime göre oluşturuldu. Google tarafından hiç bir şekilde doğruluğu onaylanmamış bir bilgidir. bu konuda bir yasal sorumluluk kabul etmiyorum)

Çok etkileyici değil mi?! Tüm bu uzun süreçlerin bir kaç milisaniyede gerçekleşiyor olması ise bu yazıyı okuyan bir çok mühendisi daha derinden etkileyen asıl detay olmuştur. Hummingbird'e geri dönecek olursak, 170 numarada gördüğünüz Query Reviser Engine (sorgu revize etme motoru) ve bununla birlikte çalışan diğer bileşenleri doğrudan etkileyerek gerçekleştiği varsayılan güncelleme dahilinde bahsettiğimiz tüm değişimleri doğrudan arama sonucunda görebiliyoruz. Yani burada yapılan bu güncelleme ile bu motorun tüm çalışma biçiminin tekrar ele aldığını söyleyebiliriz.

Kapanış ve Özet

Yazının başında da bahsettiğim üzere bu konuyla ilgili internette henüz çok fazla bilgi bulabilmek mümkün değil. Bizim SEOZEO'da da sürekli uyguladığımız üzere, bu tip güncellemeler sonrasında Google'ın yakın zamanda yayınladığı patentlerin araştırılmasıyla başlayan analiz süreçleri, yeni vakaların ortaya çıkmasıyla somut verilere dönüşebiliyor. Bu aşamada SEOZEO olarak tüm dünya basınında bulabileceğiniz bilgileri kendi yorumlarımızla derleyerek ve patent araştırmalarını detaylandırarak sizlerle paylaştık. Yazıyı buraya değin okuyan SEO meraklılarının bu yazıdan bir çok değerli çıkarım yapabileceğine inanıyorum. Google'ın arama sorguları arasındaki ilişkileri bu şekilde detaylandırabiliyor hale gelmesi sonuç olarak kaliteli içeriği üreten ve arayanın davranışlarına en uygun çözümler üreten internet projelerini sevindireceğe benziyor!

Şimdilik bir araştırmanın daha sonuna geliyoruz. Özellikle yurtdışındaki komünitelerde gördüğüm üzere, bence bir yazıyı değerli kılan her zaman için yazıda yazılanlardan çok yorum alanındaki tartışmalar oluyor. Türkiye için üzücü olan bu alanda ne yazık ki çok fazla kullanıcı etkileşiminin bulunmaması. Bu konuyla ilgili tüm karşıt fikirlerinizi sıkı sıkıya tartışmak ve harika bir içerik üretmek adına bekliyorum. (194 numaralı maddeye burada göz kırpıyorum)

Bir sonraki araştırma yazısında görüşmek üzere!

 

[vimeoyoutubepopup_video displaytype="text" text="Video izle" videoplayer="vimeo" videoid="100300276" width="900" height="510" autoplay="true"]