Google, Search Console üzerinden istediğiniz verileri daha rahat elde edebilmek için RegEx’i desteklediğini açıklamıştı. Bu makalede Search Console verilerini RegEx kullanarak SEO’da nasıl kullanılabileceğini açıklamak istedim.

Regular Expressions (Regex) Nedir?

Regular Expressions (Regex), metinleri veya sorguları birbirleriyle eşleştirme, hariç tutma, bulma ve yönetmenizde işe yarayan ifadelere verilen isimdir. 

Google Search Console’da RegEx Kullanımı

Google Search Console, Re2 syntax kullanır ve bilinen tüm düzenli ifadeleri desteklemeyebilir. RegEx filtresini sayfa ve sorgu raporlarında kullanabilirsiniz. Bunu yapmak için Performans kısmından aşağıdaki adımları uygulayabilirsiniz.

+New butonuyla Query ya da Page kısımlarından ilerleyebilirsiniz. Yani hangi alanda RegEx kullanacaksınız buna karar vermeniz gerekiyor:

Aşağıdaki alandan desteklenen RegEx türlerini girebilirsiniz: .*seo.*|.*schema.*

İsterseniz bu alanda marka (brand) sorgularınızı da dahil edip çıkartabilirsiniz:

zeo|seozeo

RegEx kullanırken bazı karakter sınırlamaları da bulunmakta. 4096 karakter sınırı bulunduğundan çok fazla query ile işlem yaparken buradaki sınırlamaya dikkat etmenizde fayda var:

Kicked the tires…what’s the character limit? 😎 pic.twitter.com/dxrDeGm1D3

— Brian Shumway (@b_shumway) June 10, 2021

Karakter sayısından kazanç sağlamak için https://zeo.org/tr/blog/seo-gorunurlugu-nedir-nasil-artirilir/ ve https://zeo.org/tr/blog/google-news-nedir-google-haberler-icin-seo-onerileri/ 2 sayfanın performansını bir arada görmek istiyorum. Aşağıdaki gibi basit bir RegEx işimi görecektir:

zeo.org/tr/blog/seo-gorunurlugu-nedir-nasil-artirilir|zeo.org/tr/blog/google-news-nedir-google-haberler-icin-seo-onerileri

Burada yüzlerce sayfaya ait veri görmek istediğim senaryoda ise karakter sayısı çok fazla olacaktır. Bunu daha optimize bir hale getirmek için aşağıdaki gibi RegEx kullanarak karakter sayısından kazanç sağlayabilirim:

zeo.org/tr/blog/(seo-gorunurlugu-nedir-nasil-artirilir|google-news-nedir-google-haberler-icin-seo-onerileri)

SC’da eklenmiş hali:

En çok kullanılan RegEx formüllerini aşağıda bulabilirsiniz:

  • () : Öğeleri birlikte gruplamak için
  • | : OR yani “veya” anlamına geliyor
  • ^ : ile başlar
  • $ : ile biter
  • [^] : İçermeyen karakterler ( [^seo] gibi)
  • \s : boşlukla eşleşir
  • \W : Harf, rakam veya alt çizgi olmayan herhangi bir şeyle eşleşir
  • \S : boşluk olmayan her şeyle eşleşir
  • \w+ : bir kelime ile biten

Bir Kelime İçeren Tüm Sorguları/Sayfaları Eşleştir

Bir kelimeyi .* Kullanarak filtreleyebilir ve eşleştirebilirsiniz. Örneğin .*seo.* RegEx’i yazarak içinde seo yazan kelimeleri görebilirim:

Negatif Filtreleme

Google RegEx filtresini getirdikten kısa bir süre negatif eşleştirme türlerinden ihtiyacı da göz önüne alarak negatif filtreleme yapılabilmesini de sağlamaya başladı. Yani belirttiğiniz RegEx’i içermeyen sonuçları kolay bir şekilde görebiliyorsunuz.

-15 karakterden daha az olan sorguları bulmak:

^[\w\W\s\S]{1,15}$ 

-Long tail kelimeleri bulmak için aşağıdaki RegEx’i kullanabilirsiniz. Bu sayede uzun kuyruklu diye bildiğimiz hangi kelimelerden ne kadar trafik geliyor bunları tespit edebilirsiniz. 55 sayısı yerine istediğiniz sayısı bu kısımda kullanabilirsiniz:

^[\w\W\s\S]{55,}$

Örnek çıktı:

-URL’lerde 150 karakterden uzun sayfa URL'lerini filtrelemek için aşağıdaki RegEx’i kullanabilirsiniz:

^[\w\W\s\S]{150,}$

​​

-URL’de özel karakterleri tespit etmek istiyorsanız aşağıdaki yapıyı kullanabilirsiniz:

[^\/\.\-:0-9A-Za-z_]

-Sonunda eğik çizgi içeren (veya içermeyen) sayfaları göstermek için şunu kullanabilirsiniz:

.*\/$

-HTTP yad a HTTPS versiyonlarınıza gelen trafiği görmek için şunu kullanabilirsiniz:

https?\:\/\/.*example\.com\/?$

Wordpress gibi siteniz varsa dizine eklenmiş olan yönetim sayfalarını görebilirsiniz. Başka bir CMS kullanıyorsanız aşağıdaki kısmı değiştirmeniz yeterli olacaktır:

.*wp-.*

RegEx ile Query & Page Karşılaştırma

RegEx ile yazdığınız ifadeleri birbirleriyle karşılaştırabilirsiniz. Aşağıdaki örnekte Query raporlarına göre “SEO” ve “Ads” kelimelerini birbirleriyle karşılaşmak istedim:

Kullanıcı Amacını Anlama

Query sonuçlarıyla kullanıcıların niyetlerini de anlayarak daha kapsamlı analizler oluşturabilirsiniz. Örneğin sadece soru kelimelerini içeren bir RegEx oluşturarak FAQ schema ile S.S.S kısımlarını oluştururken bu sonuçları kullanabilirsiniz.

kim|nasıl|ne zaman|neden

Örnek kullanım:

Özellikle biyografi ya da benzer konularda içerik üretiyorsanız bu sonuçlarla içeriğini daha kapsamlı hale getirebilirsiniz.

E-ticaret gibi sitelerde conversion odaklı kelimeleri de burada filtreleyebilirsiniz:

.*(satın al|sipariş|fiyatı|ödeme).*

Örnek:

Sadece Rakamları Filtreleme

Zaman zaman sadece rakam ya da harf ile ilgili sonuçlara ulaşmak isteyebiliriz. Bu durumda aşağıdaki RegEx ifadelerini kullanabilirsiniz.

[[:digit:]] ifadesi ile sadece rakamlara ilişkin queryleri görebilirsiniz:

Örnek çıktı:

Noktalama İşaretlerine İlişkin Filtreleme

[[:punct:]] ile sadece noktalama işaretlerini içeren sonuçları tespit edebilirsiniz:

Örneğin artı (+), tire (-) ya da kesme işareti (‘) gibi sonuçlara ilişkin verileri görebilirsiniz.

Dosya Uzantılarına Göre RegEx

PDF ya da .xls uzantılı indexlenmiş sayfalardan ne kadar trafik aldığınızı aşağıdaki komutla görebilirsiniz:

\.docx|\.pdf|\.xls

Search Console’dan kullanımı:

Örneğin çıktısı:

Son olarak Search Console ile Google Analytics hesabınızı bağladıysanız aşağıdaki gibi komut ile Analytics üzerinden de analizlerinizi sürdürebilirsiniz:

Son olarak belirtmem gerekirse RegEx’i A/B testi yaparken bile kullanabilirsiniz. Bu makalede SEO tarafında RegEx kullanım örneklerini açıklamaya çalıştım umarım faydalı olmuşumdur :) 

Faydalı kaynaklar:

https://regex101.com/

https://developers.google.com/search/blog/2021/06/regex-negative-match

https://github.com/google/re2/wiki/Syntax