Google, Search Console üzerinden istediğiniz verileri daha rahat elde edebilmek için RegEx’i desteklediğini açıklamıştı. Bu makalede Search Console verilerini RegEx kullanarak SEO’da nasıl kullanılabileceğini açıklamak istedim.
Regular Expressions (Regex), metinleri veya sorguları birbirleriyle eşleştirme, hariç tutma, bulma ve yönetmenizde işe yarayan ifadelere verilen isimdir.
Google Search Console, Re2 syntax kullanır ve bilinen tüm düzenli ifadeleri desteklemeyebilir. RegEx filtresini sayfa ve sorgu raporlarında kullanabilirsiniz. Bunu yapmak için Performans kısmından aşağıdaki adımları uygulayabilirsiniz.
+New butonuyla Query ya da Page kısımlarından ilerleyebilirsiniz. Yani hangi alanda RegEx kullanacaksınız buna karar vermeniz gerekiyor:
Aşağıdaki alandan desteklenen RegEx türlerini girebilirsiniz: .*seo.*|.*schema.*
İsterseniz bu alanda marka (brand) sorgularınızı da dahil edip çıkartabilirsiniz:
zeo|seozeo
RegEx kullanırken bazı karakter sınırlamaları da bulunmakta. 4096 karakter sınırı bulunduğundan çok fazla query ile işlem yaparken buradaki sınırlamaya dikkat etmenizde fayda var:
Kicked the tires…what’s the character limit? 😎 pic.twitter.com/dxrDeGm1D3
— Brian Shumway (@b_shumway) June 10, 2021
Karakter sayısından kazanç sağlamak için https://zeo.org/tr/blog/seo-gorunurlugu-nedir-nasil-artirilir/ ve https://zeo.org/tr/blog/google-news-nedir-google-haberler-icin-seo-onerileri/ 2 sayfanın performansını bir arada görmek istiyorum. Aşağıdaki gibi basit bir RegEx işimi görecektir:
zeo.org/tr/blog/seo-gorunurlugu-nedir-nasil-artirilir|zeo.org/tr/blog/google-news-nedir-google-haberler-icin-seo-onerileri
Burada yüzlerce sayfaya ait veri görmek istediğim senaryoda ise karakter sayısı çok fazla olacaktır. Bunu daha optimize bir hale getirmek için aşağıdaki gibi RegEx kullanarak karakter sayısından kazanç sağlayabilirim:
zeo.org/tr/blog/(seo-gorunurlugu-nedir-nasil-artirilir|google-news-nedir-google-haberler-icin-seo-onerileri)
SC’da eklenmiş hali:
En çok kullanılan RegEx formüllerini aşağıda bulabilirsiniz:
- () : Öğeleri birlikte gruplamak için
- | : OR yani “veya” anlamına geliyor
- ^ : ile başlar
- $ : ile biter
- [^] : İçermeyen karakterler ( [^seo] gibi)
- \s : boşlukla eşleşir
- \W : Harf, rakam veya alt çizgi olmayan herhangi bir şeyle eşleşir
- \S : boşluk olmayan her şeyle eşleşir
- \w+ : bir kelime ile biten
Bir kelimeyi .* Kullanarak filtreleyebilir ve eşleştirebilirsiniz. Örneğin .*seo.*
RegEx’i yazarak içinde seo yazan kelimeleri görebilirim:
Negatif Filtreleme
Google RegEx filtresini getirdikten kısa bir süre negatif eşleştirme türlerinden ihtiyacı da göz önüne alarak negatif filtreleme yapılabilmesini de sağlamaya başladı. Yani belirttiğiniz RegEx’i içermeyen sonuçları kolay bir şekilde görebiliyorsunuz.
-15 karakterden daha az olan sorguları bulmak:
^[\w\W\s\S]{1,15}$
-Long tail kelimeleri bulmak için aşağıdaki RegEx’i kullanabilirsiniz. Bu sayede uzun kuyruklu diye bildiğimiz hangi kelimelerden ne kadar trafik geliyor bunları tespit edebilirsiniz. 55 sayısı yerine istediğiniz sayısı bu kısımda kullanabilirsiniz:
^[\w\W\s\S]{55,}$
Örnek çıktı:
-URL’lerde 150 karakterden uzun sayfa URL'lerini filtrelemek için aşağıdaki RegEx’i kullanabilirsiniz:
^[\w\W\s\S]{150,}$
-URL’de özel karakterleri tespit etmek istiyorsanız aşağıdaki yapıyı kullanabilirsiniz:
[^\/\.\-:0-9A-Za-z_]
-Sonunda eğik çizgi içeren (veya içermeyen) sayfaları göstermek için şunu kullanabilirsiniz:
.*\/$
-HTTP yad a HTTPS versiyonlarınıza gelen trafiği görmek için şunu kullanabilirsiniz:
https?\:\/\/.*example\.com\/?$
Wordpress gibi siteniz varsa dizine eklenmiş olan yönetim sayfalarını görebilirsiniz. Başka bir CMS kullanıyorsanız aşağıdaki kısmı değiştirmeniz yeterli olacaktır:
.*wp-.*
RegEx ile yazdığınız ifadeleri birbirleriyle karşılaştırabilirsiniz. Aşağıdaki örnekte Query raporlarına göre “SEO” ve “Ads” kelimelerini birbirleriyle karşılaşmak istedim:
Query sonuçlarıyla kullanıcıların niyetlerini de anlayarak daha kapsamlı analizler oluşturabilirsiniz. Örneğin sadece soru kelimelerini içeren bir RegEx oluşturarak FAQ schema ile S.S.S kısımlarını oluştururken bu sonuçları kullanabilirsiniz.
kim|nasıl|ne zaman|neden
Örnek kullanım:
Özellikle biyografi ya da benzer konularda içerik üretiyorsanız bu sonuçlarla içeriğini daha kapsamlı hale getirebilirsiniz.
E-ticaret gibi sitelerde conversion odaklı kelimeleri de burada filtreleyebilirsiniz:
.*(satın al|sipariş|fiyatı|ödeme).*
Örnek:
Zaman zaman sadece rakam ya da harf ile ilgili sonuçlara ulaşmak isteyebiliriz. Bu durumda aşağıdaki RegEx ifadelerini kullanabilirsiniz.
[[:digit:]]
ifadesi ile sadece rakamlara ilişkin queryleri görebilirsiniz:
Örnek çıktı:
[[:punct:]]
ile sadece noktalama işaretlerini içeren sonuçları tespit edebilirsiniz:
Örneğin artı (+), tire (-) ya da kesme işareti (‘) gibi sonuçlara ilişkin verileri görebilirsiniz.
PDF ya da .xls uzantılı indexlenmiş sayfalardan ne kadar trafik aldığınızı aşağıdaki komutla görebilirsiniz:
\.docx|\.pdf|\.xls
Search Console’dan kullanımı:
Örneğin çıktısı:
Son olarak Search Console ile Google Analytics hesabınızı bağladıysanız aşağıdaki gibi komut ile Analytics üzerinden de analizlerinizi sürdürebilirsiniz:
Son olarak belirtmem gerekirse RegEx’i A/B testi yaparken bile kullanabilirsiniz. Bu makalede SEO tarafında RegEx kullanım örneklerini açıklamaya çalıştım umarım faydalı olmuşumdur :)
Faydalı kaynaklar:
https://regex101.com/
https://developers.google.com/search/blog/2021/06/regex-negative-match
https://github.com/google/re2/wiki/Syntax