Son yıllarda en çok merak edilen ve de yönetilmeye çalışılan konuların başında “Google’ın arama algoritması” geliyor. Yeni bir endüstri kolu (SEO Engineering) yaratılmasına da neden olan bu konuda Google bugün 3 bölümlük bir interaktif web sitesini yayına açtı.
Google ürün yöneticisi Jake Hubert konula ilgili blog yazısında şunları söyledi :
“Burada arama sürecinin tamamını görebilirsiniz; taramadan, indekslemeye, algoritmik sıralamadan ve sunuştan, webspam’lerle savaşa kadar hepsini.”
Google’un arama algoritması bir doktora projesi ile başladı. Öncesinde “site eklemeli” ya da “algoritması olmayan” arama motorları tanıyorduk Bu arama motorlarında, ilgisiz bir içerik en üstte gelebiliyordu. Google’un üstünlüğü ise hızı, sunduğu sayfa çeşitliliği ve tabi ki sıralama algoritması oldu.
Sunduğu sayfa çeşitliliği, “crawling” tekniği kullanarak, webi gezmesine dayanıyor. Crawling, küçük program parçacıkları yoluyla webin devamlı taranmasına verilen ad. Taranan yeni sayfalar, Google’un kendi oluşturduğu sunucularda indekslenir. Google’un açtığı web sitesindeki 1.bölüm bunu anlatıyor.
Bu sayfalar, bazı kriterleri kullanarak sıralanır. Bu Google’un meşhur PAGE RANK yani sayfa sıralamasıdır. İlk kuruluşunda 12 kadar kriterden bahsedilirdi. Bugünlerde 200’e yakın kriter olduğu biliniyor. Tam olarak ne olduğu bilinmeyen ama tahminlerde bulunulan bu kriterlerin yönetilmesi için SEO Optimization denilen bir endüstri doğmuş durumda. Yani müşterilerini bir kelime arandığında en üste taşımak için çalışan firmalar var. 2.bölüm ise bu konuyu işliyor. Bu konuda sayfada bir de video yer alıyor. Bu videoyu aşağıda seyredebilirsiniz.
Müşterilerini en üste taşıyan firmalar derken, doğal olarak bu ne olduğu açıklanmayan kriterleri kandırmak ve çeşitli yollarla hakkı olmayan seviyeye yükselmek isteyen firmalar ya da sayfalar var. Google bunları “webspam” olarak adlandırıyor ve bu konudaki çalışmalarını da 3.bölümde anlatıyor.
Spam konusundaki notlar arasında, aramadan çıkarılan web sayfalarının sayısına yönelik grafikler var. Ayrıca yine bu sayfadan spam ile otomatik mücadele edildiği ama gerekli görüldüğü zaman insanı (manuel) engelleme yapılabildiği de anlatılıyor.
Google’un bugün açtığı sitenin amacı, yayıncılara kendi sitelerinin Google’da nasıl sıralandığına dair bilgi aktarmak olarak açıklandı. Google’un açıklamalarına en alttaki linkten ulaşabilirsiniz.
Sayfaya ulaştığınızda, bazı alanların üzerine gidip tıkladığınızda açıklama çıktığını göreceksiniz. Bu nedenle sayfayı tararken, iyice inceleyin.
Google sitede verdiği bilgilerde 30 trilyon sayfa ve indeksledikleri bilgilerin de 100 milyon GB olduğunu belirtiyor.
[1] HOW SEARCH WORKS