Google’ın İçerik Ambarı arayüzüne (API) ilişkin dahili belgeler sızdırıldı. Başka deyişle Google’ın arama algoritmalarına ilişkin bilgiler 2500’den fazla sayfa ve 14.014 özellik olarak ortaya çıktı. Sızıntı içerik, bağlantılar ve kullanıcı etkileşimleri için veri depolamayla ilgili ayrıntıları içeriyor ancak puanlama işlevlerine ilişkin ayrıntılar yok, eksik. Kaynak başlangıçta anonimdi, daha sonra EA Eagle Digital’den Efran Azimi olduğu ortaya çıktı.
Sızan ve bir Github deposuna konan 14.014 sıralama özelliği var. Bunları Rand Fishkin incelemiş. Doğrulatmış daha sonra bu konudaki uzman Mike King‘e inceletmiş. Fishkin, bu verilerin Google çalışanlarının yıllardır yaydığı bazı yalanları çürüttüğünü söylüyor. Yalanları tespit eden King ise, sert bir ifade olsa da, burada kullanılacak doğru kelime “yalan” diyor.
Verilen bilgiye göre, Google’ın kullanımdan kaldırılan Document AI Warehouse’a ilişkin dokümantasyonun dahili sürümü, yanlışlıkla istemci kitaplığının kod deposunda herkese açık olarak yayınlandı. Bu kodun belgeleri ayrıca harici bir otomatik belgeleme hizmeti tarafından da yakalandı. Değişiklik geçmişine göre bu kod deposu hatası 7 Mayıs’ta düzeltildi ancak otomatik dokümantasyon hâlâ yayında. Bu depodaki kodun tamamı Apache 2.0 lisansı altında yayınlandığı için, bu kodla karşılaşan herkese, onu kullanma yeteneği de dahil olmak üzere geniş bir haklar dizisi verildi.
Belgeler bu bilgilerin Mart ayı itibarıyla doğru olduğunu gösteriyor. King’in analizine bakarak bir kaç noktaya işaret edelim;
Sıralama Sistemleri ve Özellikler : YouTube, Asistan ve web belgeleri gibi çeşitli Google hizmetleriyle ilgili 14.014 özelliğe sahip 2.596 modülü anlatıyor. Bu modüller yekpare bir havuzun parçası; yani tüm kodlar tek bir yerde saklanır ve ağdaki herhangi bir makine tarafından erişilebilir.
Google’ın Söyledikleri ile Çelişen Maddeler
- Alan Adı Otoritesi : Google’ın iddialarına rağmen, belgeler “siteAuthority” adı verilen bir özelliği ortaya koyuyor; bu da Google’ın site genelindeki yetkiyi ölçtüğünü gösteriyor.
- Sıralamalar İçin Tıklamalar : Google’ın kamuoyundaki inkarlarının aksine, NavBoost gibi sistemler sıralamaları etkilemek için tıklama verilerini kullanır.
- Sandbox : Belgelerde yeni siteleri sandbox’a almak için kullanılan bir “hostAge” özelliğinden bahsediliyor, bu da Google’ın sandbox’ı reddetmesiyle çelişiyor.
- Chrome Verileri : Öyle olmadığını söylemesine rağmen belgeler, Chrome verilerinin sıralama algoritmalarında kullanıldığını gösteriyor.
Mimari : Google’ın sıralama sistemi, tek bir algoritmadan ziyade bir dizi mikro hizmetten oluşur. Anahtar sistemler arasında Trawler (tarama), Alexandria (indeksleme), Mustang (sıralama) ve SuperRoot (sorgu işleme) bulunur.
Twiddlers : King’e göre bunlar “bir belgenin bilgi alma puanını ayarlayabilen veya bir belgenin sıralamasını değiştirebilen” yeniden sıralama işlevleridir. Örnekler arasında NavBoost, QualityBoost ve RealTimeBoost yer alır.
SEO Etkileri :
- Panda Algoritması : Panda, çeşitli düzeylerde (etki alanı, alt etki alanı, alt dizin) uygulanan, kullanıcı davranışına ve dış bağlantılara dayalı bir puanlama değiştiricisi kullanır.
- Yazarlar : Google, yazar bilgilerini gizlice saklıyor. Demek ki yazarlar da sıralamada önemli.
- Düşürmeler : Sıralamayı düşüren şeyler ise şöyle; bir bağlantı hedef siteyle eşleşmiyor, SERP sinyalleri kullanıcı memnuniyetsizliğini gösterir, Ürün incelemeleri, Konum, Tam eşleme etki alanları, Porno.
- Bağlantılar : SourceType gibi metrikler, bir sayfanın dizine eklendiği yere göre bağlantıların değerini gösteren bağlantılar ile önemini koruyor.
- İçerik : Google, kısa içeriğin orijinalliğini ölçer ve belirteçleri sayarak önemli içeriğin erken yerleştirilmesinin önemini güçlendirir.
- Değişiklik geçmişi: Görünüşe göre Google, dizine eklediği her sayfanın her sürümünün bir kopyasını saklıyor. Yani Google, bir sayfada yapılan her değişikliği “hatırlayabilir”. Ancak Google, bağlantıları analiz ederken yalnızca URL’deki son 20 değişikliği kullanır
- Güncellik önemli : Google, künyedeki (bylineDate), URL’deki ( syntacticDate ) ve sayfa içeriğindeki (semanticDate ) tarihlere bakar.
- Google, alan adı kayıt bilgilerini ( RegisterInfo ) saklar : Sayfa başlıkları hala önemlidir. Google’ın, bir sayfa başlığının bir sorguyla ne kadar iyi eşleştiğini ölçtüğüne inanılan, titlematchScore adlı bir özelliği vardır. Google, belgelerdeki ( avgTermWeight ) ve bağlantı metnindeki terimlerin ortalama ağırlıklı yazı tipi boyutunu ölçer. Bir belgenin web sitesinin temel konusu olup olmadığını belirlemek için Google, sayfaları ve siteleri vektörleştirir, ardından sayfa yerleştirmelerini (siteRadius) site yerleştirmeleriyle (siteFocusScore) karşılaştırır.
Küçük siteler : Diğer bir özellik ise küçük bir kişisel site veya blog için geçerli. King, Google’ın bu tür siteleri bir Twiddler aracılığıyla artırabileceğini veya düşürebileceğini tahmin ediyor. Ancak bu açık bir soru olmaya devam ediyor. Yine bu özelliklerin ne kadar ağırlıklı olduğunu kesin olarak bilmiyoruz.
Stratejik Tavsiye : Yazar, harika içerik oluşturmayı, onu iyi tanıtmayı ve SEO stratejilerini denemeye ve test etmeye devam etmeyi tavsiye ediyor.
ABD ile Google arasındaki antitröst davasından elde edilen belgeler ve ifadeler, Google’ın sıralamada tıklamaları kullandığını doğruladı; özellikle de Navboost sistemiyle, Google’ın sıralama için kullandığı “önemli sinyallerden biri”.
Sızıntı, uzun süredir devam eden birçok SEO inancını doğruluyor ve kaliteli içeriğin, kullanıcı katılımının ve stratejik bağlantı kurmanın önemini vurgulayarak Google’ın sıralama mekanizmalarının daha net bir resmini sunuyor.
Google’un önceki sızıntılarının bir listesini burayı tıklayarak okuyabilirsiniz.