Gmail spam ve kimlik avı e-postalarını işaretleme konusunda daha başarılı olduğunu söylediği yeni bir spam filtresini, mevcut sistemlerde sessizce güncelledi.
Yeni spam filtresi, kelimeleri vektörlere veya sayısal gösterimlere eşleyebilen yeni geliştirilmiş bir metin vektörleştiricisi olan “RETVec”i temel alıyor. Geliştiriciler, bir e-postanın spam olup olmadığı da dahil olmak üzere bilgisayar modellerinin insan dilini yorumlamasına ve sınıflandırmasına yardımcı olmak için uzun süredir metin vektörleştirmeyi kullanıyor.
Geliştiricilere göre, RETVec, çok sayıda özel karakter içeren e-postalar, ifadeler, yazım hataları ve daha önce insanlar tarafından tanınabilen ancak spam filtrelerinin tespit etmesi zor olan diğer öğeler de dahil olmak üzere spam mesajlarını etkili bir şekilde tespit ediyor. Mevcut verilere göre, yeni algoritma, diğer şeylerin yanı sıra, homoglifli mesajları, yani farklı anlamlara sahip grafiksel olarak çok benzer karakterleri etkili bir şekilde tanıyor.
Google nasıl çalıştığını burayı tıklayarak ulaşacağınız şu sayfada gösteriyor.
Google’a göre RETVec algoritması, karakterlerin, yazım hatalarının, homogliflerin vb. eklenmesi veya silinmesi de dahil olmak üzere herhangi bir şekilde manipüle edilmiş bir test içeren mesajları etkili bir şekilde tanımlamak için eğitilmiş. Algoritma, tüm karakterleri ve kelimeleri UTF-8 formatında kodlayan. etkili bir şekilde işlem yapabilen gelişmiş bir kodlayıcı kullanılarak eğitilmiş. Sonuç olarak, dünya çapında 100’den fazla dilde kullanıma hazır bir algoritma sunuluyor.
Google’a göre, RETVec pek çok açıdan insanların okuduğu şekilde çalışıyor. Algoritma, kelimelerin anlamlarını belirlemek için onları oluşturan karakterlerden ziyade görsel “benzerlik” kullanan TensorFlow AI çerçevesini temel alıyor. Google’a göre, daha önce kullanılan Gmail metin vektörleştiricisinin RETVec ile değiştirilmesi, spam tespit düzeyini başlangıca kıyasla %38 artırdı ve hatalı pozitiflerin sayısı %19,4 azaldı. Aynı zamanda, model tarafından kullanılan Tensör İşleme Birimlerinin (TPU’lar) sayısı %83 oranında azaldı ve mevcut güncelleme, Gmail güvenlik sistemi için son yıllardaki en büyük güncellemelerden biri haline geldi.