Yüz tanıma sistemleri artık hayatımızda; cep telefonlarına erişim, pasaport kontrolü, kamusal alanların gözetimi gibi çeşitli güvenlik amaçlarıyla kullanılıyor. Akıllı telefonlardaki yapay zekâ destekli yüz tanıma teknolojileri şifresiz erişim sağlıyorlar. Hatta 854 milyon internet kullanıcısı olan Çin’de 1 Aralık 2019’dan itibaren bu yöntemle telefon kullanımı zorunlu hale getirilecek. Yeni bir telefon aldığınızda ülkemizde de güvenlik amaçlı olarak operatör tarafından kimlik fotokopisi isteniyor. Çin’de ise yüzünüzün taranması ve bunun verisinin kaydedilmesi gerekecek. Artık telefonları sahiplerinden başkasının kullanmasına izin verilmemesi isteniyor. Her bir bireyin puanlandığı Çin Sosyal Kredi Sistemi ile uyumlu olan bu uygulamanın güvenilirliği de bu tür alt yapılara dayandırılacak. Örneğin, kırmızı ışıkta geçince ceza puanı veren, kurallara uyup zamanında vergisini, kredi kartını ödediğinde ödüllendiren bu sistem 2020 yılından itibaren tüm Çin’de uygulanacak.
Yüz tanıma (Face Recognition) pazarının 2017’deki 4 milyar dolar büyüklüğünden, 2022’de 7,7 milyar dolara çıkması bekleniyor. Bunun nedeni, yüz tanımanın birçok farklı ticari uygulamasının mümkün olması. Güvenlikten pazarlamaya kadar pek çok farklı alanda kullanılabilecek olan bu altyapılar, nispeten yeni bir özellik olan duygu tanıma (Emotion Recognition) ile daha da önemli hale geliyorlar. Neredeyse tüm teknoloji devlerinin ilgi alanına giren bu konunun bir süredir üstünde çalışılmasına rağmen henüz tam olarak güvenilir sonuçlar verdiği söylenemiyor.
Bir örnek olarak Trump’ın Birleşmiş Milletlerde yaptığı konuşmanın duygu analizine bakabiliriz:
Duygu Tanıma Nedir?
İnsan yüzünü tarayarak yüz ifadelerinden duyguları tanıma işlemini “duygu tanıma” olarak tanımlayabiliriz. İnsanların duygularını tanımlarken 2 tür yaklaşımdan söz ediliyor. Bu yaklaşımlardan biri olan ve İsveç’li bilim insanı Paul Ekman tarafından geliştirilen, FACS (Facial Action Coding System) adı verilen modelde 7 duygunun insan yüzündeki yansımaları tanımlanıyor. Mutluluk, öfke, küçümseme, tiksinme, şaşkınlık, üzüntü ve korkudan oluşan bu 7 mikro ifade (Micro Expression) bilgisayarlı görme sistemleri (Computer Vision) ve yapay zekâ ile insan gözünden daha detaylı olarak saptanabiliyor. Bu analiz yapılırken yüz kaslarının anlık hareketleri gözlemleniyor. Diğer bir ölçüm setinde ise yüz işaret noktaları (FL-Facial Landmarks) olarak adlandırılan, yüzdeki burun, kaşlar, ağızın başlangıç ve bitiş noktaları ve bunların aralarındaki mesafeler incelenerek analiz yapıyor.
Bu algoritmalar henüz mükemmel olarak çalışmasa da sürekli iyileştiriliyor.
Örneğin, aşağıdaki resme bakıldığında ilk anda kızgın bir insan olduğu düşünülebilir.
Oysa bulunduğu ortamla beraber bakılırsa zafer mutluluğu yaşayan biri olduğu anlaşılır.
Duygu tanıma teknolojilerinin kullanım alanlarının çok geniş olması ve giderek daha da iyileşeceği düşünülerek Amazon, Microsoft, Google (Alphabet) gibi tüm teknoloji devlerinin bu konuda çalışmaları hızla devam ediyor. Bu uygulamaların bazılarını inceleyelim.
Amazon
Amazon’un Rekognition platformu bulutta görüntü ve video analizi yapmayı kolaylaştırıyor. Nesneleri, kişileri, metinleri, sahneleri ve eylemleri tanıyabiliyor ve hatta uygun olmayan içeriği tespit edebiliyor. Video ve görüntülerde yüksek doğrulukla yüz analizi ve yüz tanıma yapabiliyor. Kullanıcı doğrulama, kişi sayma ve kamu güvenliği gibi alanlarda kullanılıyor.
Rekognition, günde milyarlarca görüntü ve videoyu analiz etmek için Amazon’un bilim insanları tarafından geliştirilen, ölçeklenebilir, yapay zekâ-derin öğrenme teknolojisi ile çalışan bir bilgisayar platformu. Yeni verileri kullanarak öğrenen bu altyapı sürekli olarak yeni etiketler ve yüz tanıma özellikleri de eklenerek gelişiyor.
2016 yılında kullanılmaya başlanan Rekognition platformu, derin öğrenme (Deep Learning) metodunu kullanıyor. İnsan görüntülerinden yaşlarını da tahmin edebiliyor. Rekognition platformuna herhangi bir resim yüklediğinizde içinde hayvan, bitki, belli bir yer işareti (bina, köprü, kilise) verdiğinizde olasılıklarıyla beraber ne olabileceğini söylüyor. Tek bir resim içerisindeki yüzlerce insan yüzünü tespit edip, bu insanların kaç yaşında olduğunu, cinsiyetlerini, mutlu, üzgün v.b. duygu durumlarını, gözlüklü olup olmadıklarını ve hatta gerçek zamanlı olarak veri tabanındaki milyonlarca insan içinden hangisine ne oranda benzediklerini söylüyor. Sadece fotoğraf değil video içinde de analizler yapabiliyor.
2017’de Amazon’un Rekognition tanıtımı:
Google (Alphabet)
Google’ın geliştirdiği Google Glass, otizmli çocukların karşılarındaki insanların duygularını anlamalarına ve duygu tanıma becerilerini geliştirmelerine yardımcı oluyor.
Google’ın bulutta kullanıma sunduğu Vision platformu daha önceden eğitilmiş modeli ve veri seti ile verilen görüntü içindeki objeleri algılayabiliyor.
Denemek için: https://cloud.google.com/vision/
Duygu tanıma yönteminin kullanılabileceği bazı alanlar
Duygu tanıma, farklı şirketler tarafından tüketicinin duygu durumunu ürün veya markalarına göre ölçmek için yaygın olarak kullanılıyor. Bu teknolojinin getirdiği fırsatlar, pazar araştırması ve dijital reklamcılığın dışında da birçok alanda kullanılabilir.
Sağlıkta duygu tanıma
Doktorların, hastaların ne zaman ilaç kullanmaları gerektiğine karar vermelerine yardımcı olmak üzere duygu analizi yapılabilir. Hekimlerin öncelikli olarak hangi hastayı görmeleri veya müdahale etmeleri gerektiğine karar verirken de yapay zekâ destekli bu teknolojiden yararlanabilirler.
Otomotiv endüstrisinde duygu tanıma
Sürücünün sürüş sırasındaki duygu analizini yapan akıllı araçlar çeşitli aksiyonlar alabilirler. Örneğin uyku veya baygınlık durumunda hızı azaltmak ve hatta aracı durdurmak, çeşitli ikazlarda bulunmak aracın şerit içinde kalmasını sağlamak gibi.
Video oyunlarında duygu tanıma
Video oyunları oynanırken oyuncuların duygu durumlarını da takip edebilen video oyunlarının yeni sürümlerinde oyuncuyu rahatlatan, kolaylaştıran ve daha verimli hale getiren iyileştirmeler yapılabilir.
Duygu tanıma henüz deneysel denebilecek çapta kullanılsa da uygulanabileceği yerleri şimdiden hayal etmek güç. İnsan hayatını kolaylaştıracak ve değer katacak alanlarda kullanılması dileğiyle.