Londra’daki Imperial College ve İngiltere’deki Samsung yapay zeka araştırma merkezi işbirliği ile yürütülen yeni bir projede [1], tek bir fotoğraf ve ses dosyasının, şarkı söyleyen veya konuşan bir video oluşturmak için nasıl kullanılabileceği gösteriliyor.
Daha önce gördüğümüz önceki deepfake programlar gibi, araştırmacılar da çıktılarını üretmek için makine öğrenmesini [2] kullanıyor. Şimdilik üretilen videolar %100 gerçekçi olmasa da, ne kadar az veri ile gerçekleştirildiği düşünülürse sonuçlar şaşırtıcı.
Örneğin 100 yıldan fazla bir süre önce ölmüş olan, esrarengiz Rus Grigori Yefimovich Rasputin’e Beyoncé’un ‘Halo’sunu söyletmek mümkün.
Çalışma şimdilik tam gerçekçi değil. Ama yine de bu teknolojinin ne kadar hızlı geliştiğini gösteren son örneklerden birisi. Deepfake üretme teknikleri her geçen gün daha kolaylaşıyor. Bu teknolojinin, yakın zamanda yalan propoganda kampanyaları yaratması çok uzak olmasa gerek. Bu teknolojinin kamusal söylem için yakın bir tehdit olduğunu söylemek abartı olmaz.
2016 Amerikan seçimleri sonrasında yayılan “sahte haber” paniğine bu teknoloji katkıda bulunuyor. Batı dünyası bu konuda hayli endişeli. Hukuk yoluyla önlem almaya çalışsalar da, henüz uygulamalarını görmediğimiz için ne denli önleyici olacağı da belirsiz [3]. Anlayacağınız yeni tehlike “deepfake”.
DeepFake Mimarilerinin Takibi Kolay
DeepFake’i neden henüz yalan haber üretimi olarak görmüyoruz diye sorabilirsiniz. Cevabın bir kısmı ; izlenmesinin çok kolay olması. Mevcut deepfake mimarileri, bir makine öğrenim algoritmasının kolaylıkla tespit edebileceği izler bırakır. Ayrıca, deepfake filtreleri kuruluyor. Deepfake video yüklemek, derhal otomatik filtrelerin dikkatini çekecektir. Anlayacağınız bu sistemler henüz mükemmel değil. Gerçeklik hala uzak. Teknoloji henüz hazır değil.
[1] Realistic Speech-Driven Facial Animation with GANs