OpenAI tarafından geliştirilen DALL·E 2 adı verilen yazılım, kullanıcı tarafından sağlanan metin açıklamasına dayalı olarak yeni görüntüler oluşturmak için makine öğrenimini kullanıyor. Bunun nasıl çalıştığına dair örnekleri web sitesinde görebilirsiniz: Geliştiriciler, DALL·E 2’nin bu açıklamalardan nasıl farklı görüntüler ürettiğini görmek için farklı konuları, eylemleri ve ayarları karıştırıp eşleştirmenize olanak tanır.
Örneğin, “denizden fırlayan bir balina” derseniz, size birden fazla fotoğraf üretir. Bunlar daha önce çizilmemiş fotoğraflar olur. Tamamen yapay zeka tarafından üretilmiştir. Ayrıntılı istekleri bile kabul edebilir ve modern bir sanat müzesinde görmeyi bekleyebileceğiniz görseller üretebilir. Yukarıda buna dair bir video görüyorsunuz.
DALL·E 2 nasıl çalışır?
Proje aslında Ocak 2021’de DALL·E ile başladı . Amaç DALL·E 2 ile aynıydı; metinden yeni görseller oluşturabilen bir program yaratmak. O günden bu yana OpenAI, yazılımı DALL·E 2 olarak yeniden piyasaya sürerek görüntü kalitesini nasıl büyük ölçüde artıracağını buldu.
DALL·E 2 geliştiricileri, etiketli görselleri kullanarak sistemi eğitiyor. DALL·E 2 muhtemelen “araba” etiketli arabaların, “ev” etiketli evlerin, “kahve” etiketli kahvelerin vb. binlerce görüntüsünü görür. Ne istediğinize ilişkin en iyi tahminini oluşturmak için bu bilgi veritabanını kullanır. Açıklamanızın her bir parçasını bilmek için yeterli eğitime sahipse, “komik bir şapka takarken vergisini ödeyen bir maymun” gibi daha önce hiç görmediğiniz şeylerin olağanüstü derecede doğru görüntülerini elde edersiniz.
Pek çok makine öğrenimi programı bu şekilde çalışır, ancak DALL·E 2’nin farklarından biri, OpenAI’nin ifadesiyle “boşlukları doldurabilmesidir”. Temel olarak, DALL·E 2 metin açıklamanıza bakar ve sağlamadığınız bağlam hakkında düşünür. Eğer “dışarıda basketbol oynayan bir köpek” diye soruyorsanız, bir parkın etrafında bulunabilecek bir basketbol sahasını kastettiğinizi varsayacağız, bu da ağaçları, çimenleri, gökyüzünü vb. görmeniz gerektiği anlamına gelir.
Bununla birlikte, DALL·E 2’nin ekibi sistemin bilgisindeki boşlukların varlığını açıkça kabul ediyor ve bu durum bazı ilginç ve anlayışlı keşiflerle sonuçlanabiliyor. Sistem “uluyan maymunlar” konusunda eğitilmemişse, ondan bir “uluyan maymun” çizmesini istemek, aradığınız belirli maymun türü yerine çığlık atan maymunların resimleriyle sonuçlanabilir.
DALL·E 2’nin uygulaması yeni görüntüler oluşturmanın da ötesine geçiyor. Aracı yapay zeka destekli bir fotoğraf düzenleyici olarak kullanabilir, görsellerdeki beğenmediğiniz öğeleri kaldırabilir veya daha önce orada olmayan yeni bileşenler ekleyebilirsiniz. Ayrıca mevcut görüntülere dayalı olarak yeni görüntüler de oluşturabilir: Mona Lisa’yı boyamanız gerekiyorsa ancak yapamıyorsanız, DALL·E 2 bunu yapabiliyormuşsunuz gibi gösterir.
DALL·E 2’nin geliştiricileri, DALL·E 2’yi nefret veya şiddete dayalı görseller oluşturmak da dahil olmak üzere kötüye kullanımdan uzak tutmaya kararlı. Ancak gerçek yüzlerin karışıma dahil edilmesine gelince, DALL·E 2 duruşunu değiştirdi. İlk başta geliştiriciler, kullanıcıların gerçek kişilerin resimlerini DALL·E 2’ye yüklemelerine izin vermedi, ancak son zamanlarda bu politikayı tersine çevirdiler . Artık yapay zeka tarafından oluşturulan sanatınıza gerçek yüzleri yükleyebilir ve düzenleyebilirsiniz; bunun kesinlikle etik kaygıları vardır.
Ayrıca bu yapay zeka sanat yaratıcılarının, kendi görüntülerini üretmek için telif hakkıyla korunan materyalleri çalmalarına dair bir endişe de mevcut.
OpenAI, yakında Dall-E 3’ü piyasaya sürecek. DALL·E 2’nin görüntü oluşturmasını geliştirmekle kalmıyor, aynı zamanda doğrudan ChatGPT ile entegre oluyor.