OpenAI, kullanımının daha kolay ve sezgisel –1 gün önce büyülü– olacağını söylediği en son yapay zeka geniş dil modelini duyurdu. GPT-4o adı verilen yeni model, OpenAI’nin bir yıldan biraz daha uzun süre önce tanıttığı önceki GPT-4 modelinin bir güncellemesi. Kullanıcıların gerçek zamanlı olarak soru sorup, cevap alması mümkün hale gelmiş.
OpenAI, yeni AI modelini önümüzdeki birkaç hafta içinde piyasaya süreceğini söyledi. Teknolojiden sorumlu yönetici Mira Murati, etkinlikte yeni GPT-4o modelinin, şirketin önceki modellerine göre daha verimli olması nedeniyle ücretsiz olarak sunulacağını söyledi. GPT-4o, ChatGPT’nin metin, ses ve sözde görüntü kullanarak etkileşim kurmasını sağlayacak. Bu, kullanıcılar tarafından yüklenen ekran görüntülerini, fotoğrafları, belgeleri veya grafikleri görüntüleyebileceği ve bunlar hakkında bir şeyler söyleyebileceği anlamına geliyor. OpenAI Baş Teknoloji Sorumlusu Mira Murati, ChatGPT’nin artık bellek yeteneklerine de sahip olacağını, yani kullanıcılarla yapılan önceki görüşmelerden öğrenebileceğini ve gerçek zamanlı çeviri yapabileceğini söyledi.
OpenAI araştırmacıları canlı yayın sırasında, yeni ses özelliklerinin, kullanıcıların ChatGPT ile konuşmasına ve herhangi bir gecikme olmaksızın gerçek zamanlı yanıtlar almasına, ayrıca ChatGPT konuşurken sözünü kesmesine olanak tanıdığını ve bu özelliklerin her ikisinin de yapay zeka sesli sohbet robotlarının şimdiye kadar sahip olmadığı gerçekçi konuşmaların ayırt edici özellikleri olduğunu gösterdi. İkinci bir gösteride ChatGPT sesli asistanı, bir kağıt üzerine yazılmış bir matematik denklemini çözmek için görme yeteneklerini kullandı.
GPT-4o, ChatGPT deneyimini büyük ölçüde geliştiriyor. ChatGPT uzun süredir, “metinden konuşmaya” modelini kullanarak metni yazıya döken bir ses modu sunuyor. Ancak GPT-4o bunu daha da güçlendirerek kullanıcıların ChatGPT ile daha çok bir asistan gibi etkileşime girmesine olanak tanıyor. OpenAI, modelin “gerçek zamanlı” yanıt verme özelliği sunduğunu ve hatta kullanıcının sesindeki duyguyu yakalayıp “farklı duygusal tarzlarda” ses üretebildiğini söylüyor. GPT-4o, ChatGPT’nin görüş yeteneklerini de geliştiriyor. Bir fotoğraf veya bir masaüstü ekranı verildiğinde ChatGPT artık “Bu yazılım kodunda neler yazıyor” veya “Bu kişi hangi marka gömlek giyiyor?” gibi ilgili soruları hızlı bir şekilde yanıtlayabiliyor.
GPT-4o, bugünden itibaren ChatGPT’nin ücretsiz planında ve OpenAI’nin premium ChatGPT Plus ve Team abonelerine “5 kat daha yüksek” mesaj limitleriyle ve “çok yakında” Kurumsal seçeneklerle sunulacak. OpenAI, GPT-4o tarafından desteklenen gelişmiş ses deneyimini önümüzdeki ay içinde Plus kullanıcılarına sunacağını söylüyor.
Sektör uzmanları, ChatGPT’ye güncel, doğru Web bilgilerine erişme ve bu bilgilere bağlanma konusunda arama motoru benzeri yeteneği vermenin bariz bir sonraki adım olduğunu düşünüyor.


Kaynak : 