Open AI’nin ChatGPT’si artık “görme, duyma ve konuşma” yeteneğine sahip olmasını sağlayan güncellemeler yayınladı. Daha sezgisel bir ChatGPT arayüzünü öne çıkaran yeni güncellemeleri blog gönderisi ve tweet ile duyuruldu.
OpenAI, “Artık asistanınızla sohbet etmek için sesi kullanabilirsiniz” diyor.
Yeni bir açık kaynaklı metinden konuşmaya modeliyle desteklenen ChatGPT’nin, yalnızca metinden ve birkaç saniyelik örnek konuşmadan insan benzeri ses üretebildiği belirtildi.
ChatGPT’nin açık kaynaklı konuşma tanıma sistemi olan Whisper , “aileniz için bir uyku öncesi masalı istemek veya bir yemek masası tartışmasını çözmek” gibi şeyler yapacak.
Kullanıcılar ayrıca ChatGPT ile belirli görseller hakkında etkileşime geçebilecek veya yeni bir çizim aracı kullanarak sadece soru sorarak bir görselin bölümlerini seçebilecek.
OpenAI, ChatGPT’nin akıl yürütme becerilerini soruları yanıtlamak, analiz etmek veya “fotoğraflar, ekran görüntüleri ve hem metin hem de görsel içeren belgeler gibi çok çeşitli görseller” hakkında fikir vermek için kullanacağını söyledi.
Bir ızgaranın neden çalışmadığını, yemek planlamak için buzdolabının içindekileri tespit etmek veya işle ilgili veriler için karmaşık bir grafiği analiz etme gibi görevler, botun bir resmi paylaşan kullanıcılarla nasıl etkileşime gireceğine dair yalnızca birkaç örnek olarak veriliyor.
Kullanıcılar, tümü şirket tarafından profesyonel seslendirme sanatçılarıyla işbirliği içinde oluşturulan, etkileşime girebilecek beş farklı ses seçeneğine sahip.
Yükseltme, ChatGPT’yi Apple’ın Siri’si , Google’ın sesli asistanı ve Amazon’un Alexa gibi kullanıcılarla sözlü olarak etkileşime girebilen diğer yapay zeka AI asistanlarıyla uyumlu hale getirecek. Görüntü özellikleri aynı zamanda ChatGPT’yi Google Lens ile doğrudan rekabete sokacak.
Her üç teknoloji devi de son haftalarda ürünlerine Amazon’un yapay zeka destekli insan benzeri Alexa’sı ve Google’ın Bard’ı için yeni yapay zeka özellikleri gibi kendi büyük yapay zeka yükseltmelerini sundu.
Ağustos ayında ChatGPT , belgeleri özetlemekten bilgisayar kodu yazmaya kadar çok çeşitli ticari görevler için birçok büyük şirket tarafından benimsenmiş olan kendi Enterprise sürümünü yayınladı.
OpenAI, yeni Whisper teknolojisinin Spotify tarafından pilot program olarak da yürütüldüğünü, böylece podcast yayıncılarının kendi seslerini kullanarak podcast’lerini farklı dillere çevirebileceğini söyledi.
OpenAI, Kasım 2022’de piyasaya sürülmesinden bu yana şirkete yöneltilen yapay zeka ve gizlilik endişelerindeki son artıştan çekinmemek için, ChatGPT’nin görüntülerde paylaşılan belirli kişileri analiz etme ve bunlar hakkında doğrudan açıklamalar yapma yeteneğini önemli ölçüde sınırlamak için teknik önlemler aldığını söylüyor.




Kaynak : 