Yapay zekanın kullanıldığı alanlardan birisi de “ses”tir. Yapay zekanın üretken adını çok duymadığımız önceki döneminde zaten, sigorta, bankacılık, e-ticaret, vsvs ortamlarda bildiğiniz sesli yanıt sistemleri kullanılıyordu. Hani, önceden kaydedilen ve muhasebe için 1’e basın, satış için 2’ye basın vs.. bunun ilk örnekleriydi.
2022 kasımında ChatGPT piyasaya sürüldükten bu yana, üretken yapay zeka konuşmaya başladık. yani Yapay Zeka, “içerik” (ses, metin, görüntü vs her neyse) alıyor ve onun üzerine kendisi benzerini yaratıyor.
Ses konusuna gelirsek, nerede kullanılıyor kısaca bakalım;
Aslında seslendirme işi ya da ingilizce adından gelme kelime ile söylersek dublaj, yeni bir olay değil. Film endüstrisinde ilk dublajın 1949’da yapıldığı kaydediliyor. Rus filminin Çek diline çevrilmesi sırasında kullanılmış ve sonrasında sadece tercüme değil, yanısıra sesi etkileyici olmayan sanatçılara etkili ses vermek için vs de kulanılageldi.
Şu anda bu seslendirme işinin her yere dağıldığını görüyoruz.
- Video kayıtları: Seslendirme sanatçıları, video görüntüleri geliştiren bir komut dosyasına dayalı olarak ses kaydeder.
- E-kitap okuyucular ya da e-Öğrenme Dersleri: Seslendirme sanatçıları genellikle bağımsız yazarlar ve yayın şirketleri için sesli kitap içeriğini okurlar ya da her yaştan ve her konudan öğrenciye yönelik öğretim içeriklerine ses verirler.
- Sesli asistanlar (evde, arabada, telefonda vs): Sesli asistan arayüzleri olarak hizmet veren dijital programlar, sesli komutlara yönelik istemler ve yanıtlar olarak seslendirme sanatçılarının kaydedilmiş ifadelerini kullanır.
- Sesli Yanıt Sistemleri (IVR) : Bir seslendirme sanatçısı, işletmeler için çeşitli telefon karşılamalarını kaydedebilir.
- Animasyonlar ve Video Oyunlar: Oyunculuk geçmişi olan seslendirme sanatçıları, eğlence veya bilgi amaçlı olarak animasyondaki ya da video oyunlardaki karakterlere kendi seslerini ekleyebilirler.
- Radyo ve Video Reklamcılığı: Hem geleneksel hem de çevrimiçi radyo istasyonları, program programlarının bir parçası olarak reklam yayınlar. Videolarda da benzer sesler kullanılır.
Ses Satın Alan Şirketler
Günümüzde Yapay zeka için ses satın alan birçok şirket bulunmaktadır. Bu şirketler genellikle metinden konuşma (text-to-speech) teknolojisi kullanarak ses sentezleme hizmetleri sunarlar. Bazı örnekler şunlardır:
- Google: Google, Google Cloud Text-to-Speech hizmeti aracılığıyla ses sentezleme için farklı sesler ve diller sunmaktadır.
- Amazon: Amazon, Amazon Polly adlı metinden konuşma hizmeti ile yapay zeka uygulamaları için ses sentezlemektedir.
- IBM: IBM, Watson Text to Speech hizmeti ile farklı sesler ve dillerde ses sentezleme imkanı sağlamaktadır.
- Microsoft: Microsoft, Azure Text to Speech hizmeti ile yapay zeka uygulamaları için ses sentezleme imkanı sunmaktadır.
Bu şirketler genellikle ses sentezleme hizmetleri için farklı fiyatlandırma modelleri sunarlar ve geniş bir kullanıcı kitlesine ses teknolojileri sunmaktadırlar.
İnternet üzerinden Ses Alan Platformlar
Sesinizi alan veya seslendirme fırsatları sunan birkaç web sites şöyle sıralanıyori:
Voices.com: Seslendirme sanatçılarının iş bulması ve müşterilerin çeşitli projeler için seslendirme yeteneğini işe alması için popüler bir platform.
Voice123: Voices.com’a benzer şekilde Voice123, seslendirme sanatçılarını seslendirme yeteneği arayan müşterilerle buluşturuyor.
Fiverr: Seslendirme hizmetlerinizi sunan gösteriler oluşturabileceğiniz serbest çalışan bir platform.
Freelancer: Seslendirme hizmetleri sunabileceğiniz ve müşteri bulabileceğiniz bir başka freelance platform.
Upwork: Freelancer’a benzer şekilde Upwork, bir profil oluşturmanıza ve seslendirme hizmetlerinizi müşterilerinize sunmanıza olanak tanır.
Bodalgo: Seslendirme sanatçılarının çalışmalarını sergilemeleri ve seslendirme işleri bulmaları için bir platform.
Voicebunny: Seslendirme sanatçılarını, projeleri için profesyonel seslendirme yeteneği arayan müşterilerle buluşturur.
Bu platformlarda, hesap oluşturup, sonra “Sesini sat” seçeneği ile kullanıcı ses örnekleri kaydediliyor. Farklı metin türleri okunarak sesin çeşitliliği kayıt altına alınıyor. Uygulama ekibi daha sonra kayıtları değerlendiriyor ve modelleme için uygun olup olmadığına bakıyor. Uygunsa ses kütüphanesine ekliyor. Ondan sonra müşterileri beklemek gerekiyor. Çünkü buradan kazanılacak para, her satıştan belli bir komisyon şeklinde.
Kim Ses Satıyor?
Yapay zeka uygulamalarında kullanılmak üzere seslerini satan veya lisanslayan birkaç kişi var. Bazı örnekler şunları içerir:
Susan Bennett: Apple’ın Siri’sinin orijinal sesi olarak bilinen Susan Bennett, çeşitli proje ve uygulamalar için sesini lisansladı.
Morgan Freeman: Onun kendine özgü sesi GPS sistemlerinde ve diğer yapay zeka uygulamalarında kullanıldı.
Stephen Hawking: Vefat etmeden önce Stephen Hawking, yapay zeka uygulamalarında kullanılmak üzere kendi sesini temel alan sentetik bir ses oluşturmak için geliştiricilerle birlikte çalıştı.
Celine Dion: Sesini kamusal alanlardaki duyurular gibi yapay zeka uygulamalarında kullanmak üzere lisansladı.
Anthony Daniels: Star Wars filmlerinde C-3PO’yu canlandıran aktör, sesine çeşitli yapay zeka uygulamalarında kullanılmak üzere lisans verdi.
Tara Strong: Animasyon dizilerindeki çalışmalarıyla tanınan bir seslendirme sanatçısı, sesini yapay zeka uygulamalarında ve sanal asistanlarda kullanılmak üzere lisansladı.
Bunlar sadece birkaç örnek ve muhtemelen seslerini yapay zeka uygulamalarında kullanmak üzere lisanslayan birçok kişi daha var.
Ses Satmak Ne Tür Tehlikelere Yol Açar?
Bu işi profesyonel yapanlar yanında, normal insanlar da sesini satmak isteyebilir. Ama onları bekleyen tehlikeler var;
Kötüye Kullanım veya Yanlış Beyan: Sesin, derin sahte videolar veya ses kayıtları gibi yanıltıcı veya sahte içerik oluşturmak için kullanılma riski vardır.
Kontrol Kaybı: Bir ses satıldığında veya lisanslandığında, asıl sahibi sesin nasıl kullanıldığı veya nerede göründüğü konusunda sınırlı kontrole sahip olabilir ve bu da öngörülemeyen sonuçlara veya kötüye kullanıma yol açabilir.
Gizlilik Kaygıları: Ses, yapay zeka uygulamaları için sentetik bir ses oluşturmak için kullanılıyorsa, kişinin sesinin bu şekilde kullanılmasının mahremiyetle ilgili sonuçları hakkında endişeler olabilir.
Etik Hususlar: Özellikle sesin orijinal sahibinin, sesin nasıl kullanıldığı veya onları nasıl temsil ettiği üzerinde tam kontrole sahip olmadığı durumlarda, gerçek seslerden oluşturulan sentetik seslerin kullanımıyla ilgili etik hususlar vardır.
Yasal Sorunlar: Yapay zeka uygulamalarında kişinin sesinin kullanımına ilişkin fikri mülkiyet hakları veya lisans anlaşmaları gibi yasal sorunlar olabilir.
Seslerini yapay zeka kullanımı için satmayı veya lisanslamayı düşünen bireylerin, bu potansiyel riskleri dikkatli bir şekilde değerlendirmeleri ve kararlarının sonuçlarını tam olarak anladıklarından emin olmak için gerekirse yasal tavsiye almaları önemlidir.
Burada bir örnek sunalım; Geçtiğimiz ay Hong Kong’daki bir şirketin mali yöneticisi, 3 dolandırıcının taklit ettiği şirket yöneticilerinin Deep Fake görüntüsü tarafından kandırıldı. Buradaki önemli bir bileşen de sesti tabii ki. Siz bir mali işler yöneticisi olmasanız bile, sesiniz bir dolandırıcılıkta kullanılabilir ya da bizzat sizin sesinizi taklit eden bir kişinin bankanızı arayıp, oradaki temsilciyi ikna ettiğini hayal edin. Uzak bir hayal mi? Kesinlikle değil. Önümüzde bizi bu dolandırıcılık türü bekliyor.



Kaynak : 