Facebook’un ana şirketi Meta tarafından geliştirilen ve yalnızca yetkili araştırmacıların erişmesi amaçlanan bir dizi gelişmiş büyük dil modeli, geçen cuma günü indirilebilir hale getirildi. Bu tür şimdiye kadarki en güçlü yapay zeka modeli olarak halka sunuldu ve teknolojinin kötüye kullanım olasılığını artırdığı yorumu yapılıyor.
Facebook, LLaMA adı verilen modeli ilk olarak geçen ay kullanıma sundu. Bunu yapay zeka araştırmalarına erişimi daha da demokratikleştirme çabası olarak tanımladı. Şirket modeli, kullanıcıların istedikleri amaç için modelde ince ayar yapmalarına izin verecek şekilde tamamen kullanılabilir hale getirdi. Ancak durumdan duruma değişecek şekilde, yalnızca belirli araştırmacılar tarafından kullanılabilecek.
Modeli indirmek için bir bağlantı 4chan’a gönderildi ve internette hızla yayıldı. Model artık çeşitli torrentler aracılığıyla kolayca indirilebilir. Facebook Research GitHub’da bir torrent bağlantısı kullanılmasını istiyor.
Bir Meta sözcüsü, şirketin LLaMA gibi Yapay Zeka modellerini, değerlendirmelerine yardımcı olmak için araştırmacılarla paylaşmayı hedeflediğini söyledi. Sözcü, “Modele herkes erişemezken ve bazıları onay sürecini atlatmaya çalışsa da, mevcut sürüm stratejisinin sorumluluk ve açıklığı dengelememize izin verdiğine inanıyoruz” dedi.
Herkes alamıyor ama halka açıklanmasıyla birlikte, LLaMA şu anda halka açık en güçlü büyük dil modeli olarak tanımlanıyor. İleri düzey kullanıcılar tarafından muhtemelen kötüye kullanılabilecek bir model yorumu da var. İstenmeyen ve belki de zararlı görevleri gerçekleştirmek için LLaMA’ya ince ayar yapmak, makul miktarda teknik beceri gerektiriyor. Bu modeli spam, pazarlama materyali veya dezenformasyon oluşturmak için kullanmak son derece mümkün görülüyor.
Brookings Enstitüsü’nde Yapay Zeka ve Gelişmekte Olan Teknoloji Girişimi’ni yöneten Chris Meserole şöyle yorumluyor :
“LLaMa yayını, büyük dil modellerinde artan bir zorluğun yani şeffaflığın altını çiziyor. Risklerin ne olduğunu anlayabileceğimiz kadar açık olmalarını, ancak bu risklerden kolayca yararlanılabilecek kadar da açık olmamalarını istiyoruz.
Meta, kayıtlı araştırmacılara erişimi açarken genel olarak halka sınırlandırarak daha iyi bir denge kurmaya çalıştı. Ama şimdi en kötü yerde: model genel olarak halka kapalı, ancak onu arayan her kötü niyetli aktör için erişilebilir durumda.”
LLaMA içerdikleri parametre miktarına göre farklılık gösteren dört farklı modelden oluşuyor. Dil modelleri büyüdükçe, bu ilişki mükemmel olmasa da, genellikle daha karmaşık hale geliyor. LLaMA’nın, 7, 13, 33 ve 65 milyar parametreli sürümleri mevcut. Kıyaslama testlerinde LLaMA, OpenAI’nin GPT-3’ü, DeepMind’in Chinchilla 70B ve Google’ın PaLM 540B’si gibi geliştirilen çok daha büyük modellerle daha iyi veya eşit performans gösteriyor.
LLaMA’nın yeteneklerinin bir örneğinde, yapay zeka araştırmacısı Shawn Presser, modelin Star Trek karakterlerini taklit etme konusundaki esrarengiz yeteneğinin örneklerini yayınlıyor. Modeli daha hain bir kullanıma doğru çevirmek, ister patlayıcıların nasıl inşa edileceğine dair talimatlar almaya ister kötü amaçlı yazılım yazmaya çalışın, yalnızca artık Meta’nın kontrolünden kaçan teknolojisine ince ayar yapma meselesidir.
LLaMA’nın piyasaya sürülmesi aynı zamanda araştırma ve yeniliği teşvik edebilir, ancak yapay zeka politika uzmanlarına göre modelin halka açıklanması endişe verici bir gelişmeyi temsil ediyor.
Büyük dil modelleri son yıllarda hızla gelişirken ve bu süreçte halkın hayal gücünü ele geçirirken, bu teknolojinin nasıl kontrol edileceği ve tehlikelerinin nasıl ele alınacağı konusundaki düşünceler hıza yetişemiyor. OpenAI gibi şirketler, büyük dil modellerinin neden olduğu riskleri azaltmak için adına “açık” lakabını bıraktılar ve çevrimiçi bir portal veya API aracılığıyla ChatGPT gibi araçlarına erişimi giderek daha fazla kısıtladılar.
Yapay zeka modellerinin göreceli açıklığı, sektörde bir parlama noktası haline geldi ve Facebook’un LLaMA’yı oldukça geniş bir şekilde onaylı araştırmacılara yayınlama konusundaki düşüncesi, açık erişim araştırması lehine bir darbe vurmayı ve güçlü dil modellerini aşağı yukarı herkesin kullanımına sunmayı amaçlıyordu.Yani eEndüstri liderleri olan OpenAI, Google ve Microsoft gibi şirketlerle ilişkileri olan ayrıcalıklı araştırmacılar yerine herkese.



Kaynak : 