Yapay zeka antik metinleri okuyabiliyor. Yanmış Roma parşömenlerini çözmekten, parçalanmış çivi yazısı tabletlerini okumaya kadar, çok çeşitli metinlerin çözülebilir hale gelmesi, araştırmacılara yüzyıllardır sahip olduklarından daha fazla veri sağlayabilir.
Ekim 2023’te Federica Nicolardi’nin telefonuna, araştırmasını sonsuza dek değiştirecek bir görüntü içeren bir e-posta geldi. MS 79’da Vezüv Yanardağı’nın patlamasında yanmış bir papirüs tomarının bir parçasını gösteriyordu. Kavrulmuş tomar, on sekizinci yüzyılda İtalya’nın Pompeii yakınlarındaki Herculeaneum’daki lüks bir Roma villasının kalıntılarında keşfedilen yüzlercesinden biriydi. Yüzyıllar boyunca tomarların kırılgan, karbonize katmanlarını ayırma girişimleri birçoğunu parçalara ayırdı ve bilim insanları geri kalanının asla açılamayacağını kabul etmek zorunda kaldılar.
İtalya’daki Napoli Üniversitesi’nde papirüs uzmanı olan Nicolardi, okunamayanı okumak için yapay zeka (YZ) kullanma projesine dahil edilmişti. Şimdi son sonuçlar gelmişti. Görüntüde, daha koyu bir arka plana karşı parlak bir şekilde parlayan, düzgün Yunanca harflerle dolu bir papirüs şeridi görülüyordu. Yazı açıkça okunabiliyordu, birkaç satır derinliğindeydi ve neredeyse beş sütuna yayılmıştı. 2.000 yıl sonra daha önce tamamen erişilemez olan bir metnin tüm satırları okunabiliyordu.
Vesuvius Challenge adlı bu proje, bankacılıktan tıbbi araştırmalara kadar modern yaşamın her alanında devrim yaratan gelişmiş yapay zekanın antik dünyayı nasıl gördüğümüzü yeniden şekillendirmeye hazır olduğunun sadece bir örneği. Yapay sinir ağları, Yunanca ve Latince’nin klasik destekçilerinden Çin’in Oracle Bone Script’ine, sığır kemikleri ve kaplumbağa kabukları üzerine yazılmış antik kehanet metinlerine kadar antik metinleri çözmek için kullanılıyor. İnsanların okuyamayacağı kadar geniş arşivleri anlamlandırıyor, eksik ve okunamayan karakterleri dolduruyor ve neredeyse hiçbir izi kalmayan nadir ve kayıp dilleri çözüyorlar.
Yapay zeka araçları daha fazla dili tanıyabildiği ve herhangi bir kişinin bilebileceğinden daha fazla bilgi depolayabildiği ve metinlerdeki istatistiksel kalıpları kendileri keşfedebildiği için, bu teknolojiler antik kaynakları keşfetmek için temelde yeni bir yol vaat ediyor. Nicolardi, bunun “sadece cevaplamak istediğimiz soruları değil”, “sorabileceğimiz soruları da” dönüştürebileceğini söylüyor.
Antik metinlerin yeniden yapılandırılması
Bilgisayarlar, dijitalleştirilmiş metinleri kategorize etmek ve analiz etmek için onlarca yıldır kullanılıyor. Ancak şu anki heyecan, birbirine bağlı düğümlerin hiyerarşik katmanlarından oluşan sinir ağlarının ve özellikle birden fazla dahili katmana sahip ‘derin’ sinir ağlarının kullanımından geliyor.
Derin öğrenmeyi antik metinlere uygulama girişimleri, 2010’larda, papirüs veya palmiye yaprakları üzerindeki metinlerin dijital fotoğraflarına dayanıyordu. Görsel sinirbilimden esinlenen evrişimli sinir ağları (CNN’ler) adı verilen modeller, görüntülerden ızgara benzeri veriler yakalayabilir. Optik karakter tanıma için kullanılırlar, ancak başka uygulamalar da vardır: Oracle Bone Script’i inceleyen Çinli ekipler, bu tür modelleri aşınmış harflerin görüntülerini doldurmak, karakterlerin zaman içinde nasıl evrimleştiğini analiz etmek ve kırık parçaları bir araya getirmek için kullandılar. Bu arada, doğrusal düzenin önemli olduğu veri dizilerini ele almak üzere tasarlanan yinelemeli sinir ağları (RNN’ler), daha önce yazıya geçirilmiş metinlerdeki boşlukları aramak, çevirmek ve doldurmak için büyük bir potansiyel göstermeye başladı. Örneğin, antik Babil’den yüzlerce formülsel idari ve yasal metindeki eksik karakterleri önermek için kullanıldılar.
Herculaneum tomarının ilk bölümleri ortaya çıkarıldı
Sinir ağları, sıkıcı görevleri hızlandırmanın ötesine geçip, insan uzmanların yapamadığı bağlantıları kurabilir mi? Yapay zekanın potansiyelini gösteren ilk büyük proje, 2017 yılında İngiltere’deki Oxford Üniversitesi’nde Thea Sommerschield’in antik tarih alanında ve Yannis Assael’in bilgisayar bilimleri alanında doktora yaptığı bir iş birliği olarak hayata geçti. Sommerschield, Sicilya’daki Yunan yazıtlarını çözmeye çalışıyordu ve Assael’e bununla ilgili zorlukları şöyle aktardı :
“Okunması çok karmaşık, kötü korunmuşlar, bazı kısımları eksik. Nereden geldiklerinden veya tarihlerinin ne olduğundan gerçekten emin değiliz; ilginç lehçe karışımları var.”
Klasikçiler yeni kaynakları benzer mevcut metinler hakkındaki bilgilerini kullanarak yorumlarlar. Genellikle belirli bir zaman ve mekandaki eserler konusunda uzmandırlar; bir kişinin yeni bir metinle potansiyel olarak alakalı tüm kaynaklara hakim olması mümkün değildir.
Araştırmacılar başlangıçta MÖ yedinci yüzyıl ile MS beşinci yüzyıl arasında yazılmış on binlerce Yunan yazıtı üzerinde Pythia adlı RNN tabanlı bir modeli eğittiler . Daha sonra modele daha önce görmediği metinleri gösterdiler ve eksik kelimeleri veya karakterleri önermesini istediler.
Şu anda İngiltere’deki Nottingham Üniversitesi’nde bulunan Sommerschield, Assael ve danışmanı Jonathan Prag ile birlikte modeli ilk kez çalıştırdığı ve restorasyonun ekranda karakter karakter belirdiğini gördüğü anı hâlâ hatırlıyor. Bu daha önce hiç mümkün olmamıştı :
“Bir film sahnesi gibiydi. Gerçekten çenelerimizin yere çarptığını hissettik.”
2022’de, bilinmeyen bir metnin kökeninin tarihi ve yeri için de önerilerde bulunan Ithaca adlı bir modelle devam ettiler. Bu sefer araştırmacılar, bir RNN’nin yakalayabildiğinden daha karmaşık dil kalıplarını yakalayan ve karakterler veya kelimeler gibi bir girdinin farklı özelliklerini paralel olarak analiz ederek bunları bağlama göre ağırlıklandıran dönüştürücü model adı verilen makine öğrenimindeki bir atılımdan yararlandılar. (OpenAI’nin ChatGPT’si ve Anthropic’in Claude’u gibi popüler sohbet robotları dönüştürücü modellere dayanmaktadır.)
Sommerschield, ekibin amacının araştırmacıların daha etkili bir şekilde çalışmasına yardımcı olacak araçlar tasarlamak olduğunu söylüyor: Sinir ağı, geniş bir arşivdeki bağlantıları araştırıyor ve insan, uzman anlayışını getiriyor. Assael, “İnsan, tasarımımızın merkezinde” diyor. Ithaca, testlerde antik metinlerdeki yapay olarak oluşturulmuş boşlukları %62 doğrulukla onardı; insan uzmanların ise bu oranı %25. Ancak Ithaca’nın önerilerinden yararlanan uzmanlar, boşlukları %72 doğrulukla doldurarak hepsinden daha iyi sonuçlar elde etti. Ithaca ayrıca yazıtların coğrafi kökenlerini %71 doğrulukla belirledi ve bunları kabul edilen tahminlerden 30 yıl sonrasına tarihlendirdi.
Yaratıcılarına göre Ithaca çevrimiçi olarak ücretsiz olarak erişilebilir ve haftada yüzlerce sorgu alıyor. Yazarlar bunu kabul etmeyi seçmediği sürece araştırmaya ne zaman katkıda bulunduğunu bilmek mümkün değil diyor Sommerschield, ancak şu ana kadar bildirilen örnekler arasında Atina siyasi kararnamelerinin yeniden tarihlendirilmesi ve kuzeybatı Yunanistan’daki Dodona Kahini’ne sorulan soruları içeren MÖ 4. yüzyıldan kalma tabletlerin incelenmesi yer alıyor.
Antik Metinlere Ulaşım Kolaylaştı
Bu arada Güney Koreli araştırmacılar, dünyanın en büyük tarih arşivlerinden biriyle uğraşırken çok farklı zorluklarla karşı karşıya kalıyorlar: 14. yüzyıldan 20. yüzyılın başına kadar uzanan 27 Kore kralının saltanatlarını kapsayan yüz binlerce makalenin yer aldığı ayrıntılı günlük kayıtları incelemek.
New York City’deki New York Üniversitesi’nde önde gelen bir makine çeviri araştırmacısı olan Kyunghyun Cho, “Veri miktarı çok büyük” diyor. Cho genellikle modern dillerle çalışıyor, ancak emekli bir Kore edebiyatı profesörü olan babasıyla konuştuktan sonra arşivlerle ilgilenmeye başladı. Bu kayıtlar eksiksiz ve kökenleri biliniyor, ancak neredeyse hiç kimse bunları okuyamıyor. Modern Çince veya Korece’den farklı olan Çince karakterlere dayanan eski bir yazı sistemi olan Hanja ile yazılmışlar.
Hükümet çevirmenlerinden oluşan küçük bir ekip, metinleri modern Korece’ye manuel olarak çevirmek için çalışıyor, ancak görevin tamamlanmasının onlarca yıl sürmesi muhtemel. Seul’deki Sungkyunkwan Üniversitesi’nden JinYeong Bak da dahil olmak üzere Güney Kore’deki meslektaşlarıyla çalışan Cho, kayıtları otomatik olarak çevirmek için dönüştürücü tabanlı bir ağ eğitti.
Böyle bir modeli eğitmek için henüz yeterli materyal modern Korece’ye çevrilmediğinden, ekip Hanja’yı, onlarca yıl önce arkaik Korece’ye yapılmış çevirileri ve hem Korece hem de İngilizce’ye yapılan sınırlı sayıdaki modern çeviriyi kullanarak çok dilli bir yaklaşım benimsedi. İnsan uzmanlar, devlet ziyaretleri, hainlerin cezalandırılması ve müzik konserleri gibi olayların açıklamalarını içeren yapay zeka çevirilerini, arkaik çevirilerden önemli ölçüde daha doğru ve okunabilir, hatta bazı durumlarda modern çeviriden daha iyi olarak derecelendirdi.
Ölçeğin diğer ucunda, araştırmacılar yalnızca az miktarda metnin hayatta kaldığı antik dilleri ele almak için sinir ağlarını kullanıyorlar. Bu durumlarda dönüştürücü modeller her zaman kullanılamaz çünkü büyük miktarda eğitim materyali gerektirirler. Örneğin, Yunanistan’daki Patras Üniversitesi’nden Katerina Papavassileiou ve meslektaşları, MÖ 2. bin yılda Linear B adı verilen bir yazıyla yazılmış koyun sürülerinin anlatıldığı Girit, Knossos’tan 1.100 Miken tabletinden eksik metni geri yüklemek için bir RNN kullandılar. Yapay olarak üretilen boşlukların olduğu testlerde, modelin ilk on tahmini %72 oranında doğru cevabı içeriyordu ve gerçek dünya vakalarında genellikle insan uzmanların önerileriyle uyuşuyordu. Sonuçları daha da iyileştirmek için Papavassileiou, yalnızca çevrilmiş metne güvenmek yerine eksik harf izleri gibi görsel veriler eklemeyi umuyor. Ayrıca, modelin bir dizi tabletten öğrenilen dersleri diğerine uyguladığı ‘transfer öğrenmesi’ni de araştırıyor.
Papavassilieou, bir gün Minos uygarlığı tarafından kullanılan ve Linear B ile birçok sembolü paylaşan ancak hiçbir zaman çözülememiş bir yazı olan Linear A’yı ele almak için Linear B üzerinde eğitilmiş modelleri kullanmayı umuyor.
Okunamayanı çözmek
Belki de yapay zekanın devasa zorlukları çözme gücünün nihai kanıtı, Herculaneum parşömenlerini inceleyen araştırmacıların başarısıdır. Assael, “Bence en şaşırtıcı işlerden bazılarını yapıyorlar,” diyor. Lexington’daki Kentucky Üniversitesi’ndeki bilgisayar bilimci Brent Seales ve meslektaşları, Vesuvius Challenge katılımcılarının yardımıyla, hiç görülemeyen metni okuma gibi görünüşte imkansız bir görevi üstleniyorlar.
Herculaneum tomarlarını okumak iki büyük sorunun üstesinden gelmeyi gerektirir. Birincisi, kırılgan tomarlar açılamıyor. İçlerini görmek için Seales, bir tomarın iç yapısının yüksek çözünürlüklü bilgisayarlı tomografi (BT) taramalarını almayı, kesitin her karesinde görünen yüzeyleri elle titizlikle haritalamayı ve ardından yüzeyleri düz bir görüntüye açmak için algoritmalar kullanmayı içeren ‘sanal açma’ teknolojisini geliştirmek için yıllar harcadı. 2015 yılında araştırmacılar bu tekniği, İsrail’deki En-Gedi’den, MS 3. yüzyıla tarihlenen, kömürleşmiş, açılmamış bir tomarın içinden tam metni okumak için kullandılar ve bunun İncil’deki Levililer Kitabı 11’den olduğu ortaya çıktı .
En-Gedi parşömeninin beş sarımı vardır; Herculaneum parşömenlerinin her biri ipek kadar ince yüzlerce tur içerir. Bu nedenle, son derece yüksek çözünürlüklü BT verilerini yakalamak için ekip parşömenlerin birkaçını Oxford yakınlarındaki Diamond Light Source parçacık hızlandırıcısına taşıdı. Ancak En-Gedi parşömeninin ve diğer sonraki çalışmaların mürekkebi BT taramalarında parlak bir şekilde parlayan demir içerme eğilimindeyken, Herculaneum yazıcıları, üzerinde oturduğu papirüsle aynı yoğunluğa sahip olduğu için taramalarda görünmeyen karbon bazlı mürekkep kullandılar. Seales ve ekibi, mürekkebi doğrudan göremeseler de şeklini tespit edebileceklerini fark ettiler. Çıplak papirüs liflerinin yüzey dokusunda mürekkep kaplı olanlarla karşılaştırıldığında ince bir fark varsa, belki de farkı tespit etmek için bir sinir ağını eğitebilirlerdi.
Seales’in küçük ekibi için bu çok fazla işti, bu yüzden Mart 2023’te Silikon Vadisi girişimcisi Nat Friedman ile büyük nakit ödüller sunan Vesuvius Challenge’ı başlatmak için bir araya geldiler. Seales ve meslektaşları, kaydırma yüzeylerinin düzleştirilmiş görüntülerini yayınladılar ve yarışmacılardan mürekkebi bulmak için sinir ağlarını eğitmelerini istediler. 1.000’den fazla takım yarıştı ve her gün yüzlerce kişi yarışmanın Discord kanalında ilerlemeyi tartıştı. Şubat 2024’te büyük ödül verildi: Bilgisayar bilimi öğrencileri Youssef Nader, Luke Farritor ve Julian Schilliger, 16 sütunluk açıkça okunabilir metin ürettikleri için birlikte 700.000 ABD doları aldılar.
Kazanan takım, genellikle videolar için kullanılan ve mekansal ve zamansal boyutlara ayrı ayrı bakan transformatör modelinin daha yeni bir çeşidi olan TimeSformer’ı kullandı. Vesuvius takımı bunu papirüsün derinlik boyutunu yüzeyinin görünümünden ayırmak için kullandı. Nicolardi ve meslektaşları daha sonra ortaya çıkan metnin, muhtemelen Epikürcü filozof Philodemus’a ait, müzik, haz ve duyum üzerine daha önce bilinmeyen bir Yunan felsefesi eserinden olduğunu tespit etti. Üzerinde çalışmanın “büyüleyici” olduğunu söylüyor.
O zamandan beri yarışmacılar papirüs uzmanlarının yardımıyla mürekkep algılama algoritmalarını geliştirmek için çalışıyorlar. Bu arada Seales’in ekibi daha fazla parşömen tarıyor ve makine öğreniminin sanal açma adımını hızlandırabileceğini umuyor. Şu anda yarışmacıların çalışmak zorunda olduğu verileri sınırlayan darboğazın bu olduğunu söylüyor. Yapay zeka destekli açmanın, dört parşömenin %90’ını okuyan birinin 2024 Büyük Ödülü olan 200.000$’ı kazanması için zamanında kullanılabilir olacağı konusunda iyimser. Seales açma hakkında “Bir kere otomatikleştirdiğinizde, temelde ölçeklendirebilirsiniz. Biz de bunun eşiğindeyiz” diyor.
Aslında Seales tüm kütüphaneyi okumak istiyor. Herculaneum’dan yüzlerce açılmamış parşömen koleksiyonlarda tutuluyor – çoğunlukla Napoli’de, ama ayrıca Paris, Londra ve Oxford’da da. “Bu papirüs bilimcileri için antik dünyadan bir asırdır gördüklerinden daha fazla yeni metin olacak,” diyor.
Yöntem ayrıca, Seales’in “görünmez kütüphane” dediği, erişilemeyen diğer kaynakları da açıyor. Bunlar arasında, “burada olan ve fiziksel nesneyi tuttuğumuz, ancak yazısını okuyamadığımız” ortaçağ kitap ciltlerinin veya antik Mısır mumya sargılarının içine gizlenmiş metinler yer alıyor. Ekip, Washington DC’deki Smithsonian müzesinde tutulan açılmamış bir Mısır parşömeninden veri elde etti ve Ürdün’ün Petra kentinden, MS yedinci yüzyılda bir yangında yakılan papirüsleri analiz etmek için görüşmelerde bulunuyor .
Dahası, bazı arkeologlar Herculaneum villasının kütüphanesinin çoğunun hala yer altında olduğunu düşünüyor. Eğer bu bir gün kazılırsa, binlerce parşömen daha ortaya çıkabilir. Seales, bunların hepsini okumanın “antik dünyadan insanlık tarihinin en büyük keşfi” olacağını söylüyor. “Şimdi teknolojimiz var.”



Kaynak : 