Ortaya çıkan tüm yeni teknolojiler, biraz satıcısı, biraz da yeniliğin verdiği heyecanla kullanıcısı tarafından hep abartılır. Metaverse’de arsa kapmaya çalışanları, NFT’lere tonlarca para dökenleri hatırlatalım.
Şimdi Yapay Zeka’nın da yavaş yavaş pulları dökülüyor gibi gözüküyor. Geçen hafta OpenAI’dan bir grup yapay zekacının, GPT-5’in, çözümü henüz bulunmamış bir grup matematik problemini çözdüğüne dair Tweet’i ve arkasından da bu mesajı geri çekmeleri dikkatlerden kaçmadı.
Teknoloji analisti ve yapay zeka eleştirmeni Gary Marcus, OpenAI’ın yapay zeka grubunun/fikrinin yapay zeka aracılığıyla çok sayıda matematik problemini (Erdos tipi) çözdüğünü iddia etmesini, ancak daha sonra iddiasını geri çekmesini veya geri çekmesini eleştiren “Erdosgate” başlıklı bir Substack yazısı yazdı.
Marcus şöyle yazdı :
“Daha önce, GPT-4’ün “makul bir şekilde yapay genel zeka (AGI) sisteminin erken (ancak hala eksik) bir versiyonu olarak görülebileceğini” iddia eden ve çok okunan Yapay Genel Zeka Kıvılcımları makalesinin ilk yazarı olan OpenAI’den Sebastien Bubeck geçen Cuma günü BÜYÜK bir iddiada bulundu:”

Yani özetle Gary Marcus, Erdosgate adını verdiği (matematikçi Paul Erdos’un çözülmemiş çok sayıda problemine verilen isim olan Erdos ile “-gate” (skandal eki) birleştirmiş) “Erdos tarzı henüz çözülmemiş matematik problemlerini çözmeye yönelik abartılı bir iddia”ya işaret ederek, Yapay Zeka’nın iddia edilen noktada olmadığına işaret ediyor. Çünkü yine Marcus’un belirttiğine göre, problemler aslında çözülememişti. Şöyle devam etti :
“Henüz çözülmemiş olan bir sürü Erdös problemini (ünlü bir matematiksel varsayımlar kümesi) çözmek gerçekten büyük bir iş olurdu. Bu nedenle çok sayıda kişi heyecanlandı; Sebatien’in X’teki paylaşımını 100.000 kişi gördü.
Ne yazık ki, “bir çözüm bulmak” insanların sandığı gibi bir anlam ifade etmiyordu. İnsanlar, sistemin “açık sorunlara” özgün çözümler bulduğunu sanıyordu. Aslında olan tek şey, GPT-5’in (biraz basitleştirerek) halihazırda çözülmüş sorunların çözümlerini bulmak için internette gezinmesiydi.
Saatler içinde matematik ve yapay zeka toplulukları ayaklandı.
Ertesi gün Bubeck geri adım atmaya çalıştı, orijinal tweet’i sildi ve yanlış anlaşıldığını iddia etti.
Umarım tüm bunlar bir tür öğretici an olarak görülür. Bazı insanlar (suçlunun adını vermeyeceğim) Bubeck’in sözüne inanmak konusunda son derece hızlı davrandılar. Peki neden? İddia gerçek olsaydı, olağanüstü olurdu. Bu nedenle dikkatle incelenmeliydi. İnsanların inanmak istediklerine inandıkları anlaşılıyor.Tüm bunlar bana kötü bir deja vu yaşattı; 2019’da OpenAI, Rubik küpünü “çözen” bir robota sahip olduğunu iddia etmişti. Bu, onlarla olan ilişkimin sonunun başlangıcıydı, çünkü araştırdığımda, bir tweet’te özetlediğim gibi, “çözüm” iddiasının oldukça yanıltıcı olduğunu gördüm ve yanıltıcı sunumlarını düzeltmeyi reddettiler. Bazı şeyler hiç değişmiyor.”

Yapay Zeka Abartılı Sunuluyor
Marcus’un eleştirdiği konu; yapay zeka topluluğunun (ve yatırımcılar/medya), kanıt talep etmeden iddiayı benimsemek için acele ettiği şeklinde. Bu olay, bazıları tarafından, özellikle “zor matematik” veya “genel zeka” çözme iddiaları etrafında, yapay zekada titiz doğrulamanın önemi konusunda öğretici bir an olarak konumlandırılıyor.
Açık matematiksel problemleri çözmek genellikle “süper yapay zeka (AGI)” için bir ölçüt olarak kullanılır. Aşırı iddialarda bulunmak, hem grubun hem de alanın güvenilirliğine zarar verir. Bir yazar (Doug Kass), bunu Nvidia gibi firmalar için bir kırmızı bayrak olarak işaretledi ve çığır açan gelişmeler abartılıysa, bunlara bağlı değerlemelerin veya stratejilerin kırılgan olabileceğini öne sürdü.
İddianın hızla yayılması ve ardından geri çekilmesi, yapay zeka haberlerinin kanıtların önüne nasıl geçebileceğini gösteriyor. Birisi “Yapay zeka ile X tane zor matematik problemini çözdük” dediğinde, emsal değerlendirmesi, tekrarlanabilirlik ve veri setinin/yöntemlerinin açıklanması hakkında sorular gündeme geliyor.
İddiayı tam olarak kim ortaya attı? Kimliği veya grubu kamuoyuna yapılan yorumlarda tam olarak açıklanmadı (Marcus yazısında biraz anonimleştirilmiş).





Kaynak : 