OpenAI, kullanıcılar için web üzerinde görevler gerçekleştirmek üzere tasarlanmış Yapay zeka aracı “Operator”ün bir “araştırma önizlemesini” tanıttı. Operator, GPT-4o’nun görme yeteneklerini takviyeli öğrenme yoluyla gelişmiş akıl yürütmeyle birleştiren bir model kullanıyor ve yazarak, tıklayarak ve kaydırarak web sayfalarıyla etkileşime girmesini sağlıyor. Operator, ilk olarak ABD’deki OpenAI’nin aylık 200$ ChatGPT Pro katmanı aboneleri için kullanılabiliyor.
Operator, restoran rezervasyonu yapma, market alışverişi yapma ve masraf raporları dosyalama gibi görevleri otonom olarak halledebiliyor. Kendi tarayıcısı aracılığıyla çalışıyor ve özel API entegrasyonları gerektirmeden web sayfalarında gezinmesine ve etkileşime girmesine olanak tanıyor. Araç, hassas bilgi istekleri veya kritik eylemlerle karşılaştığında kendini düzeltmek ve kullanıcı müdahalesi istemek üzere tasarlanmış. OpenAI, Operator’ın yerleşik normlara saygı gösterirken gerçek dünya ihtiyaçlarını karşılamasını sağlamak için DoorDash, Instacart ve Uber gibi şirketlerle iş birliği yapıyor.
Operator’ün Sıkıntıları
OpenAI’nin Operator AI aracı “araştırma önizlemesi” aşamasında çeşitli zorlukları olduğu raporlanıyor. Özetle, bu aracın henüz gelişmekte olduğunu not edelim. Deneyenlerin raporlarına göre, hangi sorunları var bakalım;
- Karmaşık Arayüzler : Operator, karmaşık veya daha az standartlaştırılmış arayüzlerle etkileşim kurmakta zorlanıyor. Örneğin: Slayt gösterileri oluşturma: Sunumlar tasarlamak genellikle gelişmiş, bağlama duyarlı kararlar gerektiriyor. Ya da takvim arayüzleri, çakışmaları ele alma veya özel tercihleri yorumlama gibi konularda sorun olabiliyor.
- Dinamik veya Öngörülemeyen Web Ortamları : Web sayfaları genellikle sık sık düzenlerini değiştirir, özel betikler kullanır veya gelişmiş kullanıcı etkileşimine güvenir. Operator, bu tür dinamik veya standart dışı uygulamalarla uğraşırken zorluklarla karşılaşabilir.
- Hassas veya Yüksek Riskli Görevler
Operator, kritik veya hassas eylemler (örneğin, finansal işlemler veya kişisel bilgilerin paylaşılması) için kullanıcı müdahalesi istemek üzere tasarlanmış olsa da, bu durumların tanınmasındaki hatalar uygunsuz kararlara veya eylemlere yol açabilir. - Uç Durumlar ve Belirsizlik : Kullanıcı talimatlarındaki belirsizlik veya görev yürütmedeki uç durumlar beklenmeyen davranışlara yol açabilir. Örneğin, belirsiz komutları yanlış yorumlama. Web öğelerinin farklı davrandığı öngörülemeyen senaryoları ele alma.
- Performans ve Hız : Operatör bir tarayıcı üzerinden çalıştığı ve API’lere güvenmediği için etkileşim hızı ve yanıt verme hızı değişebiliyor. Karmaşık sitelerde gezinirken veya büyük miktarda veri işlerken gecikebiliyor.
- Ölçekleme ve Sağlamlık : Operatör daha fazla kullanıcıya genişledikçe, çeşitli kullanım durumları ve ortamlarda tutarlı performans sağlamak kritik öneme sahip olacaktır. Güvenilirliği korurken yeteneklerini ölçeklendirmek önemli bir teknik zorluktur.
- Etik ve Gizlilik Endişeleri : Otomasyonu etik hususlarla dengelemek önemli bir engeldir. Örneğin, operatörün gizlilik standartlarına uymasını sağlama ya da otonom yeteneklerinin kötüye kullanılmasını önleme.
- Kullanıcı Eğitimi ve Benimsemesi : Kullanıcıların Operator’ı etkili bir şekilde kullanabilmeleri için rehberliğe ihtiyaçları olabilir. Kullanıcıları yetenekleri, sınırlamaları ve uygun kullanım durumları hakkında eğitmek önemli bir benimseme zorluğudur.
OpenAI teknolojiyi geliştirdikçe ve Operator’ı hizmetlerine daha geniş bir şekilde entegre ettikçe bu zorlukların ele alınması çok önemli olacaktır. Özetle, Operator çeşitli görevleri otomatikleştirmede umut vadetse de, şu anda slayt gösterileri oluşturma veya takvimleri yönetme gibi karmaşık arayüzlerle ilgili zorluklarla karşı karşıya. OpenAI, Operator’a erişimi daha fazla kullanıcı katmanına genişletmeyi ve gelecekte yeteneklerini ChatGPT’ye entegre etmeyi planlıyor.



Kaynak : 