OpenAI, insanların alışverişten restoran rezervasyonlarına kadar çeşitli görevleri yerine getirebilmesine olanak tanıyan yeni yapay zeka aracı Operator’i tanıttı.
Şirketin 23 Ocak Perşembe günü gerçekleştirdiği sunumda, Operator adlı bu aracın sadece yol göstermenin ötesine geçerek kullanıcıların ekrandaki tuşlarla etkileşimde bulunduğu ve arama çubuğuna yazılar yazıp formları doldurabildiği belirtildi.
Bu bölüm, konuyla ilgili referans noktalarını içerir. (Related Nodes field)
Şu anda yalnızca ABD’deki ChatGPT Pro üyeleri için erişilebilir olan bu araç, OpenAI’nin diğer ülkelere ve Plus, Team ve Enterprise kullanıcılarına da sunulması planlanıyor; ancak bu konuda kesin bir tarih açıklanmadı.
OpenAI CEO’su Sam Altman, konuyla ilgili yaptığı açıklamada, “Avrupa’ya gelmesi maalesef biraz zaman alacak” şeklinde ifadelerde bulundu.
Altman, bu yılın başlarında yayınladığı bir blog yazısında yapay zeka aracılarının (AI Agent) 2025 yılı itibarıyla “iş gücüne katılabileceğini” öngörmüştü. Yapay zeka aracıları, kendi başlarına görevleri yerine getirme yeteneğine sahip modelleri ifade ediyor.
Kısa süre önce piyasaya sürülen Operator, Altman’ın öngördüğü geleceğin habercisi olma niteliği taşıyor.
1) Nasıl çalışıyor?
Operator, OpenAI’ın Bilgisayar Kullanan Aracı (Computer-Using Agent / CUA) olarak adlandırdığı yeni yapay zeka modeliyle işlev görüyor.
Kendisine verilen bir görevi yerine getirirken ekran görüntüsü alıyor ve GPT-4o’nun görsel yeteneklerinden yararlanarak bu görüntüyü analiz ediyor. Daha sonra ne yapması gerektiğine karar verip bilgisayar ekranında işlemlere başlıyor.
CUA’nin en önemli özelliği, uygulama programlama arayüzü (API) yerine kullanıcıların karşıladığı arayüzle etkileşim kurması için eğitilmesidir. Bu durumun avantajı, kullanıcılara ekrandaki tuşlara basarak ve arama yaparak işlemlerini gerçekleştirme imkanı sunmasıdır.
OpenAI ekibinden Reiichiro Nakano, “Modellerin yazılım kullanma şekli genellikle özel API’lar üzerinden oluyor. Ancak insanların günlük olarak kullandığı arayüzlerin aynısını kullanabilen bir model yaratınca, daha önce erişim sağlanamayan yepyeni bir yazılım yelpazesi açılmış oluyor” dedi.
2) Neler yapabiliyor?
OpenAI, şu anda Operator’ın “araştırma önizlemesi” versiyonunu kullanıma sunduğunu ve kullanıcı geri bildirimleri ile aracın gelişeceğini belirtti.
Operator, ChatGPT ve diğer yapay zeka sohbet botları gibi geniş bir bilgi kümesiyle eğitildi. Ayrıca bunu desteklemek için insanların internet sitelerini nasıl kullandıklarını gösteren görüntüler kullanıldı.
Kullanıcılar operator.chatgpt.com (Türkiye’de henüz kullanılmıyor) adresinden sisteme bir görev yazıyor ve Operator, tarayıcıda belirttiği işi kendisi yapabiliyor. Örneğin, bir yemek tarifini bulup gerekli malzemeleri alışveriş sepetine ekleyebilir ya da belirli bir bölgede bulunan restoranlar için rezervasyon yapabilir.
OpenAI araştırmacısı Yash Kumar, “Tıpkı bizim yaptığımız gibi internet sitelerinde gezinebilir ve işlem yapabilir” diye belirtti.
Kullanıcılar, Operator’ın işleyişini gerçek zamanlı olarak takip edebilir ve araç, gerçekleştirdiği işlemleri küçük bir pencere aracılığıyla gösterir.
Ayrıca, kullanıcı isterse veya aracın bir hata yapması durumunda müdahalede bulunabilir. Sipariş vermek veya bir e-posta göndermek gibi kritik işlemler öncesinde kullanıcıdan onay alması da gerekmektedir.
Kumar, “Yardıma ihtiyaç duyarsa, size soruyor ve siz de yanıt verebiliy
0 Comments