ChatGpt artık bizim için her şeyi yapabilir: nasıl çalışır ve Agent'ı en iyi nasıl kullanırız

OpenAI, kullanıcılar adına baştan sona karmaşık dijital görevleri gerçekleştirebilen yeni bir sohbet robotu özelliği olan Agent'ı kullanıma sundu. Agent, ücretli kullanıcılar için halihazırda mevcut olan derin arama ve Operatör modlarını, botun konuşma arayüzüyle daha derinlemesine entegre eden yeni ve özel bir modele dayanıyor.
OpenAI, yeni ajanın belirli bir komutla eğitilmesi gerektiğini ve ardından her şeyi kendi başına yaptığını söylüyor: İlgili bilgiler için web'de arama yapıyor ve kararlar almak ve e-ticaret ve yetkilendirme gerektiren platformlar da dahil olmak üzere harici hizmetlerde gelişmiş eylemler gerçekleştirmek için sanal bir bilgisayar kullanıyor.
ChatGpt aracısı nasıl çalışır?OpenAI, aracı web'e erişmek ve web ile etkileşim kurmak için çeşitli araçlarla donattı: grafiksel arayüzde gezinmeyi sağlayan görsel bir tarayıcı; daha basit aramalar için kullanılan bir metin tarayıcısı; ve daha ileri düzey kullanıcılar için bir terminal ve API'ye (programlama arayüzü) doğrudan erişim.
"Bağlayıcılar" özelliğini kullanarak, model Gmail veya Github gibi uygulamalara bağlanarak daha kesin bilgiler elde edebilir ve aramaları daraltabilir. Aracının tarayıcısını kontrol ederek kullanıcılar doğrudan harici sitelere de giriş yapabilirler.
Bu dijital araçlar sayesinde model, diğer sitelerden API'ler aracılığıyla bilgi toplayabilir, metin tarayıcısıyla büyük miktarda metni analiz edebilir veya fareyi otomatik olarak kontrol eden tarayıcı uzantılarına benzer şekilde, insan kullanıcılar için tasarlanmış web siteleriyle görsel olarak etkileşime girebilir.
OpenAI, riskli eylemler veya özel verilere erişim gerektiren eylemler gerçekleştirmeden önce, aracının kullanıcının onayını ve müdahalesini gerektirdiğini açıklıyor: Aksi takdirde, aracı, elektronik tablolar, metin dosyaları ve PowerPoint sunumları gibi belirli dosyaları oluşturarak bilgileri tamamen otonom bir şekilde toplayabilir, düzenleyebilir ve sunabilir.
Ne yapabilir?OpenAI, sohbet robotunun aracı modu kullanılarak neler yapılabileceğine dair birkaç pratik örnek sundu. Bir tanıtım videosunda, bir şirket mühendisi aracı kullanarak Indian Wells Açık Tenis Turnuvası için Palm Springs'e bir seyahat planı oluşturuyor.
Sistem, eşleşen tarihleri arıyor, ardından kullanıcının takvimine (bağlayıcı aracılığıyla) bağlanarak hangi taahhütlerin halihazırda mevcut olduğunu görüyor, ardından tarayıcıya geçerek San Francisco'dan olası uçuşları arıyor ve bir seyahat teklifi hazırlıyor.
Başka bir örnekte, temsilci San Francisco şehrinin bütçe verilerine dayalı bir elektronik tablo oluşturuyor; bir diğerinde ise Singapur'daki teknoloji şirketlerine finansal destek hakkında bir sunum hazırlıyor ve ofis müsaitliği hakkında bir rapor hazırlıyor. Tüm örneklerde, temsilci modunun kullanıcıya nasıl zaman kazandırdığı ve sistem onlar için çalışırken öğle yemeğine veya köpek gezdirmeye gitmelerine olanak tanıdığı vurgulanıyor: Arama ve dosyalar hazır olduğunda, uygulama aracılığıyla akıllı telefonlarına bir bildirim geliyor.
Örnekler, Agent'ın nasıl çalıştığını anlamak için kesinlikle ilgi çekici veya faydalı değil, ancak özellikle ABD merkezli görünüyorlar ve nispeten dar bir profesyonel kitleye yönelikler. Ancak OpenAI, Agent'ın basın ve pazarlama materyallerinde belirtilenlerden çok daha geniş bir uygulama yelpazesine hizmet edebileceğini garanti ediyor.
Halüsinasyon sorunuBunun böyle olduğundan şüphemiz yok, ancak bir sorun var: Hâlâ kaçınılmaz olan halüsinasyonlarla ne yapacağız? Bir örnekte, mühendis, aracı tarafından bir Excel dosyasında toplanan bütçe bilgilerinin "%98 doğru" olduğunu öne sürüyor.
Ancak daha fazla rehberlik olmadan, bu %2'nin ne kadar önemli olduğunu nasıl bilebiliriz? Müvekkil sunumundaki küçük bir hata bile işimize mal olabilir; daha ciddi durumlarda ise uyum sorunlarına ve yasal yaptırımlara yol açabilir.
Ve bir insanın aynı Excel dosyasını oluşturmasının birkaç saat süreceği ve hatta bazı hatalar yapabileceği doğru olsa da, bu dosyayı incelemek, hiçbir boşluk olmadığından emin olmak ve hatalı görünebilecek verileri inceleyip aramak OpenAI'nin varsaydığından çok daha uzun sürecektir.
Dijital bir hayat istiyorumKısacası, aracı mod, OpenAI'nin potansiyeli açısından kesinlikle etkileyici (ve endişe verici) bir adımdır; ancak büyük bir yenilik olarak kabul edilmesi, OpenAI'nin anlatısının büyük bir kısmının dayandığı varsayıma dayanmaktadır: şirketin muhteşem modelleri ve ilerlemelerinin muzdarip olmaya devam ettiği hatalar ve halüsinasyonlar basitçe göz ardı edilebilir.
Göz ardı edilmemesi gereken bir diğer husus ise, sistemin düzgün çalışması için gereken dijitalleşme düzeyidir. Sizin için durum böyle mi bilmiyorum ama arkadaşlarla akşam yemekleri veya aylar sonra dışarı çıkılan geceler de dahil olmak üzere hayatımızın her alanını otomatik olarak organize etmek için genellikle Google Takvim'i kullanmayız. Başka bir deyişle, bizim için bir seyahat acentesi, basit bir veri eksikliği nedeniyle yukarıdaki örnek promosyon gibi çalışamazdı.
Çözülmesi için tüm doğaçlama ve rastlantısallıktan vazgeçmeyi gerektiren bir boşluk: Avantajı, Amerikan bir şirketin kapalı kaynaklı bir botunun, bizim adımıza bir gezi organize etmek için harcayacağımız birkaç saati kurtarması. Bu arada, sıkılabilir, Instagram'da gezinebilir, hatta belki daha da çok çalışabiliriz.
Güvenlik sorunuOpenAI ayrıca, web tabanlı eylemleri doğrudan gerçek dünyada sonuçlar doğuracak şekilde otomatikleştirme yeteneği göz önüne alındığında, bunun bugüne kadar piyasaya sürülen en potansiyel olarak tehlikeli model olduğunu açıkça kabul ediyor. Bu nedenle şirket, uyum ve güvenlik sınırlarının çok katı olduğunu belirtiyor.
Temsilci, yüksek riskli görevler gerçekleştiremez, finansal işlemler gerçekleştiremez veya hukuki tavsiye veremez. Ayrıca, hızlı enjeksiyon (kötü amaçlı komutlarla sistem yönergelerinin "ele geçirilmesi") riskini en aza indirmek ve kötü amaçlı veya potansiyel olarak tehlikeli ve yasa dışı istekleri reddetmek üzere eğitilmiştir. Son olarak, e-posta gönderme gibi kritik adımlar, kullanıcının açık onayı olmadan asla otomatik olarak gerçekleşmez.
Chagpt Agent İtalya'ya ne zaman gelecek?Kullanıcılar, chatbot ile herhangi bir görüşme sırasında araç listesinden ilgili modu seçerek aracı etkinleştirebilirler. Sadece komutunuzu gönderin, gerisini aracı halledecektir. Sonuçlar anında gelmez: Derinlemesine arama işlevinde olduğu gibi, isteğin karmaşıklığına bağlı olarak biraz zaman, hatta bazen saatler alabilir. Sonuç daha sonra ek isteklerle daha da geliştirilebilir.
Agent şimdilik yalnızca ABD, Kanada ve Birleşik Krallık'ta Pro, Plus ve Team planlarındaki kullanıcılar için mevcut. Dağıtım bugün, 18 Temmuz'da başladı ve önümüzdeki birkaç gün boyunca devam edecek. Eğitim ve Kurumsal kullanıcılar güncellemeyi önümüzdeki haftalarda alacak. Model özellikle kaynak yoğun olduğundan, istekler sınırlı olacak: Pro kullanıcıları ayda 400 mesaja sahipken, diğerleri yalnızca 40 mesaja sahip olacak ve ek kredi satın alarak istek ekleme seçeneği olacak.
Operatör özelliği bir süre daha kullanılabilir kalacak ve ardından kullanımdan kaldırılacak. Agent özelliği henüz İtalya ve Avrupa'nın geri kalanında mevcut değil. Şirket "lansman takvimini tamamlıyor." Yeni modelin yaygınlığı ve bu kadar çok hassas bilgiye erişim potansiyeli göz önüne alındığında, OpenAI avukatlarının Avrupa gizlilik düzenlemelerine uyumu sağlamak için yapacak çok işi olduğunu düşünüyoruz.
ChatGpt temsilcisiyle toplantı tutanakları nasıl kaydedilir?İtalya'ya gelen "kayıt modu" özelliği, toplantıları, görüşmeleri ve beyin fırtınası oturumlarını kaydedip yazıya dökmenize olanak tanıyor. Chatbot arayüzünün sağ alt köşesinde bulunan yeni "kayıt" düğmesiyle etkinleştirilebiliyor. Ancak kayıt modu şu anda yalnızca ücretli plan kullanıcıları ve yalnızca abonelik planı kullanıcıları için Mac masaüstü uygulamasında kullanılabiliyor.

Düğmeye tıklandığında kayıt başlar ve oturumu duraklatmak veya sonlandırmak için özel bir açılır pencere açılır; bu pencere daha sonra yazıya dökülüp özetlenmek üzere OpenAI sunucularına gönderilebilir. Sonuç, önemli noktaları ve görevleri (varsa) vurgulayan şematik bir rapordur. Kayıt modu İtalyanca'da da oldukça iyi çalışır ve bize, kendi küçük boyutuyla, aracı moduna göre çok daha pratik bir adım gibi görünüyor.

Burada gizlilik endişeleri de dikkate alınmalıdır. OpenAI, kayıtların yalnızca yazıya dökülmek üzere kullanıldığını ve ardından imha edildiğini belirtiyor. Ancak, kullanıcı modeli sohbetler aracılığıyla eğitmeyi seçtiyse ("Tercihlerde ChatGpt'yi Herkes İçin İyileştir" seçeneği varsa), rapor ve diğer sohbet etkileşimleri OpenAI tarafından eğitim materyali olarak kullanılabilir.
La Repubblica