OpenAI Sonunda GPT-5'i Piyasaya Sürdü. Bilmeniz Gereken Her Şey

OpenAI, amiral gemisi dil modelinin en son sürümü olan GPT-5'i tüm ChatGPT kullanıcılarına sunmaya başladı .
Şirketin CEO'su Sam Altman, Çarşamba günü düzenlediği basın toplantısında GPT-5'i " AGI'ye giden yolda önemli bir adım" olarak nitelendirdi. Modelin yapay genel zekaya ulaştığını iddia etmekten kaçınırken, Altman son sürümün "açıkça genel olarak zeki bir model" olduğunu belirtti. GPT-5'in, OpenAI'nin tüzüğünde "ekonomik açıdan en değerli işlerde insanlardan daha iyi performans gösteren, son derece otonom bir sistem" olarak tanımlanan , oldukça muğlak bir terim olan AGI'ye ulaşmasını sağlayacak temel özelliklerden hâlâ yoksun olduğunu da sözlerine ekledi. Örneğin, model, kullanıma sunulduktan sonra bile sürekli öğrenme yeteneğinden hâlâ yoksun.
OpenAI, GPT-5'in önceki modellere göre daha akıllı, daha hızlı, daha kullanışlı ve daha doğru olduğunu, halüsinasyon oranının ise daha düşük olduğunu iddia ediyor. Altman, GPT-4'ten GPT-5'e geçişi, iPhone'un pikselli ekrandan Retina ekrana geçişine benzeterek, her zamanki gibi iddialı bir dille anlattı. Altman, "GPT-5, herhangi bir konuda uzman biriyle, tıpkı doktora seviyesinde bir uzmanla konuşuyormuş gibi hissettiren ilk deneyim," dedi.
Perşembe günkü lansmanın bir parçası olarak OpenAI iki yeni model çeşidi duyurdu: hafif bir GPT-5-mini ve daha da hızlı, daha ucuz bir GPT-5-nano (sadece API'de). OpenAI'ye göre, ücretsiz kullanıcılar GPT-5 ve GPT-5-mini'ye erişebilecekken, Plus aboneliği aynı modelleri "önemli ölçüde daha yüksek" kullanım limitleriyle içeriyor. OpenAI, aylık 200 dolarlık Pro katmanının, modelin daha güçlü bir sürümü olan GPT-5-pro ve modelin bir sorguyu normalden daha uzun süre işlemesine olanak tanıyan GPT-5-thinking ile birlikte sınırsız GPT-5 erişimi sunduğunu söylüyor. Pro kullanıcıları hala eski modeller arasında seçim yapma erişimine sahip olacak. Çoğu kullanıcının artık modeller arasında seçim yapmasına gerek kalmayacak, çünkü sohbet arayüzü artık sorgu karmaşıklığına ve kullanıcının abonelik katmanına bağlı olarak otomatik olarak doğru sürüme yönlendiriyor.
Geliştirici lansman bloguna göre, GPT-5, API kullanan geliştiricilere token girişi için 1 milyon başına 1,25 ABD doları, token çıkışı için ise 1 milyon başına 10 ABD doları maliyet çıkaracak. "GPT-5 mini, 1 milyon giriş tokeni başına 0,25 ABD doları ve 1 milyon çıkış tokeni başına 2 ABD doları fiyatla satılıyor. GPT-5 nano ise 1 milyon giriş tokeni başına 0,05 ABD doları ve 1 milyon çıkış tokeni başına 0,40 ABD doları fiyatla satılıyor," diye ekliyor. Karşılaştırma yapmak gerekirse, geliştiriciler genellikle çok ucuz olduğu için Gemini 2.5 Flash ve Flash-Lite kullanıyor; GPT-5 nano artık daha ucuz.
Önümüzdeki haftadan itibaren Pro kullanıcıları Gmail, Google Kişiler ve Google Takvimlerini ChatGPT'ye bağlayabilecek ve diğer katmanlar belirtilmeyen bir tarihte erişim kazanacak. Şirket bir e-postada, "ChatGPT, bunlara başvurmanın en uygun olduğu zamanı otomatik olarak bilir, böylece sohbet etmeden önce onları seçmenize gerek kalmaz" dedi.
Kullanıcılar ayrıca bir sohbet rengi seçebilir ve dört önceden ayarlanmış kişilikten birini seçebilirler: Alaycı, Robot, Dinleyici ve İnek. WIRED'ın Model Behavior bülteninde geçen hafta üzerinde çalışıldığı bildirilen bir özellik. OpenAI'nin blog duyurusuna göre, bu kişilikleri Gelişmiş Ses Modu'na entegre etmeyi planlıyor.
Şirketin API'si, kullanıcılara her üç modeli de sunacak ve ayrıntılı veya doğrudan yanıtlar arasında geçiş yapmak için isteğe bağlı kontroller sunacak. GPT-5, önceki modellere göre daha fazla bilgi tutabilir; şirketin önceki o3 modelinde bulunan 200.000 belirteçli bağlam penceresinden daha geniş bir yelpazede, 256.000 belirteçli bir bağlam penceresine sahiptir. Bu, uzun konuşmaları, belgeleri veya kodları bağlamı kaybetmeden daha iyi anlayabileceği anlamına gelir.
OpenAI'nin blog yazısı, GPT-5'in SWE-Bench Verified (yüzde 74,9 puan), SWE-Lancer (GPT-5-thinking yüzde 55 puan) ve Aider Polyglot (yüzde 88 puan) gibi çeşitli kodlama kıyaslamalarında önceki modellerini geride bıraktığını iddia ediyor. Bu kıyaslamalar, modelin hataları düzeltme, serbest çalışma tarzı kodlama görevlerini tamamlama ve birden fazla programlama dilinde çalışma yeteneğini test ediyor.
Çarşamba günü düzenlenen basın brifinginde, OpenAI eğitim sonrası lideri Yann Dubois, GPT-5'i "İngilizce konuşan ortağımın Fransızca öğrenmesi için güzel ve son derece etkileşimli bir web uygulaması oluşturmaya" teşvik etti. Yapay zekaya günlük ilerleme, bilgi kartları ve sınavlar gibi çeşitli aktiviteler gibi özellikler ekleme görevini verdi ve uygulamanın "son derece ilgi çekici bir tema" ile sunulmasını istediğini belirtti. Yaklaşık bir dakika sonra, yapay zeka tarafından oluşturulan uygulama açıldı. Her ne kadar sadece bir raylı sistem demosu olsa da, sonuç tam olarak Dubois'in istediğini sunan şık bir siteydi.
Eğitim sonrası lider Michelle Pokrass, "Harika bir kodlama işbirlikçisi ve aynı zamanda aracı görevlerde de mükemmel," diyor. "Uzun zincirleri ve araç çağrılarını etkili bir şekilde yürütüyor [bu da web tarayıcıları veya harici API'ler gibi işlevleri ne zaman ve nasıl kullanacağını daha iyi anladığı anlamına gelir], ayrıntılı talimatları izliyor ve eylemlerinin önceden açıklamalarını sağlıyor."
OpenAI ayrıca blog yazısında GPT-5'in "sağlık sorularımız için şu ana kadarki en iyi modelimiz" olduğunu belirtiyor. Üç OpenAI sağlıkla ilgili LLM ölçütünde (HealthBench, HealthBench Hard ve HealthBench Consensus) , sistem kartı (ürünün teknik yeteneklerini ve diğer araştırma bulgularını açıklayan bir belge), GPT-5 düşünme modelinin önceki modelleri "önemli ölçüde" geride bıraktığını belirtiyor. GPT-5'in düşünme modeli, HealthBench Hard'da o3'ün %31,6'lık puanına kıyasla %25,5 puan aldı. Sistem kartına göre, bu puanlar en az iki hekim tarafından doğrulanıyor.
Pokrass'a göre, modelin daha az halüsinasyon gördüğü iddia ediliyor; bu, yapay zekada yaygın bir sorun ve yanlış bilgi sağlıyor. OpenAI'nin güvenlik araştırma lideri Alex Beutel, "GPT-5'teki aldatma oranlarını önemli ölçüde azalttıklarını" ekliyor.
Sistem kartında, "GPT-5 düşüncesinin aldatma, hile yapma veya sorunları çözme eğilimini azaltmak için adımlar attık, ancak önlemlerimiz mükemmel değil ve daha fazla araştırmaya ihtiyaç var," deniyor. "Özellikle, modeli çözemeyeceği görevlerle karşı karşıya kaldığında zarif bir şekilde başarısız olacak şekilde eğittik."
Şirketin sistem kartı, GPT-5 modellerini web tarayıcısına erişim olmadan test ettikten sonra araştırmacıların halüsinasyon oranının (bunu "küçük veya büyük hatalar içeren olgusal iddiaların yüzdesi" olarak tanımladılar) GPT-4o modeline kıyasla yüzde 26 daha az yaygın olduğunu bulduklarını belirtiyor. GPT-5 düşüncesi, o3'e kıyasla yüzde 65 daha düşük bir halüsinasyon oranına sahip.
Çift amaçlı (potansiyel olarak zararlı veya iyi huylu) olabilecek istemler için Beutel, GPT-5'in "güvenli tamamlamalar" kullandığını ve bu sayede modelin "güvenli kalma kısıtlamaları dahilinde mümkün olduğunca yararlı bir yanıt vermesini" sağladığını söylüyor. Beutel'e göre OpenAI, sistemin sağlam olduğundan emin olmak için 5.000 saatten fazla kırmızı takım çalışması yaptı ve harici kuruluşlarla testler yaptı.
OpenAI, ChatGPT'nin haftalık aktif kullanıcı sayısının yaklaşık 700 milyon, ücretli iş kullanıcılarının 5 milyon ve API'yi kullanan geliştiricilerin ise 4 milyon olduğunu söylüyor.
ChatGPT Başkanı Nick Turley, "Bu modelin havası gerçekten çok iyi ve insanların bunu gerçekten hissedeceğini düşünüyorum," diyor. "Özellikle de modelleri düşünerek vakit geçirmemiş ortalama insanlar."
wired