OpenAI, bugün ChatGPT kullanıcıları ve geliştiriciler için o3-mini adlı büyük dil modelini genel kullanıma sundu. Aralık ayında tanıtımı yapılan model, şirketin amiral gemisi konumundaki o3 modelinin daha düşük maliyetli ve daha hızlı bir versiyonu olarak konumlandırılıyor.
o3-mini modelinin çıkışı, birkaç saat önce internette sızdırıldı. Wired tarafından aktarılan bilgilere göre, OpenAI, geçtiğimiz pazartesi günü DeepSeek tarafından tanıtılan R1 modeline yanıt olarak bu sürümün piyasaya sürülme tarihini öne çekti. DeepSeek’in R1 modeli, yapay zeka hisselerinde geniş çaplı bir satış dalgasına neden olurken, OpenAI modellerinin maliyet verimliliği konusunda da soru işaretleri doğurdu.
OpenAI, bugün yaptığı açıklamada o3-mini modelinin, şirketin daha önce Eylül ayında tanıttığı daha az gelişmiş bir akıl yürütme modeli olan o1-mini ile benzer gecikme sürelerine sahip olduğunu belirtti. o3-mini, ChatGPT‘nin ücretsiz, Plus, Pro ve Team sürümlerinde kullanıma sunulmuş durumda. Gelecek hafta ise kurumsal planlarda yer alacak. Plus ve Team sürümlerinde, o3-mini için günlük mesaj sınırı 150 olarak belirlendi. Bu sınır, o1-mini’deki sınırın üç katı.

OpenAI, ayrıca yeni modeli çeşitli uygulama programlama arayüzleri (API) aracılığıyla da erişime açtı. Geliştiriciler, bu arayüzleri kullanarak o3-mini modelini uygulamalarına entegre edebilecek. API üzerinden erişilebilen model, farklı çıktı kalitesine sahip üç sürümle sunuluyor: o3-mini-low, o3-mini-medium ve o3-mini-high.
OpenAI’nin akıl yürütme modelleri, bir işlem yöntemi olan “test-time compute” yaklaşımını uyguluyor. Bu yöntem, yanıtların kalitesini artırmak amacıyla modelin her bir cevap üretiminde kullandığı donanım miktarını artırıyor. o3-mini-low, giriş seviyesinde daha az altyapı ve süre gerektirirken, o3-mini-high ise daha yoğun donanım kullanımını gerekli kılıyor.
Aralık ayında yapılan bir demo sırasında, o3-mini ve şirketin amiral gemisi o3 modeli çeşitli testlere tabi tutuldu. Kodlama görevleri üzerine yapılan bir değerlendirmede o3-mini, 2.073 puan alırken o3, 2.727 puan elde etti. Değerlendirme sırasında o3-mini, kendi API’sini kullanarak Python dilinde bir web tabanlı chatbot arayüzü yazmayı başardı.
Ayrıca, Aralık’taki testlerde, o3-mini-high modeli, ABD Matematik Olimpiyatları için yapılan bir yeterlilik sınavında 100 üzerinden 83.6 puan aldı ve o3 modelinden 16 puan daha düşük bir sonuç elde etti. Ancak bugün açıklanan güncel verilere göre, o3-mini-high’ın puanı 79.6’ya geriledi. Bu durum, modelin geçen ay yapılan demodan bu yana bazı güncellemeler geçirmiş olabileceğine işaret ediyor.
OpenAI, ilk nesil akıl yürütme modeli olan o1’i 2024 Eylül ayında tanıtmıştı. Wired, bu lansmanın şirketin iç geliştirme süreçlerindeki sorunları gözler önüne serdiğini aktardı. Habere göre, OpenAI, ticari kullanım için tasarlanmamış bir yapay zeka altyapısı kullanarak hız uğruna bazı deneysel detaylardan taviz verdi.
OpenAI daha sonra, daha güvenilir bir yapay zeka altyapısı geliştirdi ve bu iki teknolojiyi birleştirmek için bir proje başlattı. Ancak, çalışanlar bu projenin “tam anlamıyla hayata geçirilemediği” görüşünde.
Aralık ayında düzenlenen demo sırasında OpenAI CEO’su Sam Altman, o3-mini modelinin dış güvenlik araştırmacılarıyla iş birliği içinde test edileceğini belirtti. Bu, şirketin daha önce yalnızca iç güvenlik testlerine dayandığı süreçten bir sapma olarak dikkat çekti. Altman, amiral gemisi olan o3 modelinin de o3-mini’nin ardından kısa süre içinde piyasaya sürüleceğini ifade etti.