ChatGPT’yi geliştiren OpenAI, yeni yayınladığı modellerini, yüksek performans sunarken, tüketici düzeyindeki donanımlarda bile çalışabilecek şekilde tasarladı.
OpenAI, Apache 2.0 lisansı altında iki yeni açık ağırlıklı (open-weight) dil modelini yayınladı.
“Açık ağırlıklı” modeller, yapay zeka alanında bir modelin ağırlıklarının, yani eğitim sırasında öğrenilen parametrelerin kamuya açık şekilde paylaşılması anlamına geliyor. Bu sayede kullanıcıların bu modelleri kendi bilgisayarına kurup yerel olarak çalıştırması, pahalı arayüz hizmetlerine para ödemeden kendi sistemlerine entegre edip özelleştirmesi mümkün hale geliyor.
Şirkete göre yeni yayınlanan bu modeller, yüksek performans sunarken, tüketici düzeyindeki donanımlarda bile çalışabilecek şekilde tasarlandı.
Özellikle 16 GB GPU’ya sahip bir dizüstü bilgisayarda bile çalışabilen bir model dikkat çekiyor. Grafik işlem birimi (GPU), matematiksel hesaplamaları yüksek hızda gerçekleştirebilen elektronik bir devre. Aynı zamanda bugün yapay zeka araçlarının en kritik bileşenlerinden biri.
YENİ MODELLERİN TEKNİK ÖZELLİKLERİ Şirketin açık ağırlıklı olarak yayınladığı modeller ve özellikleri ise şu şekilde:
– gpt-oss-120b (117 milyar parametre):
OpenAI’nin o4-mini modeliyle benzer akıl yürütme performansı sunuyor ve yalnızca 80 GB GPU ile çalışabiliyor.
– gpt-oss-20b (21 milyar parametre):
o3-mini seviyesinde performans sunuyor ve sadece 16 GB GPU ile verimli şekilde çalışabiliyor. Bu parametreler, bir yapay zeka modelinin ne kadar büyük ve karmaşık olduğunu ifade eden teknik bir ölçü. Parametreler, bir modelin karar verirken neye odaklanacağını, neyi nasıl yorumlayacağını belirliyor.
Örneğin bir kelimeyi tanıma, bir cümledeki anlam ilişkisini çözme gibi görevlerde bu parametreler kullanılıyor. Ne kadar çok parametre varsa model de o kadar çok bilgiyi temsil edebilir ve daha karmaşık bağlantıları anlayabilir.
Bu nedenle OpenAI’ın yayınladığı son açık ağırlıklı modeller, özellikle geliştiricilerin pahalı sunucu altyapılarına ihtiyaç duymadan güçlü yapay zeka uygulamaları geliştirmesini kolaylaştırabilir.
AKIL YÜRÜTMEDE DAHA İYİ
OpenAI’ın açıklamasına göre yeni modeller, aynı boyuttaki diğer açık kaynak modellerden daha iyi akıl yürütme ve araç kullanımı performansı gösteriyor.
Modellerin internette arama yapma ve Python yazılım kodlarını çalıştırma gibi araç kullanımı gerektiren görevlerde başarılı olduğu, ayrıca talimatlara uyma ve görevin karmaşıklığına göre akıl yürütme düzeyini ayarlama yeteneğine sahip olduğu belirtiliyor.
OpenAI, modellerin özellikle yazılımcıların kodları paylaşmak kullandığı Hugging Face, GitHub, vLLM, Ollama ve llama.cpp gibi platformlarla kolayca entegre edilebilmesi için rehberler de yayınladı.
GÜVENLİK VE ŞEFFAFLIK ÖNLEMLERİ
OpenAI, bu açık ağırlıklı modelleri geliştirirken güvenliği ön planda tuttuğunu söylüyor. Yapılan testlerde, kötü niyetli ince ayarlarla bile modellerin biyolojik, kimyasal veya siber risk alanlarında kullanımı açısından tehlikeli seviyelere ulaşmadığı belirlendi.
Öte yandan şirket, modellerin düşünme sürecini şeffaf şekilde izleyebilmek için “düşünce zinciri” (yapay zeka modellerinin bir soruya cevap vermeden önce adım adım düşünmesini sağlayan bir teknik) çıktılarında herhangi bir filtreleme uygulamadı. Bu durum, modellerin bazen gerçekle bağdaşmayan veya “halüsinatif” içerikler üretmesine neden olabilir.
Şirketin açıklamasında, “Düşünce zincirlerini bastırmak, modellerin zararlı düşüncelerini gizlemesine yol açabilir. Bu nedenle baskı uygulamaktan kaçındık. Geliştiricilerin bu çıktıları izleyerek modellerin davranışlarını denetleyebilmesini amaçlıyoruz” dendi.
TESTLER NE GÖSTERİYOR?
Yapılan kıyaslamalarda, bu yeni modellerin halüsinasyon konusunda o4-mini kadar iyi sonuçlar vermediği görüldü. OpenAI, bunun model boyutlarının daha küçük olmasından kaynaklandığını belirtiyor.
Ancak gerçek dünya uygulamalarında, örneğin web’den bilgi çekme (RAG) veya veritabanı sorgulama gibi senaryolarda halüsinasyonların daha az görülmesi bekleniyor.
AÇIK KAYNAK VE AÇIK AĞIRLIK
OpenAI’ın bu hamlesi, güçlü yapay zeka modellerini daha erişilebilir hâle getirirken, geliştiricilere yeni uygulama alanları açmayı hedefliyor.
Özellikle düşük donanımda çalışan bu modeller, yapay zekanın “demokratikleşmesi” yolunda önemli bir adım olarak değerlendiriliyor. Son dönemde uygulamaların şeffaflığı konusundaki artan çabalar kapsamında şirketler, geliştirdikleri uygulamaların kodlarını herkese açık hale getiriyor. Buna “açık kaynaklı kod” adı veriliyor.
Öte yandan OpenAI’ın yayınladığı modellerin açık ağırlıklı olması, aynı zamanda açık kaynak kodlu olduğu anlamına gelmiyor. Zira açık ağırlık sadece modelin parametrelerinin ve mimarisinin açık olmasıyken, açık kaynak ise modelin eğitim verisinin, kodlarının ve her şeyinin açık olması anlamına geliyor.