OpenAI açık yüklü modellerini yayınladı: Yapay zeka demokratikleşiyor mu?

4 Dakika Okuma

OpenAI, Apache 2.0 lisansı altında iki yeni açık yüklü (open-weight) lisan modelini yayınladı.

“Açık ağırlıklı” modeller, yapay zeka alanında bir modelin yüklerinin, yani eğitim sırasında öğrenilen parametrelerin kamuya açık formda paylaşılması manasına geliyor. Bu sayede kullanıcıların bu modelleri kendi bilgisayarına kurup lokal olarak çalıştırması, değerli arayüz hizmetlerine para ödemeden kendi sistemlerine entegre edip özelleştirmesi mümkün hale geliyor.

Şirkete nazaran yeni yayınlanan bu modeller, yüksek performans sunarken, tüketici seviyesindeki donanımlarda bile çalışabilecek halde tasarlandı.

Özellikle 16 GB GPU’ya sahip bir dizüstü bilgisayarda bile çalışabilen bir model dikkat çekiyor. Grafik süreç ünitesi (GPU), matematiksel hesaplamaları yüksek süratte gerçekleştirebilen elektronik bir devre. Birebir vakitte bugün yapay zeka araçlarının en kritik bileşenlerinden biri.

YENİ MODELLERİN TEKNİK ÖZELLİKLERİ

Şirketin açık yüklü olarak yayınladığı modeller ve özellikleri ise şu halde:

– gpt-oss-120b (117 milyar parametre):

OpenAI’nin o4-mini modeliyle emsal akıl yürütme performansı sunuyor ve sırf 80 GB GPU ile çalışabiliyor.

– gpt-oss-20b (21 milyar parametre):

o3-mini düzeyinde performans sunuyor ve yalnızca 16 GB GPU ile verimli formda çalışabiliyor.

Bu parametreler, bir yapay zeka modelinin ne kadar büyük ve karmaşık olduğunu tabir eden teknik bir ölçü. Parametreler, bir modelin karar verirken neye odaklanacağını, neyi nasıl yorumlayacağını belirliyor.

Örneğin bir kelimeyi tanıma, bir cümledeki mana bağını çözme üzere vazifelerde bu parametreler kullanılıyor. Ne kadar çok parametre varsa model de o kadar çok bilgiyi temsil edebilir ve daha karmaşık ilişkileri anlayabilir.

Bu nedenle OpenAI’ın yayınladığı son açık yüklü modeller, bilhassa geliştiricilerin değerli sunucu altyapılarına muhtaçlık duymadan güçlü yapay zeka uygulamaları geliştirmesini kolaylaştırabilir.

AKIL YÜRÜTMEDE DAHA İYİ

OpenAI’ın açıklamasına nazaran yeni modeller, tıpkı boyuttaki öteki açık kaynak modellerden daha âlâ akıl yürütme ve araç kullanımı performansı gösteriyor.

Modellerin internette arama yapma ve Python yazılım kodlarını çalıştırma üzere araç kullanımı gerektiren vazifelerde başarılı olduğu, ayrıyeten talimatlara uyma ve vazifenin karmaşıklığına nazaran akıl yürütme seviyesini ayarlama yeteneğine sahip olduğu belirtiliyor.

OpenAI, modellerin bilhassa yazılımcıların kodları paylaşmak kullandığı Hugging Face, GitHub, vLLM, Ollama ve llama.cpp üzere platformlarla kolay kolay entegre edilebilmesi için rehberler de yayınladı.

GÜVENLİK VE ŞEFFAFLIK ÖNLEMLERİ

OpenAI, bu açık yüklü modelleri geliştirirken güvenliği ön planda tuttuğunu söylüyor. Yapılan testlerde, makûs niyetli ince ayarlarla bile modellerin biyolojik, kimyasal yahut siber risk alanlarında kullanımı açısından tehlikeli düzeylere ulaşmadığı belirlendi.

Öte yandan şirket, modellerin düşünme sürecini şeffaf biçimde izleyebilmek için “düşünce zinciri” (yapay zeka modellerinin bir soruya yanıt vermeden evvel adım adım düşünmesini sağlayan bir teknik) çıktılarında rastgele bir filtreleme uygulamadı. Bu durum, modellerin bazen gerçekle bağdaşmayan yahut “halüsinatif” içerikler üretmesine neden olabilir.

Şirketin açıklamasında, “Düşünce zincirlerini bastırmak, modellerin ziyanlı niyetlerini gizlemesine yol açabilir. Bu nedenle baskı uygulamaktan kaçındık. Geliştiricilerin bu çıktıları izleyerek modellerin davranışlarını denetleyebilmesini amaçlıyoruz” dendi.

TESTLER NE GÖSTERİYOR?

Yapılan kıyaslamalarda, bu yeni modellerin halüsinasyon konusunda o4-mini kadar âlâ sonuçlar vermediği görüldü. OpenAI, bunun model boyutlarının daha küçük olmasından kaynaklandığını belirtiyor.

Ancak gerçek dünya uygulamalarında, örneğin web’den bilgi çekme (RAG) yahut veritabanı sorgulama üzere senaryolarda halüsinasyonların daha az görülmesi bekleniyor.

AÇIK KAYNAK VE AÇIK AĞIRLIK

OpenAI’ın bu atılımı, güçlü yapay zeka modellerini daha erişilebilir hâle getirirken, geliştiricilere yeni uygulama alanları açmayı hedefliyor.

Özellikle düşük donanımda çalışan bu modeller, yapay zekanın “demokratikleşmesi” yolunda kıymetli bir adım olarak bedellendiriliyor.
Son periyotta uygulamaların şeffaflığı konusundaki artan eforlar kapsamında şirketler, geliştirdikleri uygulamaların kodlarını herkese açık hale getiriyor. Buna “açık kaynaklı kod” ismi veriliyor.

Öte yandan OpenAI’ın yayınladığı modellerin açık yüklü olması, tıpkı vakitte açık kaynak kodlu olduğu manasına gelmiyor. Çünkü açık tartı yalnızca modelin parametrelerinin ve mimarisinin açık olmasıyken, açık kaynak ise modelin eğitim verisinin, kodlarının ve her şeyinin açık olması manasına geliyor.

Bu Makaleyi Paylaş
Yorum yapılmamış