OpenAI’ın “gizli” modeli matematik şampiyonu oldu

2 Dakika Okuma

OpenAI, yapay zeka araştırmalarındaki süratli ilerleyişine bir yenisini daha ekleyerek, Memleketler arası Matematik Olimpiyatları’nda (IMO) “altın madalya düzeyinde performans” gösterdi.

Şirketin büyük lisan modelleri (LLM) ve akıl yürütme üzerine çalışan araştırmacısı Alexander Wei, X platformunda yaptığı paylaşımda, deneysel bir araştırma modelinin yapay zeka alanındaki “uzun müddettir beklenen büyük meydan okuma”yı muvaffakiyetle tamamladığını duyurdu.

GİZLİ BİR MODEL

Wei’ye nazaran, şimdi kamuoyuna açıklanmamış bir OpenAI modeli, dünyanın en esaslı ve itibarlı matematik müsabakalarından biri olan IMO’da altı sorudan beşini çözerek toplamda 42 üzerinden 35 puan elde etti.

IMO, ülkelerin altışar öğrenci gönderdiği ve hayli güç cebir ile ön-kalkülüs (pre-calculus) sorunlarının çözüldüğü bir yarış olarak biliniyor. Her ne kadar sorular yüzeyde kolay görünse de tam puan alabilmek için yaratıcı ve derinlemesine tahlil metotları gerekiyor. Bu yıl düzenlenen yarışta 630 iştirakçiden yalnızca 67’si altın madalya almayı başardı; bu da yaklaşık yüzde 10’luk bir muvaffakiyet oranına denk geliyor.

İNSAN GİBİSİ AKIL YÜRÜTME

Yapay zeka sistemleri çoklukla büyük data kümelerini tahlil etme yahut tekrarlayan misyonları yerine getirme üzere alanlarda tesirli olsa da, yaratıcı düşünme yahut karmaşık karar alma gerektiren sorunları çözmede yetersiz kalabiliyor.

Ancak OpenAI, bu son muvaffakiyetle birlikte geliştirdikleri modelin, karmaşık matematik sorunlarını insan gibisi bir akıl yürütmeyle çözebildiğini söylüyor.

OpenAI CEO’su Sam Altman, “Bu muvaffakiyet sayesinde, insan matematikçilerin düzeyinde ayrıntılı ve sağlam mantık zincirleri kurabilen bir model elde ettik,” dedi.

Öte yandan şirket modelin yakın vakitte kamuya sunulmayacağını bildirdi. Bu, merakla beklenen GPT-5’in evvelki sürüme kıyasla daha gelişmiş olacağına işaret etse de IMO düzeyinde matematik çözme yeteneğine şimdi sahip olmayacağı manasına geliyor.

ETİKETLENDİ:
Bu Makaleyi Paylaş
Yorum yapılmamış