## Ai2’nin Yeni Minik Yapay Zeka Modeli, Google ve Meta’nın Benzer Boyutlu Modellerini Geride Bırakıyor
Görünüşe göre bu hafta, küçük yapay zeka modellerinin yükselişine tanık oluyoruz. Kar amacı gütmeyen yapay zeka araştırma enstitüsü Ai2, Perşembe günü Olmo 2 1B adlı yeni bir model yayınladı. 1 milyar parametreye sahip bu modelin, çeşitli kıyaslama testlerinde Google, Meta ve Alibaba gibi devlerin benzer büyüklükteki modellerini geride bıraktığı iddia ediliyor. Parametreler, bir modelin davranışını yönlendiren iç bileşenler olarak tanımlanıyor.
Olmo 2 1B, AI geliştirme platformu Hugging Face üzerinde, Apache 2.0 lisansı altında kullanıma sunuldu. Çoğu modelden farklı olarak, Olmo 2 1B sıfırdan yeniden oluşturulabiliyor. Ai2, modeli geliştirmek için kullanılan kodu ve veri kümelerini (Olmo-mix-1124, Dolmino-mix-1124) erişime açtı.
Küçük modeller, devasa rakipleri kadar yetenekli olmayabilirler, ancak en büyük avantajları, çalışmak için güçlü donanımlara ihtiyaç duymamaları. Bu durum, daha düşük özellikli ve tüketici sınıfı makinelerin kısıtlamalarıyla mücadele eden geliştiriciler ve hobi amaçlı kullanıcılar için onları çok daha erişilebilir kılıyor.
Son birkaç günde, Microsoft’un Phi 4 mantık ailesinden Qwen’in 2.5 Omni 3B’sine kadar bir dizi küçük model lansmanı yaşandı. Bu modellerin çoğu ve Olmo 2 1B, modern bir dizüstü bilgisayarda, hatta bir mobil cihazda bile kolaylıkla çalıştırılabiliyor.
Ai2, Olmo 2 1B’nin kamuya açık, yapay zeka tarafından oluşturulmuş ve manuel olarak oluşturulmuş kaynaklardan elde edilen 4 trilyon token’lık bir veri kümesi üzerinde eğitildiğini belirtiyor. Token’lar, modellerin tükettiği ve ürettiği ham veri parçalarıdır. 1 milyon token, yaklaşık 750.000 kelimeye denk geliyor.
Olmo 2 1B, aritmetik akıl yürütmeyi ölçen GSM8K kıyaslamasında Google’ın Gemma 3 1B, Meta’nın Llama 3.2 1B ve Alibaba’nın Qwen 2.5 1.5B modellerinden daha iyi performans gösteriyor. Ayrıca, Olmo 2 1B, gerçek doğruluğu değerlendiren TruthfulQA testinde de bu üç modelin performansını aşıyor.
Ancak Ai2, Olmo 2 1B’nin riskler taşıdığı konusunda uyarıyor. Tüm yapay zeka modelleri gibi, zararlı ve “hassas” içerikler de dahil olmak üzere “sorunlu çıktılar” üretebileceği gibi, gerçeklere dayalı olmayan ifadeler de sunabiliyor. Bu nedenlerle Ai2, Olmo 2 1B’nin ticari ortamlarda kullanılmasını önermiyor.
Bir yanıt yazın