## Alibaba’dan Yapay Zeka Hamlesi: Qwen3 Modelleri Google ve OpenAI’a Rakip Olmaya Hazır
Çinli teknoloji devi Alibaba, yapay zeka alanındaki iddiasını bir kez daha ortaya koydu. Şirket, Qwen3 adı verilen yeni nesil yapay zeka modellerini tanıttı. Alibaba’nın iddiasına göre bu modeller, Google ve OpenAI gibi sektör liderlerinin en iyi modelleriyle yarışıyor, hatta bazı noktalarda onları geride bırakıyor.
Qwen3 ailesi, 0.6 milyar parametreden 235 milyar parametreye kadar değişen geniş bir yelpazede modeller sunuyor. Bilindiği gibi, bir modelin parametre sayısı, problem çözme yeteneğiyle doğru orantılı. Dolayısıyla, daha fazla parametreye sahip modeller genellikle daha iyi performans gösteriyor. Modellerin büyük bir kısmı, Hugging Face ve GitHub gibi yapay zeka geliştirme platformlarından “açık” lisans altında indirilebilecek.
Qwen gibi Çin menşeli model serilerinin yükselişi, OpenAI gibi Amerikan laboratuvarları üzerindeki daha yetenekli yapay zeka teknolojileri sunma baskısını artırıyor. Bu durum, politika yapıcıları Çinli yapay zeka şirketlerinin model eğitmek için gerekli olan çipler elde etme yeteneklerini kısıtlamaya yönelik önlemler almaya yöneltiyor.
Alibaba’ya göre Qwen3 modelleri, karmaşık problemleri derinlemesine “akıl yürüterek” çözebilme veya basit isteklere hızlı cevap verebilme özellikleriyle “hibrit” bir yapı sunuyor. Bu akıl yürütme yeteneği, OpenAI’ın o3 modeli gibi, modellerin kendi kendilerini etkili bir şekilde kontrol etmelerini sağlıyor. Ancak bu durum, daha yüksek gecikme süresi anlamına geliyor.
Qwen ekibi bir blog yazısında, “Düşünme ve düşünmeme modlarını sorunsuz bir şekilde entegre ettik, kullanıcılara düşünme bütçesini kontrol etme esnekliği sunuyoruz. Bu tasarım, kullanıcıların göreve özel bütçeleri daha kolay yapılandırmasını sağlıyor,” ifadelerini kullandı.
Modellerin bazıları, sorguları yanıtlama konusunda daha hesaplama açısından verimli olabilen uzman karışımı (MoE) mimarisi kullanıyor. MoE, görevleri alt görevlere ayırıyor ve bunları daha küçük, uzmanlaşmış “uzman” modellere devrediyor.
Alibaba, Qwen3 modellerinin 119 dili desteklediğini ve yaklaşık 36 trilyon tokenlik bir veri seti üzerinde eğitildiğini belirtiyor. Tokenler, bir modelin işlediği ham veri parçalarıdır; 1 milyon token, yaklaşık 750.000 kelimeye karşılık geliyor. Alibaba, Qwen3’ün ders kitapları, “soru-cevap çiftleri”, kod parçacıkları, yapay zeka tarafından üretilen veriler ve daha fazlasının bir kombinasyonu üzerinde eğitildiğini söylüyor.
Alibaba, bu iyileştirmeler ve diğerleriyle birlikte Qwen3’ün, öncülü Qwen2’ye kıyasla yeteneklerinin önemli ölçüde arttığını belirtiyor. Qwen3 modellerinin hiçbiri, OpenAI’ın o3 ve o4-mini gibi en üst düzeydeki son modellere kesin bir üstünlük sağlamasa da, yine de güçlü performans gösteriyorlar.
Programlama yarışmaları için bir platform olan Codeforces’ta, en büyük Qwen3 modeli olan Qwen-3-235B-A22B, OpenAI’ın o3-mini modelini ve Google’ın Gemini 2.5 Pro modelini geride bırakıyor. Qwen-3-235B-A22B ayrıca, zorlu bir matematik kıyaslaması olan AIME’nin en son sürümünde ve bir modelin problemler hakkında “akıl yürütme” yeteneğini değerlendiren bir test olan BFCL’de o3-mini’yi geçiyor.
Ancak Qwen-3-235B-A22B henüz herkese açık değil.
En büyük kamuya açık Qwen3 modeli olan Qwen3-32B, Çinli yapay zeka laboratuvarı DeepSeek’in R1’i de dahil olmak üzere birçok tescilli ve açık yapay zeka modeliyle rekabet edebiliyor. Qwen3-32B, kodlama kıyaslaması LiveCodeBench de dahil olmak üzere çeşitli testlerde OpenAI’ın o1 modelini geride bırakıyor.
Alibaba, Qwen3’ün araç çağırma yeteneklerinin yanı sıra talimatları izleme ve belirli veri formatlarını kopyalama konusunda “mükemmel” olduğunu söylüyor. İndirilebilen modellere ek olarak, Qwen3, Fireworks AI ve Hyperbolic dahil olmak üzere bulut sağlayıcılarından da edinilebilir.
Yapay zeka bulut barındırıcısı Baseten’in kurucu ortağı ve CEO’su Tuhin Srivastava, Qwen3’ün, açık modellerin OpenAI gibi kapalı kaynak sistemlerle aynı seviyede kalma eğiliminde bir başka nokta olduğunu söyledi.
Srivastava, “ABD, Çin’e çip satışını ve Çin’den yapılan alımları kısıtlamaya devam ediyor, ancak Qwen 3 gibi son teknoloji ürünü ve açık modeller… şüphesiz ülke içinde kullanılacak” dedi. “Bu, işletmelerin hem kendi araçlarını oluşturdukları hem de Anthropic ve OpenAI gibi kapalı model şirketleri aracılığıyla hazır satın aldıkları gerçeğini yansıtıyor.”
Bir yanıt yazın