Alibaba, açık kaynak geniş dil modelinde yeni kuşak Qwen 3’ü tanıttı; uzmanlar bu yeniliği, Çin’in adeta patlama yaşayan açık kaynak yapay zeka alanında yeni bir çığır açıcı hamle olarak görüyorlar.
Alibaba’dan yapılan açıklamaya göre, Qwen3 mantık yürütme, talimatları takip etme, alet kullanımı ve çok dilli görevlerde yenilikler vaat ederek, DeepSeek’in R1 gibi diğer önemli modellerine rakip oluşturuyor.
Geniş dil modelleri serisi, bir dizi yapı ve ölçü içeren sekiz değişik çeşit içerdiğinden, mobil telefon gibi cihazlar için yapay zeka uygulamaları inşa ederken Qwen kullanıldığında belli bir esneklik sunuyor.
Qwen3 aynı zamanda geleneksel geniş dil modelleriyle Alibaba’nın “hibrid mantık yürütme modelleri” olarak adlandırdığı yapıyı bir araya getiriyor.
Alibaba’ya göre, bu tür modeller kodlama gibi karmaşık görevler için “düşünme biçimi”yle daha hızlı ve genel amaçlı yanıtları kapsayan “düşünmeme biçimi” arasında sorunsuz geçiş sağlayabiliyor.
Yeni modeller şimdiden, Hugging Face ve GitHub gibi platformlarda ve aynı zamanda Alibaba Bulut’un web ara yüzeyinde bireysel kullanıcılar için ücretsiz. Qwen3 aynı zamanda Alibaba’nın yapay zeka asistanı Quark’ı çalıştırmak için de kullanılıyor.
Baidu gibi Çinli rakipler de, DeepSeek’in ortaya çıkışının ardından yeni yapay zeka modelleri ortaya koymak için harekete geçtiler. Tüm bu planlar daha açık kaynak bir iş modeli yaratmaya yönelik.
Öte yandan, Reuters şubat ayında, adını vermek istemeyen kaynaklara dayanarak, DeepSeek’in R1’in halefinin lansmanını hızlandırdığını bildirmişti.