Alibaba, hibrit yapay zeka modeli ailesi Qwen3 yarışa dahil oldu

Alibaba’nın Yeni Hibrit Yapay Zeka Modeli Qwen3 Tanıtıldı




Çin’in teknoloji devi Alibaba, yapay zeka alanında ses getiren yeni modeli Qwen3’ü duyurdu. Şirketin “hibrit” yapısıyla öne çıkan bu yeni yapay zeka ailesi, hem Amerika merkezli dev rakipler OpenAI ve Google’ın modelleriyle yarışıyor hem de açık kaynak yaklaşımıyla dikkat çekiyor.

Devlere karşı güçlü performans

Qwen3 ailesi, 235 milyardan 600 milyon parametre sayısına kadar değişen çeşitli modellerden oluşuyor. Parametre sayısı, bir yapay zeka modelinin problem çözme yeteneğini etkileyen önemli bir ölçüttür. Alibaba’ya göre, en büyük modellerinden biri olan Qwen-3-235B-A22B, OpenAI’ın o3-mini ve Google’ın Gemini 2.5 Pro modellerini bazı karşılaştırmalarda geride bırakıyor. Qwen3 modelleri, OpenAI’nin o3 ve o4-mini gibi en üst düzey yeni modellere üstün gelmiyor, ancak yine de güçlü bir performans sergiliyorlar.

Ancak en güçlü model henüz kamuya açık değil. Bunun yerine, Qwen3-32B gibi daha küçük ancak yine de etkileyici performans gösteren modeller Hugging Face ve GitHub üzerinden indirilebilir durumda. Qwen3 modellerine ayrıca Fireworks AI ve Hyperbolic gibi bulut servis sağlayıcıları aracılığıyla da erişilebilmektedir.

Hibrit yaklaşım benimseniyor




Qwen3 modellerinin en dikkat çekici özelliklerinden biri olan “hibrit” yapısı, modelin karmaşık sorunlara karşı düşünme süreci uygulamasını ve basit sorulara hızlı cevap vermesini sağlar; yani model, gerektiğinde düşünür. Kullanıcılar, modelin ne kadar “düşüneceğine” karar verebilir. Alibaba mühendisleri bu esnekliği “düşünme bütçesinin kontrolü” olarak adlandırıyor. Bu tür çözümleri yakın zamanda görmeye başladık.

Ayrıca, bazı Qwen3 modelleri, “uzmanlar karışımı” (Mixture of Experts – MoE) mimarisiyle çalışıyor. Bu yöntem, işlemleri alt görevlere ayırarak uzman alt modellere dağıtır, böylece karar alma süreci tek bir merkeze bağlı kalmadan daha verimli ilerler.

119 dil ve 36 trilyon token

Alibaba, Qwen3’ün 119 dilde destek sağladığını ve yaklaşık 36 trilyon token (Tokenler, bir modelin işlediği ham veri parçacıklarıdır; 1 milyon token yaklaşık 750.000 kelimeye eşdeğerdir) ile eğitildiğini belirtiyor. Eğitim verileri arasında ders kitapları, soru-cevap çiftleri, yazılım kodları ve yapay zeka tarafından üretilmiş veri kümeleri bulunmaktadır. Bu geniş veri havuzu sayesinde Qwen3, yalnızca genel bilgi sorularında değil, matematik ve yazılım testlerinde de güçlü performans sergilemektedir. Örneğin, LiveCodeBench gibi yazılım karşılaştırmalarında OpenAI’ın o1 modelini geride bırakmayı başarmaktadır. Alibaba, Qwen3’ün araç çağırma yeteneğinin yanı sıra talimatları takip etme ve belirli veri formatlarını kopyalama konusunda da “üstün” olduğunu belirtiyor.

Related Posts

2.8K ekran ve Snapdragon 8 Gen 3 işlemci: Nubia Tablet Pro tanıtıldı!

Nubia, tablet pazarındaki çalışmalarına hız kesmeden devam ediyor. Çinli üretici son olarak özellikleri ve fiyatıyla dikkat çeken Tablet Pro modelini tanıttı. Peki, markanın yeni tablet modeli tam olarak ne sunuyor? İşte Nubia Tablet Pro özellikleri …

Samsung, interaktif ekranlı projektörünü satışa sundu!

Samsung, dünyanın ilk interaktif üçlü lazer ultra kısa mesafeli (UST) projektörü olan The Premiere 5 modelini satışa çıkardı. The Premiere 5, kullanıcıların yansıtılan görüntü ile doğrudan etkileşim kurmasına imkan tanıyor. Samsung, interaktif …

Süper Dünyalar hakkında yeni keşif: Güneş Sistemi’nde yok ama evrende çok!

Yeni keşifler, süper Dünya kategorisindeki gezegenlerin yalnızca yıldızlara yakın değil, uzak yörüngelerde de bulunabileceğini gösterdi. Evren, düşündüğümüzden daha fazla süper Dünya barındırıyor.

Intel Panther Lake işlemciler netleşiyor: Cougar Cove ve Darkmont mimarileri doğrulandı

Intel’in yeni nesil Panther Lake platformu için hazırlıkları hız kazandı. Önümüzdeki dönemde resmiyet kazanacak işlemciler hakkında, PCI ID listelerinde yeni bilgiler keşfedildi. İşte yeni mimarinin çekirdek kombinasyonları ve daha fazlası …

Sahte web siteleri nasıl anlaşılır?

İnternet dünyası, sunduğu sayısız fırsat ve kaynak yanında çeşitli güvenlik riskleri de barındırıyor. Bu risklerden biri de sahte web siteleridir. Sahte web siteleri, genellikle meşru siteleri taklit ederek kullanıcıların kişisel bilgilerini çalmak …

Wi-Fi hızını anında arttıracak ayarlar: Modemlerde bilinmeyen özellikler

İnternet bağlantısının yavaş olması günümüzde en sinir bozucu sorunlardan biridir. Özellikle evden çalışanlar, online oyun oynayanlar veya yüksek çözünürlüklü video izleyenler için Wi-Fi hızı kritik önem taşıyor. Çoğu kullanıcı internet hızında …

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir