Alibaba Group’un bulut bilişim birimi, yapay zekâ alanında yeni bir adım atarak Qwen2.5-VL modelini tanıttı. Bu model, belgeleri analiz edebilme, videoları anlama, görüntülerdeki nesneleri sayma ve bilgisayarları kontrol etme gibi özellikleriyle dikkat çekiyor. Qwen2.5-VL, özellikle gelişmiş video anlama, matematik, belge analizi ve soru cevaplama gibi değerlendirmelerde ön plana çıkıyor.
TechCrunch’ın haberine göre, modelin performansı birçok benchmark testinde, OpenAI’ın GPT-4o modeli, Anthropic’in Claude 3.5 Sonnet’i ve Google’ın Gemini 2.0 Flash modeli gibi önde gelen yapay zekâ modellerini geride bıraktı. Qwen2.5-VL’nin görsel analiz yetenekleri arasında grafiklerin ve görsellerin değerlendirilmesi, fatura ve form taramalarından veri çıkarılması ve uzun videoların içeriklerinin anlaşılması gibi işlevler yer alıyor. Ayrıca model, film ve televizyon dizilerindeki fikri mülkiyet öğelerini tanıyabiliyor.
Bu modelin dikkat çeken bir diğer özelliği ise, hem bilgisayarlarda hem de mobil cihazlarda yazılımlarla etkileşime girebilmesi. Hugging Face teknik lideri Philipp Schmid’in sosyal medya platformu X’te paylaştığı bir videoya atıfta bulunan TechCrunch, modelin Android üzerinde Booking.com uygulamasını açabildiğini ve Chongqing’den Pekin’e uçak bileti rezervasyonu yapabildiğini belirtiyor.
Ocak ayında düzenlenen geliştirici zirvesinde Alibaba Cloud, yeni yapay zekâ araçlarını ve büyük dil modellerini tanıtmıştı. Alibaba’nın bulut bilişim gelirleri bu yılın ikinci çeyreğinde %7 artarak 4,22 milyar dolara ulaştı.
Yapay zekâ alanında yaşanan gelişmeler, diğer ülkelerde de hareketliliği artırıyor. ABD merkezli yapay zekâ platformu DeepSeek R1, uygun maliyetli bir şekilde geliştirilen açık kaynaklı yapay zekâ modeliyle OpenAI gibi önde gelen yapay zekâ modellerini performans açısından geride bıraktığını iddia ediyor. 6 milyon dolardan daha az bir maliyetle geliştirilen bu model, teknoloji yatırımcılarının ilgisini üzerine çekti.
Bu arada, Microsoft’un 2025 yılı için yapay zekâ altyapısı harcamalarına 80 milyar dolar ayırdığı, Meta Platforms’un ise bu alana 60-65 milyar dolar yatırım yapmayı planladığı belirtiliyor. Ancak Biden yönetimi, ulusal güvenlik gerekçesiyle Nvidia ve Taiwan Semiconductor Manufacturing Company gibi şirketlerden Çin’e yapay zekâ teknolojilerine erişimi kısıtlayan bir dizi ambargo uygulamış durumda.
Yapay zekâ modellerinin gelişimi hızla devam ederken, Alibaba’nın Qwen serisi, Çin’in yapay zekâ rekabetinde güçlü bir şekilde yer aldığını gösteriyor. Qwen2.5-VL’nin gelecekte farklı sektörlerde kullanım alanı bulması bekleniyor.