Huawei’nin bulut bilişim birimi, Beijing merkezli yapay zeka altyapısı girişimi SiliconFlow ile iş birliği yaparak DeepSeek’in büyük dil modeli V3 ve akıl yürütme modeli R1’i kullanıcılara sunmak için yoğun bir çalışma yürüttü. Bu çalışma, özellikle Çin’in yüksek performanslı AI modellerini uygun maliyetlerle erişilebilir kılma çabalarını destekleyen bir adım olarak öne çıkıyor. Huawei Cloud, bu modellerin şirketin Ascend bulut hizmeti üzerinde çalıştırıldığını ve küresel üst düzey grafik işlem birimlerinin performansıyla uyumlu sonuçlar sunduğunu belirtti.
SiliconFlow tarafından yapılan açıklamaya göre, V3 modeline erişim için giriş token’ları 1 milyon adet başına 1 yuan (yaklaşık 0,13 ABD doları), çıkış token’ları ise 2 yuan ücretlendirme ile sunuluyor. R1 modeli için ise bu ücretlendirme giriş token’ları için 4 yuan, çıkış token’ları için 16 yuan olarak belirlendi. Bu fiyatlandırmanın, DeepSeek modellerine olan talebi artırması bekleniyor.
Açık kaynak olarak geliştirilen DeepSeek modelleri, hem Çin hem de ABD pazarlarında ilgi görüyor. Geçtiğimiz hafta, OpenAI yatırımcısı Microsoft, R1 modeli için Azure bulut bilişim platformu ve GitHub üzerinde destek sunmaya başladı. Bu adım, müşterilere Copilot+ kişisel bilgisayarlarında yerel olarak çalışan AI uygulamaları geliştirme imkânı tanıyor. Aynı zamanda e-ticaret devi Amazon, Amazon Web Services (AWS) üzerinden R1 modelinin güçlü ve uygun maliyetli yapısıyla geliştiricilere uygulama oluşturma fırsatı sundu.
Huawei’nin Ascend bulut hizmeti, şirketin kendi geliştirdiği Ascend çözümünü kullandı. Bu çözüm, şirketin web sitesinde belirtildiği üzere, çeşitli donanım türlerini içeriyor ve kendi geliştirdiği sunucu kümeleri, AI modülleri ve hızlandırıcı kartları gibi unsurlardan oluşuyor. Ancak, bu hizmette kullanılan çiplerin detayları hakkında bilgi verilmedi.
Bu ortaklık, Çin’in dışa bağımlılığı azaltma ve yerli AI teknolojilerini güçlendirme konusundaki adımlarını gösteriyor. ABD’nin, Çin’e ileri teknoloji çip erişimini sınırlama çabaları devam ederken, Huawei ve SiliconFlow’un bu hamlesi, yerli altyapıların güçlenmesine önemli katkı sağlıyor.
Hangzhou merkezli DeepSeek girişimi, daha düşük maliyetle büyük yapay zeka modelleri geliştirme yeteneğiyle dikkat çekerken, bu başarısı Silicon Valley ve Wall Street’te yankı uyandırdı. SiliconFlow, kullanıcılarına Meta’nın Llama ve Alibaba’nın Qwen modellerine de erişim sunduklarını ve DeepSeek modellerinin “tüm insanlığa büyük bir armağan” olduğunu ifade etti. Alibaba aynı zamanda South China Morning Post’un sahibidir.
Diğer yandan, Çin merkezli sosyal medya ve video oyun devi Tencent, DeepSeek’in akıl yürütme modeli R1’i kendi bulut bilişim platformuna entegre etti. Tencent, bu modelin kurulumunun sadece üç dakika sürdüğünü belirterek, kullanıcı dostu bir deneyim sunduğunu ifade etti.
Huawei ve SiliconFlow, bu gelişmeler hakkında detaylı açıklamalar yapmak için Lunar New Year tatilinden sonra yanıt vereceklerini belirtti.