Geçtiğimiz hafta tanıtılan Çin menşeli genel yapay zekâ ajanı Manus AI, kısa sürede küresel ölçekte merak konusu haline geldi. Geliştiricisi Butterfly Effect adlı Wuhan merkezli girişim olan Manus, yalnızca Çin’de değil, başta ABD olmak üzere birçok ülkede teknoloji dünyasının gündemine girdi. Twitter kurucularından Jack Dorsey ve Hugging Face ürün sorumlusu Victor Mustar gibi önemli isimlerin olumlu yorumları, araca olan ilgiyi artırdı. Bazı sektör temsilcileri Manus’u, işlevselliği ve sürpriz kapasitesiyle tanınan DeepSeek ile kıyasladı.
Manus AI Nedir?
Manus, kendisini “dünyanın ilk genel yapay zekâ ajanı” olarak tanımlıyor. Bu iddiasını ise tek bir dil modeli yerine birden çok yapay zekâ modelinin (örneğin Claude 3.5 Sonnet ve özelleştirilmiş Qwen) birlikte çalıştığı otonom ajan sistemine dayandırıyor. DeepSeek gibi sohbet odaklı çözümlerden farklı olarak, çok adımlı görevleri kendi kendine planlayıp uygulayabilen bir yapıya sahip. Ancak sistem hâlen gelişim aşamasında ve sınırlı sayıda kullanıcıya erişim hakkı tanıyor. Resmi açıklama yapılmamış olsa da, şu an bekleme listesinde olanların %1’inden azının davet koduna erişim sağladığı belirtiliyor. Bu yoğun talebi yansıtan bir başka veri ise Manus’un Discord topluluğunun 186 bini aşkın üyeye ulaşmış olması.
MIT Technology Review, Manus’a erişim hakkı alan nadir kurumlardan biri oldu. Yapılan testlerde Manus’un, bir asistan gibi davranarak görevleri yürütmesi dikkat çekti. Görevleri yerine getirirken zaman zaman hatalı varsayımlarda bulunabildiği ya da işleri hızlandırmak için kestirme çözümler geliştirdiği gözlemlendi. Ancak test eden editöre göre, Manus “açıklayıcı, uyarlanabilir ve kullanıcıdan gelen geri bildirimle daha iyi sonuçlar üretebilen” bir araç. Yani potansiyeli yüksek ama henüz tamamen olgunlaşmış değil.
Butterfly Effect, 2023’te piyasaya sürdüğü Monica adlı dijital asistanın ardından, Manus ile küresel kullanıcı kitlesini hedefliyor. Arayüz dili olarak İngilizce tercih edilmiş ve platform sade bir tasarımla hazırlanmış. Kullanıcılar, davet koduyla sisteme giriş yaptıktan sonra ChatGPT ya da DeepSeek benzeri bir ana sayfaya yönlendiriliyor. Önceki oturumların listelendiği bir kenar çubuğu, merkezde yer alan sohbet kutusu ve örnek görevlerin sunulduğu bir ana ekran mevcut.
Sistemde öne çıkan unsurlardan biri, “Manus’s Computer” adlı bir pencere üzerinden ajanın attığı her adımı anlık olarak takip edebilme ve gerektiğinde müdahale edebilme imkânı sunması. Kullanıcı, sürecin nasıl yürüdüğünü izleyebiliyor, gerektiğinde görev akışına doğrudan katkıda bulunabiliyor.
Üç farklı görevle test edilen Manus AI’ın performansı, beklentilere göre değişkenlik gösterdi. İlk görevde, Çin teknoloji basınını takip eden gazetecilerin listesini hazırlaması istendi. Manus, başlangıçta yalnızca birkaç isme yer verdi, bazı gazetecilerin çalışmalarını ayrıntılı biçimde belirtirken diğerlerini atladı. Sisteme neden böyle davrandığı sorulduğunda, “araştırma sürecini hızlandırmak için tembelleştiğini” açıkça ifade etti. Geri bildirim sonrasında ise 30 kişilik, kurum bilgileri ve önemli yazıları içeren daha kapsamlı bir liste sundu. Ayrıca çıktıların Word ya da Excel formatında indirilebilir olması, kullanışlı bir özellik olarak öne çıktı. Ancak bazı içeriklerin erişiminde captcha ve erişim engeli gibi teknik sorunlarla karşılaştığı da not edildi.
İkinci görev, New York City‘de iki odalı daire arama üzerineydi. Kullanıcı, açık mutfak, dış mekâna erişim, Manhattan’a ulaşım kolaylığı ve tren istasyonuna yakınlık gibi detaylı kriterler verdi. Başlangıçta “dış mekân erişimi” tanımını fazla katı yorumlayan Manus, sadece teras veya balkonlu evleri sıraladı. Ancak detaylı yönergelerle güncellenmiş ve sınıflandırılmış (en iyi değer, lüks seçenek vb.) bir liste üretmeyi başardı. Görev süresi 30 dakikanın altında tamamlandı.
Üçüncü görev olan Innovators Under 35 aday listesinin hazırlanması ise daha karmaşık bir yapıdaydı. Manus, geçmiş yılların verilerini inceleyerek kriter belirledi, arama stratejisi oluşturdu ve adayları derlemeye çalıştı. Ancak açık erişimli veriler dışında akademik makaleler ya da ödül duyurularına ulaşırken ciddi zorluklar yaşadı. İlk üç saatin ardından yalnızca üç tam profil sunabildi. Genişletilmiş liste talep edildiğinde ise alan çeşitliliği kısıtlı, belirli akademik kurumların ağırlıkta olduğu 50 kişilik bir liste oluşturdu. Çin’den beş isim istenmesi üzerine, medyada sık yer alan tanıdık isimlerin yer aldığı bir liste sundu. Sisteme verilen metinler arttıkça “yüksek hizmet yoğunluğu nedeniyle görev oluşturulamıyor” uyarısının ekrana yansıdığı görüldü.
Tüm bu deneyimlere rağmen Manus’un bazı güçlü yönleri de var. Kullanıcının verdiği talimatları “bilgi” olarak hafızasında tutması, sonraki adımlarda bu bilgileri hatırlayarak görevlerini sürdürmesi, kişiselleştirilmiş bir deneyim sunuyor. Her oturumun paylaşılabilir ve yeniden izlenebilir olması da sistemin şeffaflığına katkı sağlıyor.
Yapılan değerlendirmeye göre, Manus en iyi sonuçları internet üzerindeki açık kaynaklardan bilgi toplayarak yapılabilecek analiz odaklı görevlerde veriyor. Henüz istikrar sorunu yaşıyor olsa da, Manus AI’ın baş bilim insanı Peak Ji, bu problemlerin farkında olduklarını ve çözüm sürecinin devam ettiğini belirtiyor. 36Kr adlı Çin merkezli medya kuruluşuna göre Manus’un işlem başı maliyeti yaklaşık 2 dolar ve bu rakam DeepResearch’in onda biri seviyesinde. Altyapı sorunları aşıldığında, bireysel kullanıcılar ve küçük ekipler için cazip bir araç haline gelebileceği değerlendiriliyor.
Manus AI’nin Temel Özellikleri
Özellik | Açıklama |
---|---|
Geliştirici Şirket | Butterfly Effect (Çin, Wuhan merkezli) |
Ülke | Çin |
Ürün Türü | Genel Yapay Zekâ Ajanı |
Dil Desteği | Varsayılan dil: İngilizce |
Yapay Zekâ Modelleri | Claude 3.5 Sonnet, özelleştirilmiş Qwen (Alibaba tabanlı) |
Çalışma Sistemi | Birden fazla model ve otonom ajanla görev yürütme |
Kullanıcı Arayüzü | Chat tabanlı, sol menüde geçmiş görevler, ortada sohbet kutusu |
Öne Çıkan Özellik | “Manus’s Computer” ile görev takibi ve müdahale imkânı |
Dosya Dışa Aktarım | Word ve Excel dosyası olarak çıktılar alınabiliyor |
Görev Yetenekleri | Araştırma, strateji geliştirme, öneri listeleri oluşturma |
Erişim Durumu | Davet kodu ile sınırlı giriş; %1’den az kullanıcı erişebildi |
Topluluk | Discord kanalı 186.000’den fazla üyeye sahip |
Kararlılık | Yüksek hizmet talebinde sistem çökmesi ve donmalar görülebiliyor |
Maliyet | Görev başı ortalama maliyet: 2 USD |
Geliştirici Yorumu | İyileştirme süreci devam ediyor (Peak Ji açıklaması) |
Kullanıcı Profili | Bireysel kullanıcılar, bağımsız geliştiriciler, küçük ekipler |