Yapay zeka alanında önemli gelişmeler yaşanmaya devam ediyor. OpenAI‘nin yüksek kaliteli AI video üretim modeli Sora‘nın yeni demo örneklerini yayınlamasıyla sektördeki heyecan bir kez daha alevlendi. Ancak Sora henüz halka açık değilken, mevcut AI video üretici şirketler de boş durmuyor. Bugün, Pika isimli rakip şirket, ödeme yapan aboneleri için Lip Sync adında yeni bir özellik sunduğunu duyurdu.
Bu özellik, kullanıcıların videolarına ayrı bir generatif ses girişimi olan ElevenLabs tarafından üretilen AI destekli seslerle konuşma diyalogları eklemelerine olanak tanıyor. Aynı zamanda, konuşan karakterlerin ağız hareketlerinin diyalogla eş zamanlı olarak animasyonunu sağlayarak eşleştiriyor.
Pika konuyla ilgili olarak şunları söyledi: “Son zamanlarda yapay zeka üretilen videolar hakkında çok konuşuldu. Bakın şimdi kim konuşuyor! Lip Sync‘e Pro kullanıcıları için erken erişim şimdi pika.art adresinde mevcut. Bu özelliğin ses üretim kısmını güçlendiren @elevenlabsio arkadaşlarımıza (kelimenin tam anlamıyla) bağırmak istiyoruz.”
ElevenLabs‘ı kullanarak, Pika Lip Sync özelliği hem metinden sese hem de yüklenen ses parçalarını destekliyor. Bu, bir kullanıcının Pika AI tarafından üretilen video karakterlerinin ne söyleyeceğini yazarak veya kaydederek ve bunu söyleyen sesin tarzını değiştirerek yapabileceği anlamına geliyor.
Yukarıda belirtildiği üzere, bu özellik şimdilik “erken erişim” kapsamında Pika Pro kullanıcılarına (ayda 58 dolarlık bir abonelik teklifi, 12 ay peşin olarak 696 dolar) veya Pika‘nın Discord grubu üzerinden sunulan “Süper İşbirlikçiler” davetiye ile sınırlı program üyelerine sınırlı.
Tam AI Anlatı Filmlerine Doğru Büyük Bir Engel Kalkıyor
Pika‘nın AI ürettiği videolar, belki OpenAI‘nin Sorası veya başka bir rakip AI video üretici girişimi Runway kadar yüksek kaliteli ve “gerçekçi” olmasa da, Lip Sync özelliğinin eklenmesi, geleneksel film yapım yazılımlarına karşı yıkıcı kabiliyetler sunma konusunda onu öne çıkarıyor.
Lip Sync ile Pika, AI’nin daha uzun anlatı filmleri oluşturmak için kullanışlı olmasının önündeki son engellerden birini ele alıyor. Diğer önde gelen AI video üreticileri, henüz bu özelliği yerleşik olarak sunmuyor.
Bunun yerine, AI videoları içinde konuşan diyalog ve eşleşen dudak hareketlerini eklemek isteyen kullanıcılar, sonuçta videonun “düşük bütçeli” ve Monty Python tarzı bir kaliteye sahip olmasına neden olan üçüncü taraf araçlar ve post prodüksiyonda zahmetli eklemelerle yetinmek zorunda kaldı.
Ayrı ayrı ancak bir şekilde ilişkili olarak, bu hafta Runway de Multi Motion Brush özelliğini güncelledi. Bu özellik, kullanıcıların videolarındaki farklı nesne ve manzaralara beş bağımsız hareket yönü eklemelerine olanak tanıyan ve geçen ay tanıtılan bir özellikti. Şimdi, Runway harekete uygulanacak farklı nesneleri otomatik olarak vurgulayıp seçmeye çalışacak bir bölge tespiti ekliyor, kullanıcılar istedikleri takdirde hala elle “boyayarak” bunu yapabilir.
Pika ayrıca kullanıcıların videolarının bileşenlerini düzenlemelerine ve tuvali genişletmelerine olanak tanısa da, şu anda benzer bir “fırça” aracı sunmuyor, bu da hareket kontrollerini daha az ayrıntılı hale getiriyor.
AI Video Eğitim Verileri Etrafında Endişeler ve Sorular Devam Ediyor
Yeni Pika özelliği hakkında herkes heyecanlı değil. Yeni bir AI sertifikasyon kar amacı gütmeyen kuruluşu olan Fairly Trained‘in CEO’su ve kurucusu olan, aynı zamanda Stability AI‘de Audio Başkan Yardımcısı olarak görev yapmış Ed Newton-Rex, Pika‘nın video modelini ne üzerinde eğittiği konusunda X üzerinden sormak için Lip Sync özelliğinin yayınlanmasını bir fırsat olarak kullandı.
Bu soru ve endişelere rağmen, video AI üretici şirketler yeni özelliklerin ve giderek daha yüksek kaliteli video üretimlerin tanıtımını yapmaya devam etmede yavaşlama belirtisi göstermiyor. Bu, bu teknolojinin kullanıcıları için iyi bir haber olsa da, aralarında Tyler Perry gibi isimlerin de bulunduğu profesyonel film yapım topluluğunda endişelere neden oluyor. Perry, Sora tarafından üretilen videoları gördükten sonra planlanan 800 milyon dolarlık prodüksiyon stüdyosu genişletmesini durdurma kararı aldığını duyurduğunda geniş çapta eleştirilmişti. Tech’in iş kayıplarına yol açacağını öngördüğünü belirtmişti.