Nvidia destekli AI girişimi, insani duyguları ifade eden avatarları yayınladı

Teknoloji ve yapay zeka alanında geçmişi olan bir kripto yatırımcısı olarak Synthesia’nın yapay zeka avatarlarındaki son yükseltmesi beni heyecanlandırıyor. Onların “İfade Edici Avatarları”, işletmelerin dijital yollarla iletişim kurma biçiminde devrim yaratma potansiyeline sahiptir.


Nvidia’dan destek alan Synthesia adlı bir yapay zeka şirketi yakın zamanda bir geliştirmeyi duyurdu. Bu güncelleme, yapay zeka tarafından oluşturulan avatarların insan duygularını ve eylemlerini daha özgün bir şekilde ifade etmesine olanak tanır.

25 Nisan’da şirket “Duygusal Metin Odaklı Avatarlar”ı tanıttı. Bu avatarlar, metinsel komutlara yanıt olarak duyguları iletmek üzere tasarlanmıştır; bu da onları kurumsal sunumlarda, pazarlama materyallerinde ve eğitim oturumlarında kullanıma uygun hale getirir.

Yapay zekadaki en son gelişmeleri inceleyen bir araştırmacı olarak çığır açıcı bir dönüm noktasına ulaştığımızı paylaşmaktan büyük heyecan duyuyorum. Yapay zeka avatarları ilk kez konuşulan sözlerin ardındaki anlamı anlayabiliyor.

— Synthesia (@synthesiaIO) 25 Nisan 2024

OpenAI Sora’nın video oluşturma kapasitesi, gerçeğe yakın hareketli görseller üretmesiyle ünlüdür.

Yapay zekanın sınırlamaları var, özellikle konu insanları özgün bir şekilde tasvir etmeye gelince. AI, özelliklerini ve hareketlerini doğru bir şekilde sunmak yerine, çarpık vücut parçaları, uyumsuz arka planlar veya konuşulan kelimelerle yanlış hizalanmış dudaklar sunabilir.

En yeni güncellemesinde Synthesia, üretim sürecinde gerçek insan senaryo okuyucularını kullanarak botlar için dudak senkronizasyonunu ve duygusal doğruluğu geliştirmeye odaklanıyor.

Gelişmiş yapay zeka üzerinde çalışan bir araştırmacı olarak, Synthesia’nın CEO’su ve kurucu ortağı Victor Ribarbelli’nin ilgi çekici bir açıklamasına rastladım. Yakın zamanda yayınladığı bir videoda, avatarların gelişiminde önemli bir boşluğun altını çizdi: İnsanlar doğal olarak yüz ifadeleri yoluyla aktarılan duyguları anlayıp bunlara tepki verirken, avatarlar bu yetenekten yoksundu. Basitçe söylemek gerekirse, şimdiye kadar avatarlar söylediğimiz sözlerin ardındaki anlamı kavrayamadılar ve bu da onların duygusal zekasını engelledi.

Stüdyo ortamında bireylere basit ipuçlarına yanıt olarak mutluluk, üzüntü ve hayal kırıklığı gibi temel duyguları uygun yüz ifadeleri ve ses tonlarıyla doğru bir şekilde ifade etmeleri öğretildi.

Bir kripto yatırımcısı olarak, en son avatar güncellemelerinin etkileyici özelliklerle birlikte geldiğini paylaşmaktan heyecan duyuyorum. Artık 130’dan fazla dilde erişilebilir durumdalar ve bu da daha çeşitli ve kapsayıcı bir kullanıcı deneyimi sağlıyor. Ayrıca bu avatarlar, tüm kullanıcılar için net bir iletişim sağlayacak şekilde kendi altyazılarını oluşturma yeteneğine sahiptir. Ve eğer bu yeterli değilse, yaratıcılarının seslerini bile taklit ederek her etkileşime kişiselleştirilmiş bir dokunuş katabilirler.

Synthesia’nın web sitesinde İngilizce dışındaki Fransızca, Almanca ve İspanyolca gibi konuşulan dilleri gösteren avatar modelleri arasında, CryptoMoon tarafından yürütülen değerlendirmeye göre İngilizce dil modeli, en yüksek düzeyde gelişmişlik ve insan konuşmasına benzerlik sergiliyor.

Bir araştırmacı olarak bu girişim hakkında ilgi çekici bilgilere rastladım. Raporlara göre Fortune 100 şirketlerinin en az yarısının onların müşterisi olduğu söyleniyor ki bu oldukça etkileyici bir başarı. Ayrıca toplamda 55.000’den fazla işletmeye hitap etmektedirler. Bu çeşitli müşteri kitlesi çeşitli endüstrileri kapsamaktadır ve diğerlerinin yanı sıra Zoom, Xerox, Microsoft ve Reuters gibi önemli isimleri içermektedir.

2017 yılında kurulan Synthesia, önemli bir büyüme kaydeden İngiltere merkezli bir teknoloji şirketidir. Geçtiğimiz yıl yapay zeka (AI) teknolojisindeki artışla birlikte şirketin değerlemesi 1 milyar dolara yaklaştı. Yapay zeka yarı iletken çip üretiminde lider bir oyuncu olan Nvidia da dahil olmak üzere önemli yatırımcılar Synthesia’yı destekledi.

Özellikle iş uygulamaları için gerçekçi, insan benzeri avatarlar oluşturmaya odaklanan Synthesia, OpenAI’nin ChatGPT’si ve Google’ın Gemini chatbot’u gibi daha geniş bir yaklaşımı benimseyen diğer chatbot modellerinin karşılaştığı bazı heyecanlardan ve yoğun rekabetten kaçınmayı başardı.

2024-04-26 15:11