Tavus’tan gerçek zamanlı insan render modeli: Phoenix-4

Batmantv.net

Yayınlama: 20.02.2026

A⁺

A^-

Yapay zeka ile kişiselleştirilmiş videolar oluşturan girişim Tavus‘u sizlere daha önce tanıtmıştık. Bu hafta Tavus, gerçek zamanlı bir insan render modeli olan Phoenix-4’ü tanıttı. Model, bütünsel yüz ifadeleri olan, konuşma sırasında duygular arasında geçiş yapabilen ve bağlamsal tepkilerle aktif olarak dinleyebilen yapay zeka avatarları oluşturabiliyor.

Binlerce saatlik gerçek insan konuşmalarıyla eğitilmiş olan Phoenix-4, her karede yüz ve başın her pikselini sıfırdan oluşturuyor. Model, 10’dan fazla duygusal durumu ve bunlar arasındaki geçişleri gerçek zamanlı olarak işliyor. Böylece konuşmalar sırasında uygunsuz tepkiler veya ifadelerden kaçınıyor.

Şirket, Phoenix-4’ü, duygusal durumları, aktif dinleme davranışını ve sürekli yüz hareketlerini tek bir birleşik sistem olarak üreten ve kontrol eden ilk gerçek zamanlı model olarak tanımlıyor. Canlı video görüşmelerinin akıcılığına odaklanan Model, 1080p’de 40 fps hızında çalışıyor.

Phoenix-4, binlerce saatlik insan konuşma verisiyle eğitilmiş hibrit Gauss difüzyon mimarisi üzerine inşa edildi. Bu mimaride, yerleşik bir davranış modeli yüz ve başın tüm parçaları arasındaki ilişkiyi öğrenerek bunları dolaylı olarak kontrol ediyor.

Phoenix-4’ün öne çıkan yetenekleri

Phoenix-4, mutluluk, üzüntü, öfke, şaşkınlık, tiksinti, korku, heyecan, merak ve memnuniyet dahil olmak üzere 10’dan fazla duygu durumu arasında kesintisiz geçişlerle gerçek zamanlı olarak duygusal durumlar oluşturuyor ve bunları kontrol ediyor. Duygusal iletimi doğrudan LLM ve komutlarınızla yönlendirebileceğinizi belirtelim. Bunun yerine modelin bağlamsal olarak kendi başına yanıt vermesine müsade etmeniz de mümkün. Şirket, modelin algılama için Raven-1 ile eşleştirildiğinde, duygu tepkilerinin kullanıcının tonu, ifadesi ve niyetinden etkilenerek daha da yüksek doğruluk sağladığını belirtiyor.

Phoenix-4, konuşma ve dinleme gibi durumlarda doğal ve belirgin ifadelerle duyguyu yansıtmanın ötesinde onaylayarak başını sallayabilir. Aynı şekilde hayal kırıklığına tepki olarak şaşkınlık veya endişe gösterebileceği gibi merakını da ifade edebiliyor. Modelin ürettiği konuşma ve dinleme durumları, enterpolasyon, ani geçişler ve döngüsel görüntüler olmadan geçiş yapıyor. Her karenin tamamen oluşturulduğu bu yaklaşımda kullanıcılar geçişi fark etmiyor.

Baş hareketi, yanaklar, kaşlar, dudaklar, alın, göz bakışı ve hatta göz kırpmaları, model tarafından bağlamsal olarak kontrol ediliyor. Böylece avatarın kimliği korurunurken hem ince mikro ifadeler hem de cesur makro ifadeler mümkün hale geliyor. Bunlara ek olarak modelin, doğal mikro ifadeler ürettiğini belirtelim. Bu ifadeler, programlanmış durumlardan ziyade, çok sayıda gerçek, duygusal veriden öğrenilen temsillerden ortaya çıkıyor.

Geliştiriciler modeli, Tavus platformu, API’ler, PAL’ler ve 40’tan fazla yeni replika içeren güncellenmiş Stock Replica kütüphanesi aracılığıyla kullanabilir. Bu teknoloji, sağlık, eğitim ve satış kullanım senaryoları için tercih edilebilir.

Batmantv.net

Benzer Konular

Proaktif hukuki danışmanlık ve hukuki uyum (compliance) alanında yeni bir teknoloji: Lexnavi

Türkiye’de kurumsal şirketlerin dijitalleşme süreçlerinin hızlanmasına karşın, hukuk hizmeti sunucuları bu dönüşüme ayak uydurmakta güçlük yaşıyor. Özellikle regülasyon yoğun sektörlerde faaliyet gösteren şirketler; uyum süreçlerinin hem sürdürülebilir hem de ölçülebilir bir yapıya kavuşmasını öncelikli ihtiyaç olarak tanımlıyor. Bu tablo, avukatların ve hukuk bürolarının da geleneksel çalışma biçimlerini yeniden düşünmelerini gerektiriyor....

03.12.2025

iPhone 17 ailesi, 9 Eylül tarihinde tanıtılacak

Yeni iPhone modellerinin her yıl olduğu gibi Eylül ayında tanıtılabileceğini geçtiğimiz dönemlerde pek çok kez sizlere aktarmıştık. Apple tarafından yapılan açıklama ile birlikte iPhone 17 ailesinin tanıtılacağı etkinliğin tarihi belli oldu. iPhone 17 ailesi, 9 Eylül Salı günü düzenlenecek bir etkinlikle birlikte tanıtılacak. Fiziksel katılımla gerçekleşecek olan etkinliğin her zaman olduğu...

26.08.2025

Yapay Zeka Gündemi #34 – Webrazzi

Yapay zeka ekosistemi bu hafta yeni modellerden donanıma, alışveriş özelliklerinden yatırımlara uzanan geniş bir yelpazede adeta hız kesmeden ilerledi. Büyük teknoloji şirketleri hem kapasiteleri artıran yeni modellerini tanıttı hem de üretkenlikten bilimsel keşiflere kadar birçok alanda oyunu değiştirecek gelişmeleri duyurdu. Yeni modeller Anthropic, Claude serisinin yeni modeli Opus 4.5’i kullanıma...

28.11.2025

Google, sesli asistanın izinsiz dinleme iddialarını 68 milyon dolarlık uzlaşmayla kapattı

Sesli asistanlar günlük hayatın ayrılmaz bir parçası haline gelirken bu teknolojilerin arka planda nasıl çalıştığı ve hangi verileri topladığına dair soru işaretleri de büyüyor. Büyük teknoloji şirketlerinin kullanıcı verilerini hangi sınırlar içinde kullandığı uzun süredir tartışma konusuyken Google cephesinden gelen yeni bir uzlaşma bu tartışmaları yeniden gündeme taşıdı. Google, Google...

27.01.2026

Foxconn, yapay zeka yatırımlarının hızlanmasıyla gelirini yüzde 22 artırdı

Foxconn, yapay zeka donanımlarına yönelik artan küresel talebin etkisiyle 2025’in son çeyreğinde beklentilerin üzerinde bir finansal performans sergiledi. Şirketin geliri, geçen yılın aynı dönemine göre yüzde 22 artarak 2,6 trilyon Tayvan doları (yaklaşık 83 milyar dolar) seviyesine ulaştı. Açıklanan rakam, hem piyasa beklentilerinin hem de Foxconn’un daha önce paylaştığı öngörülerin...

05.01.2026

Google Labs’ten küçük çaplı yapay zeka uygulamaları geliştirmek için yeni araç: Opal

Google, yapay zeka destekli küçük uygulamalar oluşturmayı kolaylaştıran yeni bir deneysel aracını tanıttı. Opal adı verilen bu araç, kullanıcıların doğal dil komutları ve görsel düzenleme arayüzüyle, herhangi bir kod yazmadan yapay zeka uygulamaları oluşturmasını sağlıyor. Şu an için yalnızca ABD’deki kullanıcıların erişebildiği Opal, herkese açık beta olarak sunuldu. Kod yazmadan...

25.07.2025

Bir Yorum Yazın

[ Yoruma cevap yazmaktan vazgeç ]

Ziyaretçi Yorumları - 0 Yorum

Henüz yorum yapılmamış.