Samsung'un yeni teknolojisi: Mona Lisa konuşsun

Mona Lisa'nın bir gün sadece gizemli bir şekilde gülümsemeyeceğini, aynı zamanda göz kırpıp sizinle konuşacağını hiç düşündünüz mü?

Sadece Mona Lisa değil, Marilyn Monroe da "yaşadı". Dudakları kırmızı olur olmaz konuşmaya başladı, gözlerinin köşeleri ve kaşları büyüleyiciydi.

Bir de sadece fizik kitaplarında görülen Einstein var, hatta bilimsel ilkelerin ağzından döküldüğünü hissedebiliyorsunuz ...

Şimdi, bunun bazı özel efekt videolarının ekran görüntüsü olduğunu düşünebilirsiniz, ancak aslında bu karakterlerin dinamik videoları yalnızca bir sonraki fotoğraftan türetilmiştir.

Samsung AI Merkezi ve Moskova Skolkovo Bilim ve Teknoloji Enstitüsü'nden araştırmacılar, bu "Portre Fotoğrafı Değişimi Dinamik Emoji" AI sistemini başarıyla geliştirdiler ve araştırmalarını 20 Mayıs'ta ArXiv.org web sitesinde duyurdular. Sonuçlar.

Birkaç gün önce, çok fazla gürültü çıkaran "pornografik yüz değişikliği", yeni bir kompozit video oluşturmak için çok sayıda karakter görüntü bilgisi ve yerel video gerektiriyordu.Bu sefer Samsung AI'nın yalnızca bir portre fotoğrafına veya bir portreye dayanması gerekiyor. İçerideki karakterlerin yüz ifadelerini canlandırabilir.

Mükemmel olmasa da doğru olduğuna insanları inandırmak yeterlidir.

Bu videoyu yapmak kolay değil.

İnsanın görsel düşüncesi yüz detaylarına son derece duyarlı olduğu için, ağzın eğriliği, saçın çevresi ve göz kırpma hızı da dahil olmak üzere her küçük parçanın göz ardı edilmesi zordur. Yani bu yapay zeka sistemi uzun bir eğitim sürecinden geçti.

Araştırmacılar, YouTube'dan 7.000 ünlü fotoğrafı topladı, "ikonik" yüz özelliklerini çıkardı ve ardından sistem, çok sayıda insan konuşan yüzleri ve etkileyici videolar izleyerek öğrendi.

`` Fotoğrafları hareket ettirme '' nin öğrenme çerçeve diyagramı

Bunun ardından yapay zeka sistemi öğrenilen içeriği tek bir fotoğrafa veya birden fazla fotoğrafa uygulayabilir, sistem tarafından öğrenilen yüze karşılık gelen kısmı verimli bir şekilde bulabilir ve ardından yeni yüzdeki her bir kilit noktayı kişiden kişiye hedefleyebilir. Özellikle gözler, burun ve ağız en doğal dinamik etkiyi sağlayacak şekilde ayarlanmıştır.

Ne kadar çok fotoğraf kullanırsanız, video o kadar gerçekçi olur. Videonun gerçek görünmesi için 32 resim yeterlidir.

Dikkatlice bakmanıza rağmen, karakterlerin kenarlarında hala bulanık kısımlar var ve tanınmayan alanlar sadece kaba arka plan görüntüleriyle doldurulabiliyor.Marilyn Monroe'nun videosunda hala ikonik köstebek yok. Üstelik videonun sesi yok ve dinamikleri sadece yüzünde sunulabiliyor. Ağzın köşeleri bir stajyer Rap şarkısı gibi ama yine de yıkıcı bir yenilik. Basitçe söylemek gerekirse, JPG'nin tek tıkla GIF'e dönüştürülmesini gerçekleştirdi.

Araştırmacılar, gelecekte bu AI sisteminin video, oyun, TV, film ve özel efekt endüstrilerinde yaygın olarak kullanılacağını ve B istasyonundaki hayalet sanatçılar tarafından hedef alındığı tahmin ediliyor. Tek bir veya birkaç fotoğrafın dinamik bir portreyi tamamlayabileceği hız ve verimlilik, modeli tanıtıma daha elverişli hale getiriyor.

Bununla birlikte, bu aynı zamanda yakında onu taklit etmek, kitleleri yanıltmak veya sahtekarlık yapmak için doğaçlama araçları kullanmak için komplo kuranların olacağı ve bir kişinin portre fotoğrafından tarif edilemez dinamik bir ifade yaratmanın da mümkün olacağı anlamına geliyor. Tarif edilen vücut üzerinde tarif edilemez şeyler yapın.

Deepfakes'in "pornografik yüz değiştiren" fırtınasına neden olmak yeterli olmasa da, kullanımı "pornografik yüz değiştirmeye" göre daha kolay ve daha rahat ... Herkesin maruz kaldığı internet çağında endişelenmek gereksiz değil, sadece şimdi. Çok erken.

Şu anda, araştırma hala basit test aşamasında ve karmaşık sinir ağı modelinin hafifletilmesi gerekiyor. Ancak Harry Potter, Hogwarts Cadılık ve Büyücülük Okulu'na ilk kez gittiğinde ve yaşayan taş duvar portresini görünce şaşırdığında, şimdi gerçek oldu.

Bundan sonra bizi bekleyen büyülü bir dünya.

Zhejiang yenilikçi endüstri sinerji modeli, "entegre" gelişimi teşvik etmek için üst düzey bir platform inşa ediyor
önceki
Şimdi NASA adınızı Mars'a gönderebilir
Sonraki
Hengdian'da iki yeni özel müze, gelecekte 47 müze inşa edilecek
Apple, MacBook Pro'nun klavyesine yeni değişiklikler getirmek için bu iki detayı ayarladı
Metro, yolcuların cep telefonlarını takip etmek için Wi-Fi kullanabilir mi? kabul edebilirmisin?
İFLYTEK arka arkaya 5 yeni ürün yayınladıktan sonra "uçabilir mi"?
Özel bir yaz gezisi için Yuhuan'a gelin, birçok karakteristik rota ve interaktif aktivite deneyimlemenizi bekliyor
OPPO K3 piyasaya çıktı: 1.500 yuan dosya başka bir oyuncu ekliyor
Spor ayakkabı dışında, sokak kültürünün moda endüstrisi üzerindeki diğer etkileri nelerdir?
Hedef 1 milyar yuan! Tatlı Tonglu, başka bir "ulusal marka" unvanını başlattı
Meizu 16Xs'in davet mektubunun yorumu: Bu yeni ürün, "trend" ve "gerçek benlik" arasındaki bir dengedir.
İlçelerde ulusal turizm rekabet gücünün en iyi 100 listesi! Zhejiang'da 15, Taizhou'da 4 koltuk
Deneyim Alar'a Ulaşın: Bu günün çok uzun olduğunu ve günün yaklaşık 3 saat uzadığını hissediyorum
Arkadaş çevrenizdeki en iyi resim! Nokia'nın aynı retro metin mesajlarını ve duvar kağıdını yapmak için 30 saniye
To Top