Xin Zhiyuan Rehberi Harry Potter'ın Hogwarts'a duvardaki hareketli ve konuşan resimleri görmek için ilk geldiğinde ne kadar şaşırdığını hatırlıyor musunuz? Ya asılı tabloyu "diriltebilseydik" ve Mona Lisa ile 500 yıl önce zaman ve mekan aracılığıyla bir diyalog kurabilseydik? AI teknolojisi sayesinde, "diriltmek" resim artık bir rüya değil!
Ünlü tablo "Mona Lisa'nın Gülüşü" hareket edecek!
Mona Lisa başını çevirdi, ağzında bir şey söyledi, hafifçe gözlerini kırparak yüzünde nazik bir gülümsemeyle.
Evet, "Harry Potter" dünyasındaki "hareketli tablo" gerçek oldu! Moskova'daki Samsung AI Merkezi ve Skolkovo Bilim ve Teknoloji Enstitüsü'nden bir grup araştırmacı, JPEG'i GIF'e dönüştürebilen bir AI sistemi geliştirdi.
Harry Potter'daki Gryffindor Akademi salonunu koruyan şişman kadının portresi
Daha da harika olan şey, teknolojinin hiç 3D modelleme gerektirmemesi ve canlı animasyonlar üretmek için yalnızca bir resmin eğitilebilmesidir. Araştırmacılar bu öğrenme yöntemine "az sayıdaki öğrenme" adını veriyor.
Tabii ki, hareketli bir resim efekti oluşturmak için daha fazla fotoğraf (8 veya 32) varsa, daha gerçekçi olacaktır. gibi:
Einstein size fizikten bahsediyor:
Marilyn Monroe ve sen flört ediyorsun:
Bu hafta, Samsung AI Lab araştırmacıları, bu teknolojiyi özetleyen "Gerçekçi Nöral Konuşan Kafa Modellerinin Birkaç Çekişmeli Çekişmeli Öğrenimi" başlıklı bir makale yayınladı. Bu teknoloji, evrişimli bir sinir ağına dayanmaktadır ve amacı, bir giriş kaynağı görüntüsü elde etmek ve hedef çıkış videosundaki bir kişinin hareketini simüle etmek, böylece ilk görüntüyü konuşan kişinin kısa bir videosuna dönüştürmektir.
Makale yayınlanır yayınlanmaz bir sansasyon yarattı, sonuçta bu teknoloji hayal gücü için dev bir alan yarattı!
Bunun gibi birçok proje var, bu yüzden bu fikir özellikle yeni değil. Ancak bu makaledeki en ilginç şey, sistemin çok sayıda eğitim örneği gerektirmemesi ve sistemin çalıştırmak için resme yalnızca bir kez bakması gerektiğidir. Bu yüzden "Mona Lisa" yı hayata geçiriyor.