Google'ın DeepMind ekibi, en son yapay zeka teknolojisini dünyaya getirmeye kararlıdır. Go dünyasını sarsan AlphaGo, "emekliliğini" ilan etse de DeepMind'in yapay zeka araştırma ve geliştirme çalışmaları hiç durmadı.
Son zamanlarda yeni bir sonuç elde ettiler: Araştırmacılar, yapay zekalarının İnsanlar tarafından girilen cümlelere göre resimler oluşturun .
Bu teknikte cümlenin içeriği ne kadar detaylı olursa, resim o kadar detaylı oluşturulur. Bu, şüphesiz AI görüntü işleme alanında büyük bir atılımdır .
Şekil 4 * 4 düşük çözünürlüklü resimleri 256 * 256 yüksek çözünürlüklü resimlere dönüştürün
Ağ programlarının gerçekçi resimler ürettiği sahneler, bilim kurgu filmleri "Blade Runner" ve "Crime Scene Investigation" gibi film ve televizyon çalışmalarında yer aldı. Googleın İngiliz bilim adamları Şubat 2017de görüntüleri "geliştirme" için yeni bir yöntem geliştirdi. İşlenen görüntüler, film ve televizyon dizilerinde sunulan efektlere çok yakın. Ancak o zamanki yöntem şuna dayanıyordu: PixelCNN (Pixel Convolutional Neural Network), makine düşük çözünürlüklü resimleri mükemmel yaklaşım algoritmaları aracılığıyla başarıyla yüksek çözünürlüklü resimlere dönüştürdü.
Şekil Resim geliştirme süreci
Piksel evrişimli sinir ağı, doğal görüntülerin yoğunluk tahmininde en yüksek seviyeye ulaştı. Ancak eğitim çok hızlı olsa da, Çıkarım yapan ama pahalı Bunun nedeni, her pikselin tahmin edilmesinin bir sinir ağı gerektirmesidir; o zaman N piksel için karmaşıklık O (N) 'dir. Önbelleğin etkinleştirilmesi bu işlemi hızlandırabilir, ancak yine de her pikseli tek tek işlemesi gerekir.
Şekil Sol üst köşe piksel grubu 1, sağ üst köşe piksel grubu 2, vb. Netlik sağlamak için, anlık bağımlılıkları belirtmek için yalnızca ok işaretleri kullanılır, ancak bir gruptaki tüm piksellerin belirli bir gruptaki tüm pikseller için kullanılabileceğini unutmayın. Örneğin, 2. gruptaki tüm pikseller 4. gruptaki pikselleri tahmin etmek için kullanılacaktır.
Bu problem, bu yeni algoritmada çözülmüştür. Paralel piksel evrişimli sinir ağı, belirli pikselleri koşullu olarak bağımsız bir modelde birleştirerek çıkarımları daha etkili hale getirebilir. Yeni piksel evrişim modeli, etkili yoğunluk tahmini ve hızda bir büyüklük sırası iyileştirme sağlar Test için kullanılan 512 × 512 örnek resimlerde karmaşıklık O (log N) değerine ulaşır.
Şekil "Kahverengi bir atın sırtına binen genç bir adam" girilirken, AI, resim setindeki bilginin her bir kısmına karşılık gelen görüntüyü tanımlayabilir ve resmin alt kısmı, onun tarafından tanımlanan "kahverengi at" dır.
Artık bu teknoloji, metinleri resimlere dönüştürmek için uygulanıyor, bu resim koleksiyonlarıyla öğrenilebilir, kuşlar ve insan yüzleri gibi kavramları ayırt edebilir ve Öğrendiğiniz resimlerden önemli ölçüde farklı görüntüler oluşturun .
Dahası, ayrıntılı bir hatırlatıcı, resimleri herhangi bir ayrıntı içermeyen bir hatırlatıcıdan daha doğru bir şekilde verebilir. Örneğin, "siyah başlı, turuncu gözlü ve ağzı olan sarı bir kuş" girerseniz, yapay zeka çok detaylı bir resim verecektir.