Son zamanlarda, Çin Bilimler Akademisi Otomasyon Enstitüsü'nün Akıllı Algılama ve Hesaplama Araştırma Merkezi, yüz tanıma görevlerindeki en klasik pozların üstesinden gelmek için yüzleşme ağlarının oluşturulmasına dayanan yüksek doğrulukta bir poz değişmez modeli (HF-PIM) önerdi. Tutarsızlık sorunları. Deneysel sonuçlar, bu yöntemin kıyaslama veri setindeki görsel efektleri ve nicel performans göstergelerinin, yüzleşme oluşturma ağlarına dayalı mevcut en iyi yöntemlerden daha iyi olduğunu göstermektedir. Ek olarak, HF-PIM tarafından desteklenen oluşturulan görüntülerin çözünürlüğü, orijinal yönteme göre iki katına çıkarılır. Bu makale Nöral Bilgi İşleme Sistemleri Konferansı'na (NIPS) dahil edildi.
Generative Adversarial Networks'ün önerisi, derin sinir ağlarından sonra devrim niteliğinde yeni bir gelişmedir. Massachusetts Institute of Technology Review (10 Breakthrough Technologies 2018) tarafından 2018'de "En İyi On Küresel Çığır Açan Teknolojiden" biri olarak seçilmiştir. Son birkaç yılda listede yer alan teknolojilere dönüp baktığımızda, listede 2008'de makine öğrenimi, 2009'da Siri, 2013'te derin öğrenme, 2014 ve 2016'da nöromorfik çipler de dahil olmak üzere yapay zeka ile ilgili daha fazla teknoloji listede yer alıyor. 2017'de sesli arayüz ve bilgi paylaşım robotları ve 2017'de sürücüsüz kamyonlar ve takviye öğrenimi. Bu yıl, en çığır açan yapay zeka teknolojisi, iki yapay zeka sisteminin rekabeti, makine öğreniminin hızlanmasını en üst düzeye çıkarma süreci ve ardından, Adversarial Neural Networks (Dueling Neural Networks) / Adversarial Generative Network (GAN). Makine zekasına daha önce mümkün olmayan bir hayal gücü verin.
Son yıllarda, Otomasyon Enstitüsü'nden Sun Zhenan ve Heran Araştırma Grubu, üretken yüzleşme ağlarının ilkeleri ve uygulamaları üzerine yapılan araştırmalarda bir dizi sonuç elde etti.Önceden IEEE Uluslararası Bilgisayar Görüsü ve Örüntü Tanıma Konferansı (CVPR) ve Uluslararası Bilgisayar Görüşü Konferansı'nda (ICCV) yer almışlardı. Üretken yüzleşme ağı ve ön yüz görüntü sentezi üzerine, şu anda dünyada lider konumda olan bir dizi araştırma çalışması yayınladı.
Bu makalede, yazar önceki çalışmadaki bazı sınırlamaları özetlemiştir (örneğin, düşük boyutlu bilgi kısıtlamalarına çok fazla güvenme, orijinal görüntünün anlamsal bilgisini koruyamama vb.) Yazar, bu problemleri çözmek için özel uygulamalarını şu şekilde özetlemektedir: 1. Üç boyutlu yüz modeli ile iki boyutlu yüz görüntüsü arasındaki noktadan noktaya ilişkiyi yansıtabilen noktadan noktaya yoğun bir korelasyon alanı sundu, böylece ağ iki boyutlu olabilir. Görüntünün rehberliğinde gizli üç boyutlu yüz bilgisi öğrenilir. 2. Girdi anlamsal bilgisini büyük ölçüde korurken, yüz dokusunu görüntü alanına etkin bir şekilde eşleyebilen yepyeni bir doku eğirme işlemi tasarlandı. 3. Üç boyutlu verilere güvenmeden yüz dokusu özelliklerini daha etkili bir şekilde öğrenebilen bir anti-kalıntı sözlüğü öğrenme süreci önerilmiştir. 4. Deneyler, bu yöntemin yalnızca nicel ve nitel göstergelerde mevcut yöntemleri önemli ölçüde aşmadığını, aynı zamanda oluşturulan görüntünün çözünürlüğünü de ikiye katladığını göstermektedir.
Yüksek sadakatli tutum değişmez modelinin şematik diyagramı
CelebA veritabanının HQ alt kümesindeki görselleştirme sonuçları, ilk satır giriş görüntüsüdür ve ikinci satır, model tarafından ön yüzleştirmenin sonucudur. HF-PIM, 256 * 256 görselleştirme sonucunun oluşturulmasını destekleyen ilk modeldir.
IJBA veri tabanındaki görselleştirme sonuçları, ilk satır giriş görüntüsüdür ve ikinci satır, model aracılığıyla ön yüzleştirmenin sonucudur.
LFW (soldaki resim) veritabanı ve IJB-A (sağdaki resim) veritabanındaki mevcut yöntemlerle karşılaştırma sonuçları. ACC: Doğruluk. AUC: ROC eğrisinin altındaki alan. FAR: yanlış kabul oranı. Seviye-1: İlk isabet tanıma oranı.
Multi-PIE veri tabanındaki ilk isabetin tanınma oranının farklı açılardan karşılaştırılması