Tsinghua Üniversitesi yayınlandı: Yüz tanıma ile ilgili en eksiksiz veri raporlarından oluşan bir koleksiyon, paylaşın

Mükemmel bir benlik yaratmak için, başlangıçtan itibaren net bir hedefe sahip olmanız ve bunun için çok çalışmanız gerekir!

20. yüzyılın ikinci yarısından bu yana, bilgisayarla görme teknolojisi yavaş yavaş gelişti ve büyüdü. Aynı zamanda, dijital görüntü ile ilgili yazılım ve donanım teknolojilerinin insanların hayatında yaygınlaşmasıyla birlikte dijital görüntüler, çağdaş sosyal bilgi kaynaklarının önemli bir bileşeni haline geldi ve çeşitli görüntü işleme ve analizlerinin ihtiyaçları ve uygulamaları bu teknolojinin yeniliğini teşvik etmeye devam ediyor. Bilgisayarla görme teknolojisi yaygın olarak kullanılmaktadır. Dijital görüntü alma yönetimi, tıbbi görüntü analizi, akıllı güvenlik denetimi, insan-bilgisayar etkileşimi ve diğer alanların tümü bilgisayarla görme teknolojisiyle ilgilidir. Bu teknoloji, yapay zeka teknolojisinin önemli bir parçasıdır ve aynı zamanda günümüzde bilgisayar bilimi araştırmalarının sınır alanıdır. Son yıllarda sürekli gelişmenin ardından, kademeli olarak bir dizi dijital sinyal işleme teknolojisi oluşturulmuştur. Bilgisayar grafikleri, bilgi teorisi ve anlambilimini birleştiren kapsamlı bir teknoloji ve güçlü bir marjinal ve disiplinler arası yapıya sahip. Bunlar arasında yüz tanıma ve tanıma, mevcut görüntü işleme, örüntü tanıma ve bilgisayarla görme konularında sıcak bir araştırma konusudur ve aynı zamanda biyometrik tanımada en çok ilgilenilen daldır.

Yüz tanıma, insan yüz özelliği bilgisine dayalı bir tür biyometrik tanıma teknolojisidir. Genel olarak, insan yüzleri içeren görüntüleri veya video akışlarını toplamak için bir video kamera veya kamera kullanılır ve görüntülerde insan yüzleri otomatik olarak algılanır ve izlenir. Verilere göre, biyometri teknolojisinin küresel pazar büyüklüğü 2017'de 17,2 milyar ABD dolarına yükseldi ve 2020'ye kadar küresel biyometri pazar büyüklüğünün 24 milyar ABD dolarına ulaşabileceği tahmin ediliyor. 2015'ten 2020'ye kadar, yüz tanıma pazarı% 166,6 büyüyerek birçok biyometrik teknoloji arasında ilk sırada yer aldı. 2020 yılına kadar yüz tanıma teknolojisi pazarının 2,4 milyar ABD dolarına yükselmesi bekleniyor.

Bu sayıda, akademisyenin, Tsinghua Üniversitesi'nden doçent Tang Jie liderliğindeki büyük veri madenciliği projesi Aminer'den, yüz tanıma teknolojisi ve uygulama alanlarını açıklayan, yüz tanıma alanındaki yerli oyuncuları tanıtan ve bu teknolojinin gelişme eğilimini tahmin eden bir araştırma raporu öneriyoruz.

Yüz tanıma teknolojisine genel bakış

1. Temel kavramlar

İnsan görsel sisteminin benzersiz cazibesi, araştırmacıları, insanların görsel sensörler ve bilgisayar yazılımı ve donanımı aracılığıyla üç boyutlu dünya görüntülerini toplama, işleme, analiz etme ve öğrenme yeteneğini simüle etmeye teşvik eder, böylece bilgisayarlar ve robot sistemleri akıllı görsel işlevlere sahip olur. Son 30 yılda birçok farklı alandaki bilim insanları, araştırma sonuçlarıyla insanlığa fayda sağlamak için biyolojik vizyon ve sinir sisteminin gizemlerini birçok açıdan anlamaya çalıştılar. 20. yüzyılın ikinci yarısından itibaren bilgisayarla görme teknolojisi bu bağlamda giderek gelişti ve büyüdü. Aynı zamanda, dijital görüntü ile ilgili yazılım ve donanım teknolojilerinin insanların hayatında yaygınlaşmasıyla birlikte dijital görüntüler, çağdaş sosyal bilgi kaynaklarının önemli bir bileşeni haline geldi ve çeşitli görüntü işleme ve analizlerinin ihtiyaçları ve uygulamaları bu teknolojinin yeniliğini teşvik etmeye devam ediyor.

Bilgisayarla görme teknolojisi yaygın olarak kullanılmaktadır. Dijital görüntü alma yönetimi, tıbbi görüntü analizi, akıllı güvenlik denetimi, insan-bilgisayar etkileşimi ve diğer alanların tümü bilgisayarla görme teknolojisiyle ilgilidir. Bu teknoloji, yapay zeka teknolojisinin önemli bir parçasıdır ve aynı zamanda günümüzde bilgisayar bilimi araştırmalarının sınır alanıdır. Son yıllarda sürekli gelişmenin ardından, dijital sinyal işleme teknolojisi, bilgisayar grafikleri, bilgi teorisi ve anlambilimini birleştiren kapsamlı bir teknoloji yavaş yavaş oluşmuştur ve güçlü marjinal ve disiplinler arası bir yapıya sahiptir. Bunlar arasında yüz tanıma ve tanıma, mevcut görüntü işleme, örüntü tanıma ve bilgisayarla görme konularında sıcak bir araştırma konusudur ve aynı zamanda biyometrik tanımada en çok ilgilenilen daldır.

Yüz tanıma, insan yüz özelliği bilgisine dayalı bir tür biyometrik tanıma teknolojisidir. Genel olarak, insan yüzleri içeren görüntüleri veya video akışlarını toplamak için bir video kamera veya kamera kullanılır ve görüntülerde insan yüzleri otomatik olarak algılanır ve izlenir. ChinaReport.com tarafından yayınlanan "2018 Çin Biyometri Pazar Analizi Raporu-Sektör Derinlemesine Analiz ve Geliştirme Beklentisi Tahmini" içeriğine göre, 2017 yılında küresel biyometri pazarı 17,2 milyar ABD dolarına yükseldi. 2020 yılına kadar dünya biyometrisinin olduğu tahmin ediliyor Pazar büyüklüğü 24 milyar dolara ulaşabilir. 2015'ten 2020'ye kadar, yüz tanıma pazarı% 166,6 büyüyerek birçok biyometrik teknoloji arasında ilk sırada yer aldı. 2020 yılına kadar yüz tanıma teknolojisi pazarının 2,4 milyar ABD dolarına yükselmesi bekleniyor.

Farklı biyometrik tanıma yöntemleri arasında, yüz tanımanın kendine özgü avantajları vardır ve bu nedenle biyometrik tanımada önemli bir konuma sahiptir. Yüz tanımanın beş avantajı:

Müdahaleci değil. Yüz tanıma, insanların normal davranışlarına müdahale etmeden daha iyi bir tanıma etkisi sağlayabilir ve tanınan kişinin ellerini parmak izi toplama cihazına koymaya istekli olup olmadığı, gözlerinin iris tarama cihazına yöneltilip yönlendirilemeyeceği konusunda endişelenmenize gerek yoktur. Bir süre kamera karşısında kaldığınız sürece kullanıcının kimliği doğru bir şekilde tanımlanacaktır.

Kolaylık. Toplama ekipmanı basit ve kullanımı hızlıdır. Genel olarak konuşursak, özellikle karmaşık özel ekipmana ihtiyaç duymadan yüz görüntülerini toplamak için ortak bir kamera kullanılabilir. Görüntü edinimi birkaç saniye içinde tamamlanabilir.

Dostluk . Kimlikleri yüzler aracılığıyla tanımlama yöntemi insan alışkanlıklarıyla tutarlıdır ve hem insanlar hem de makineler kimlik için yüz resimlerini kullanabilir. Parmak izi, iris ve diğer yöntemler bu özelliğe sahip değildir.Özel eğitimi olmayan bir kişi, başkalarını tanımlamak için parmak izi ve iris görüntülerini kullanamaz.

Temassız. Yüz görüntüsü bilgilerinin toplanması, parmak izi bilgilerinin toplanmasından farklıdır. Bilgi toplamak için parmak izlerinin kullanılması, toplama ekipmanına dokunmak için parmakların kullanılmasını gerektirir, bu hijyenik değildir ve kullanıcının tiksinti uyandırır, yüz görüntüsü toplama ise kullanıcının ekipmanla doğrudan temas kurmasını gerektirmez. .

Ölçeklenebilirlik. Yüz tanımadan sonra, veri işleme ve uygulamanın bir sonraki aşaması, yüz tanıma ekipmanının gerçek uygulamasını belirler.Örneğin, erişim kontrolü, yüz görüntüsü arama, işte kart kaydırma, terörist tanımlama vb. Gibi çeşitli alanlarda kullanılabilir. Kuvvetli.

Tam da yüz tanımanın bu iyi özelliklere sahip olmasından dolayı çok geniş bir uygulama alanına sahip olmasının yanı sıra akademik ve ticari çevrelerden de giderek daha fazla ilgi görüyor. Yüz tanıma, kimlik tanıma, canlı vücut algılama, dudak dili tanıma, yaratıcı kameralar, yüz güzelleştirme, sosyal platformlar vb. Sahnelerde yaygın olarak kullanılmaktadır.

2. Geliştirme geçmişi

1950'lerin başlarında, bilişsel bilimciler çoktan yüz tanıma üzerine araştırmalara başlamıştı. 1960'larda, yüz tanımanın mühendislik uygulama araştırması resmen başladı. O zamanki yöntem esas olarak insan yüzünün geometrik yapısını kullanıyordu ve yüz organlarının özellik noktaları ve aralarındaki topolojik ilişki analiz edilerek tanındı. Bu yöntem basit ve sezgiseldir, ancak yüzün duruşu ve ifadesi değiştiğinde doğruluk ciddi şekilde azalacaktır.

1990'lar: 1991'de ünlü "Eigenface" (Eigenface) yöntemi, ilk kez tanıma ile yüzleşmek için temel bileşen analizi ve istatistiksel özellik teknolojisini tanıttı ve pratik etkilerde önemli ilerleme kaydetti. Bu fikir sonraki araştırmalarda da ileri götürüldü.Örneğin, Belhumer, yüz sınıflandırması için Fisher diskriminant kriterini başarıyla uyguladı ve doğrusal diskriminant analizine dayalı Fisherface yöntemini önerdi.

2000-2012: 21. yüzyılın ilk on yılında, makine öğrenimi teorisinin gelişmesiyle birlikte, bilim adamları art arda genetik algoritmalar, Destek Vektör Makinesi (SVM), güçlendirme, çeşitli öğrenme ve çekirdek yöntemlerine dayanan yöntemleri araştırdılar. Yüz tanıma gerçekleştirin. 2009'dan 2012'ye kadar, Seyrek Temsil, güzel teorisi ve tıkanma faktörlerine karşı sağlamlığı nedeniyle o zamanlar bir araştırma sıcak noktası haline geldi. Aynı zamanda, endüstri temelde bir fikir birliğine varmıştır: Özenle tasarlanmış yerel tanımlayıcılara dayalı özellik çıkarma ve alt uzay yöntemlerini kullanarak özellik seçimi en iyi tanıma sonuçlarını sağlayabilir.

Gabor ve LBP özellik tanımlayıcıları, yüz tanıma alanında şimdiye kadar yapay olarak tasarlanmış en başarılı iki yerel tanımlayıcıdır. Bu dönemde, çeşitli yüz tanımayı etkileyen faktörlerin hedeflenen işlenmesi de o aşamada, yüz aydınlatma normalizasyonu, yüz pozu düzeltme, yüz süper çözünürlüğü ve kapatma işleme gibi bir araştırma etkin noktasıydı.

Ayrıca bu aşamada, araştırmacıların odak noktası kısıtlı senaryolarda yüz tanımadan, sınırsız ortamlarda yüz tanımaya kaymaya başladı. LFW yüz tanıma açık yarışması (LFW, 10.000 test verisi boyutuyla Massachusetts Üniversitesi tarafından yayınlanan ve sürdürülen halka açık bir yüz numarası kümesidir) bu bağlamda popüler hale geldi. O zamanki en iyi tanıma sistemi, kısıtlı FRGC test setindeydi. LFW'de% 99 veya daha fazla tanıma doğruluğu elde edilebilir, ancak LFW'de en yüksek doğruluk sadece yaklaşık% 80'dir ve bu pratik kullanımdan oldukça uzak gibi görünmektedir.

2013: Microsoft Research Asia'dan araştırmacılar ilk kez 100.000 ölçekli bir eğitim verisi denediler ve yüksek boyutlu LBP özelliklerine ve Joint Bayesian yöntemine dayalı olarak LFW'de% 95.17 doğruluk elde ettiler. Bu sonuç, kısıtlamasız ortamlarda yüz tanımayı etkili bir şekilde geliştirmek için büyük eğitim veri setlerinin çok önemli olduğunu göstermektedir. Ancak, yukarıdaki klasik yöntemlerin tümü, büyük ölçekli veri seti eğitim senaryolarını işlemek zordur.

2014: 2014 yılı civarında, büyük veri ve derin öğrenmenin gelişmesiyle birlikte sinir ağları dikkat çekti ve görüntü sınıflandırma, el yazısı tanıma ve konuşma tanıma gibi uygulamalarda klasik yöntemlerin çok ötesine geçen sonuçlar elde etti. Hong Kong Çin Üniversitesi'nden Sun Yi ve diğerleri, yüz tanıma geliştirme tarihinde ilk kez LFW'de insan düzeyini aşan tanıma doğruluğu elde etmek için 200.000 eğitim verisi kullanarak yüz tanıma için evrişimli sinir ağları uygulamayı önerdiler. Bir kilometre taşı. O zamandan beri, araştırmacılar ağ yapısını geliştirmeye devam ederken, eğitim örneklerinin boyutunu genişleterek LFW'deki tanıma doğruluğunu% 99,5'in üzerine çıkardı. Yüz tanımanın geliştirilmesi sırasında, bazı klasik yöntemler ve bunların LFW üzerindeki doğruluğu temel bir eğilime sahiptir: eğitim verilerinin ölçeği gittikçe büyüyor ve tanıma doğruluğu gittikçe artıyor.

Yüz tanıma teknolojisinin gelişim geçmişi

3. Çin politika desteği

2015 yılından bu yana, devlet yoğun bir şekilde "Bankacılık Finans Kuruluşları Tarafından RMB Hesaplarının Uzaktan Açılmasına İlişkin Yol Gösterici Görüşler (Danışma Taslağı)" yayınladı ve yüz tanımanın popülerleşmesine kapı açtı; "Sistem Teknik Gereksinimleri", "Bilgi Güvenliği Teknolojisi Ağı Yüz Tanıma Kimlik Doğrulama Sistemi Güvenliği Teknik Gereksinimleri" ve diğer yasa ve yönetmelikler, yüz tanımanın finans, güvenlik, tıbbi ve diğer alanlarda yaygınlaştırılması için sağlam bir temel oluşturmuş ve politika engellerini ortadan kaldırmıştır. Aynı zamanda, yapay zeka ilk olarak 2017'de ulusal hükümet raporuna yazılmıştır. Yapay zekanın önemli bir alt bölümü olarak, devletin yüz tanımaya yönelik politika desteği sürekli artmaktadır. "Yeni Nesil Yapay Zeka Endüstrisinin Gelişimini Teşvik Etmek İçin Üç Yıllık Eylem Planı (2018-2020)" Aralık 2017'de yayınlandı "2020'ye kadar, karmaşık dinamik senaryolarda yüz tanımanın etkili algılama oranı% 97'yi aşacak ve doğru tanıma oranı aşacak % 90 ".

Yüz tanıma ile ilgili politikalar

4. Geliştirme noktaları

Yüz tanıma alanındaki önceki makalelerin madenciliği yoluyla, araştırma, yüz tanıma alanındaki araştırma anahtar kelimelerinin esas olarak yüz tanıma, özellik çıkarma, seyrek temsil, görüntü sınıflandırma, sinir ağları, hedef algılama, yüz görüntüleri ve yüzlere odaklandığı sonucuna varmıştır. Algılama, görüntü gösterimi, bilgisayarla görme, poz tahmini, yüz tanıma ve diğer alanlar.

Aşağıdaki şekil, teknoloji kaynağını, popülerliği ve hatta gelişim eğilimini tarihsel bilimsel araştırma sonuçlarına dayalı olarak incelemeyi amaçlayan yüz tanıma araştırma eğiliminin bir analizidir. Şekil 2'de, her bir renk dalı bir anahtar kelime alanını temsil eder ve genişliği, anahtar kelimenin araştırma popülerliğini temsil eder.Her bir anahtar kelimenin her bir yıldaki konumu, o andaki tüm anahtar kelimelerin popülerliğine göre sıralanır. Başlangıçta Computer Vision bir araştırma etkin noktasıydı. 20. yüzyılın sonunda Özellik Çıkarma CV'yi aşarak yeni bir araştırma noktası haline geldi. Daha sonra 21. yüzyılın başlarında Yüz Tanıma tarafından geride bırakıldı ve şimdiye kadar ikinci sırada yer aldı. Yer.

Yüz tanıma ile ilgili etkin noktalar

Ayrıca son iki yılda FG'de (International Conference on Automatic Face and Gesture Recognition) yayınlanan makalelerden çıkarılan anahtar kelimelere göre yapılan çalışmada Yüz Tanıma'nın 118 kez en yüksek frekansa sahip olduğu ve Nesne Algılama'nın 41 ile ikinci sırada yer aldığı tespit edildi. İkincisi, Görüntü Sınıflandırma ve Nesne Tanıma 36 kez üçüncü sırayı aldı. Ondan fazla kez görünen kelimeler arasında Görüntü Segmentasyonu (32), Hareket Tanıma (32), Seyrek Temsil (28), Görüntü Erişim (27), Görsel İzleme ( 24), SingleImage (23). Kelime bulutu diyagramı aşağıdaki gibidir:

Yüz tanıma kelime bulutu analizi

5. Yüz tanıma ile ilgili toplantılar

Bilgisayarla görme alanında en iyi üç uluslararası konferans (CV):

ICCV: IEEE Uluslararası Bilgisayarla Görü Konferansı

Konferans Elektrik ve Elektronik Mühendisleri Enstitüsü (IEEE, Elektrik ve Elektronik Mühendisleri Enstitüsü) tarafından desteklenmektedir ve esas olarak Avrupa, Asya ve Amerika'da güçlü bilimsel araştırma yeteneklerine sahip ülkelerde düzenlenmektedir. Dünyanın en iyi akademik konferansı olan ilk Uluslararası Bilgisayar Görme Konferansı 1987'de Londra'da açıldı ve daha sonra her iki yılda bir düzenlendi. ICCV, bilgisayarla görme alanındaki en üst düzey konferanstır Konferansın tutanakları, bilgisayarla görme alanındaki en son gelişme yönünü ve düzeyini temsil eder. Bildirilerin kabul oranı% 20 civarındadır. Yön, bilgisayar görüşü, örüntü tanıma, multimedya hesaplama vb.

Son yıllarda, küresel akademik topluluk, Çinlilerin bilgisayarla görme alanında elde ettiği bilimsel araştırma başarılarına giderek daha fazla önem vermiştir.Bu, Çinlilerin önderliğindeki ilgili araştırmanın büyük ilerleme kaydetmesidir. 2007'de, konferans 1.200'den fazla makale aldı. Konferans tarafından seçilen toplam bildiri sayısının% 12'sini aşan 30'dan fazla bildiri Çin Anakarası, Hong Kong ve Tayvan'dan olmak üzere yalnızca 244 bildiri seçildi. Uzun yıllardır ortaya konan temel teknolojilere dayanan derin öğrenme teknolojisinin araştırma ve geliştirmesine yatırım yapan ilk Çinli ekip olarak, Hong Kong Çin Üniversitesi'nden Profesör Tang Xiaoou liderliğindeki ekip, hızla teknolojik atılımlar gerçekleştirdi. 2012 Uluslararası Hesaplamalı Görme ve Örüntü Tanıma Konferansı'ndaki (CVPR) yalnızca iki derin öğrenme makalesi Tang Xiaoounun laboratuvarındandı. 2013 Uluslararası Bilgisayar Görü Konferansı'nda (ICCV), küresel bilim adamları derin öğrenme alanında 8 makale yayınladılar. Makaleler arasında 6'sı Tang Xiaoou'nun laboratuvarından.

CVPR: Bilgisayarla Görme ve Örüntü Tanıma IEEE Konferansı

Konferans, IEEE tarafından düzenlenen bilgisayarla görme ve örüntü tanıma alanında en önemli konferanstır. Yılda bir kez yapılır ve kabul oranı% 25 civarındadır. Yön, bilgisayar görüşü, örüntü tanıma, multimedya hesaplama vb.

Hong Kong Çin Üniversitesi'nden Profesör Tang Xiaoou liderliğindeki ekip, dünya çapında çok sayıda orijinal derin öğrenme teknolojik atılım gerçekleştirdi: 2012 Uluslararası Hesaplamalı Vizyon ve Desen Tanıma Konferansı'ndaki (CVPR) yalnızca iki derin öğrenme makalesi laboratuvarındandı; 2011 - 2013 yılında, bilgisayarla görme alanındaki en önemli iki konferansta, ICCV ve CVPR'de 14 derin öğrenme makalesi yayınlandı ve dünyadaki bu iki konferanstaki toplam derin öğrenme makalesi sayısının (29) neredeyse yarısını oluşturdu. 2009 yılında, bilgisayarla görme alanındaki en iyi iki uluslararası akademik konferanstan biri olan CVPR En İyi Bildiri Ödülü'nü kazandı.Bu, CVPR tarihinde Asya'dan bir makalenin ilk ödülüdür.

ECCV: Avrupa Bilgisayarla Görü Konferansı

ECCV bir Avrupa konferansıdır. Her konferans dünya çapında yaklaşık 300 bildiri kabul eder. Kabul edilen başlıca makaleler Amerika Birleşik Devletleri ve Avrupadaki en iyi laboratuvarlardan ve araştırma enstitülerindendir. Çin ana karasındaki makale sayısı genellikle 10-20 arasındadır. ECCV2010 kağıtlarının kabul oranı% 27'dir. İki yılda bir düzenlenen bildirilerin kabul oranı% 20 civarındadır. Yön, bilgisayar görüşü, örüntü tanıma, multimedya hesaplama vb. 2018 ECCV, 8-14 Eylül 2018 tarihleri arasında Almanya'nın Münih kentinde düzenlendi.

Asya Bilgisayarlı Görü Konferansı:

ACCV: Asya Bilgisayarla Görü Konferansı

Asya Bilgisayar Görme Konferansı ACCV, 1993 yılından bu yana AFCV (Asya Bilgisayar Görme Federasyonu) tarafından resmi olarak düzenlenen iki yılda bir düzenlenen bir konferanstır. Araştırmacılar, geliştiriciler ve katılımcılar için iyi bir platform sağlamayı amaçlamaktadır. Bilgisayar görüşü ve ilgili alanlarda yeni sorunları, yeni çözümleri ve yeni teknolojileri göstermek ve tartışmak. 2018'deki 14. Asya Bilgisayarlı Görü Konferansı, 4-6 Aralık 2018 tarihleri arasında Avustralya'da gerçekleştirilecek.

Yüz ve hareket tanımaya adanmış konferanslar:

FG: IEEE Uluslararası Otomatik Yüz ve Hareket Tanıma Konferansı

"Uluslararası Otomatik Yüz ve Hareket Tanıma Konferansı", dünya çapında yüz ve jest tanıma alanında yetkili bir akademik konferanstır. Toplantının yönü yüz tanıma, yüz tanıma, ifade tanıma, duruş analizi, psikolojik davranış analizi vb.

Ayrıntılı yüz tanıma teknolojisi

1. Yüz tanıma süreci

Basit bir ifadeyle, yüz tanıma teknolojisinin prensibi esas olarak üç adımdan oluşur: Biri çok sayıda yüz görüntüsü içeren bir veri tabanı oluşturmak, diğeri ise tanınacak mevcut hedef yüz görüntüsünü çeşitli yöntemlerle elde etmek ve üçüncüsü hedef kişiyi birleştirmektir. Yüz görüntüsü, veri tabanındaki mevcut yüz görüntüsü ile karşılaştırılır ve filtrelenir. Yüz tanıma teknolojisi prensiplerine göre uygulanan teknik süreç, temel olarak aşağıdaki dört bölümden oluşur: yüz görüntülerinin toplanması ve ön işlemesi, yüz algılama, yüz özelliği çıkarma, yüz tanıma ve canlı vücut tanımlama.

Yüz tanıma teknolojisi süreci

Yüz görüntülerinin toplanması ve ön işlenmesi

Yüz görüntülerinin toplanması ve algılanması özellikle iki bölüme ayrılabilir: yüz görüntülerinin toplanması ve yüz görüntülerinin algılanması.

Yüz görüntülerinin toplanması: Yüz görüntülerini toplamanın genellikle iki yolu vardır; mevcut yüz görüntülerinin toplu içe aktarılması ve gerçek zamanlı yüz görüntülerinin toplanması. Daha gelişmiş yüz tanıma sistemlerinden bazıları, yüz tanımanın kalite gereksinimlerini karşılamayan veya düşük çözünürlük kalitesine sahip yüz görüntülerinin koşullu filtrelemesini destekleyebilir ve mümkün olduğunca net ve doğru bir koleksiyon elde edebilir. Mevcut yüz görüntülerinin toplu içe aktarımı: çeşitli şekillerde toplanan yüz görüntülerini toplu olarak yüz tanıma sistemine aktarmak üzere ve sistem yüz yüze görüntülerin toplanmasını otomatik olarak tamamlayacaktır. Yüz görüntülerinin gerçek zamanlı olarak toplanması: Cihazın atış menzili içinde gerçek zamanlı olarak yüz görüntülerini otomatik olarak çekmek için kamerayı veya kamerayı arayın ve koleksiyonu tamamlayın.

Yüz görüntüsü ön işlemesi: Yüz görüntüsü ön işlemenin amacı, yüz görüntüsünün öznitelik çıkarımını kolaylaştırmak için sistemin yüz görüntüsünü algılamasına dayalı olarak yüz görüntüsü üzerinde daha fazla işlem gerçekleştirmektir. Yüz görüntüsünün ön işlenmesi, özellikle yüz görüntüsünü ışıktan bağımsız hale getirmek için sistem tarafından toplanan yüz görüntüsünün ışık, döndürme, kesme, filtreleme, gürültü azaltma, büyütme ve küçültme gibi bir dizi karmaşık işleme sürecini ifade eder. , Açı, mesafe, boyut ve diğer yönler, yüz görüntüsü özelliği çıkarmanın standart gereksinimlerini karşılayabilir. Görüntülerin gerçek ortamda toplanması, görüntünün farklı ışık ve karanlık, yüz ifadesi değişiklikleri, gölge tıkanması vb. Birçok dış etken tarafından engellenmesi, toplanan görüntünün yetersiz kalitesiyle sonuçlanması nedeniyle öncelikle toplanan görüntünün ön işlemden geçirilmesi gerekir. Zayıf ön işleme, sonraki yüz algılama ve tanımayı ciddi şekilde etkileyecektir. Araştırma, gri tonlama ayarı, görüntü filtreleme ve görüntü boyutu normalleştirme olmak üzere üç görüntü ön işleme yöntemi sunar.

Gri tonlama ayarı: Yüz görüntüsü işlemenin son görüntüsü genellikle ikili bir görüntü olduğundan ve konum, ekipman, ışık vb. Farklılıklar nedeniyle toplanan renkli görüntülerin kalitesi farklı olduğundan, görüntü için birleşik gri tonlama işlemi gerekir. Bu farklılıkları düzeltmek için. Yaygın olarak kullanılan gri tonlama ayarlama yöntemleri arasında ortalama değer yöntemi, histogram dönüştürme yöntemi, güç dönüştürme yöntemi, logaritmik dönüştürme yöntemi vb. Bulunmaktadır.

Görüntü filtreleme: Gerçek yüz görüntüsü elde etme sürecinde, yüz görüntüsünün kalitesi, çevredeki ortamın elektromanyetik sinyallerle dolu olması, dijital görüntü iletiminin elektromanyetik sinyallerden etkilenmesi gibi birçok yönden gelen çeşitli seslerden etkilenecektir. Girişim ve diğer faktörler kanalı etkiler, böylece yüz görüntüsünün kalitesini etkiler. Görüntünün kalitesini sağlamak ve gürültünün sonraki işleme süreci üzerindeki etkisini azaltmak için görüntünün sesinin giderilmesi gerekir. Gürültünün giderilmesi için birçok ilke ve yöntem vardır ve ortak olanlar ortalama filtreleme ve medyan filtrelemedir. Şu anda, medyan filtreleme algoritmaları, yüz görüntülerini önceden işlemek için yaygın olarak kullanılmaktadır.

Görüntü boyutu normalizasyonu: Basit yüz eğitimi gerçekleştirirken, yüz veritabanındaki görüntünün piksel boyutu farklı olduğunda, ana bilgisayardaki yüz karşılaştırma ve tanıma işlemlerinden önce görüntüyü normalleştirmemiz gerekir. Daha yaygın boyut normalleştirme algoritmaları, çift doğrusal enterpolasyon algoritması, en yakın komşu enterpolasyon algoritması ve kübik evrişim algoritmasıdır.

Yüz tanıma

Yüz görüntüsü içeren bir resim, normal koşullar altında başka içerik de içerebilir Bu durumda, gerekli yüz algılama gereklidir. Yani, bir yüz görüntüsünde, sistem yüzün konumunu ve boyutunu doğru bir şekilde bulacaktır ve yararlı görüntü bilgilerini seçerken, yüz görüntülerinin doğru bir şekilde toplanmasını daha da sağlamak için diğer gereksiz görüntü bilgilerini otomatik olarak ortadan kaldıracaktır. .

Yüz algılama, yüz tanımanın önemli bir parçasıdır. Yüz algılama, belirli bir resim veya videoyu geri almak için belirli bir strateji uygulama, bir yüz olup olmadığına karar verme ve varsa her yüzün konumunu, boyutunu ve duruşunu bulma sürecini ifade eder. Yüz tespiti zorlu bir hedef tespit problemidir ve temelde iki yönden yansıtılır: Yüz hedefinin dahili değişikliklerine şunlar neden olur: 1. Yüzün detaylarında oldukça karmaşık değişiklikler ve farklı ifadeler (gözler, ağız açma ve kapama vb.) ), farklı yüzlerin farklı görünümleri vardır, örneğin yüz şekli, ten rengi vb .; 2. Gözlük, saç ve baş aksesuarları gibi yüz kapatma. Dış koşullardaki değişikliklere şunlar neden olur: 1. Derinlik dönüşünün daha büyük bir etkiye sahip olduğu düzlem içi dönüş, derinlik dönüşü ve yukarı ve aşağı dönüş gibi farklı görüntüleme açıları nedeniyle yüzün birden fazla pozu; 2. Görüntüdeki parlaklık gibi ışığın etkisi , Kontrast değişiklikleri ve gölgeler, vb .; 3. Kamera ekipmanının odak uzunluğu ve görüntüleme mesafesi gibi görüntü görüntüleme koşulları.

Yüz algılamanın işlevi, bir yüz görüntüsünde sistemin yüzün konumunu ve boyutunu doğru bir şekilde bulması ve yararlı görüntü bilgilerini seçerken daha fazla iyileştirme için diğer gereksiz görüntü bilgilerini otomatik olarak kaldırmasıdır. Yüz görüntülerinin doğru şekilde toplandığından emin olun. Yüz algılama aşağıdaki göstergelere odaklanır:

Algılama oranı: Resimdeki doğru yüzü / tüm yüzleri tanıyın. Algılama oranı ne kadar yüksekse, algılama modelinin etkisi o kadar iyidir; Yanlış algılama oranı: Tanınan yanlış yüz / tanınan yüz. Yanlış algılama oranı ne kadar düşükse, algılama modeli etkisi o kadar iyidir; Kaçırılan algılama oranı: tanınmayan yüz / resimdeki tüm yüzler. Kaçırılan algılama oranı ne kadar düşükse, algılama modelinin etkisi o kadar iyidir; Hız: görüntü alımının tamamlanmasından yüz algılamanın tamamlanmasına kadar geçen süre. Süre ne kadar kısa olursa, algılama modeli etkisi o kadar iyi olur.

Mevcut yüz algılama yöntemleri, cilt rengi modeline dayalı algılama, kenar özelliklerine dayalı algılama ve istatistiksel teoriye dayalı yöntem olmak üzere üç kategoriye ayrılabilir. Aşağıda bunları kısaca tanıtacağız:

1. Cilt rengi modeline dayalı algılama: Yüz algılama için cilt rengi kullanıldığında, başlıca Gauss modeli, Gauss karışımı modeli ve parametrik olmayan tahmin olmak üzere farklı modelleme yöntemleri kullanılabilir. Gauss modeli ve Gauss karışım modeli kullanılarak, yüz tanıma için farklı renk alanlarında ten rengi modelleri oluşturulabilir. Yüz algılamayı gerçekleştirmek için renkli görüntüdeki yüz alanını çıkarma yöntemi, çeşitli aydınlatma koşullarının üstesinden gelebilir, ancak algoritmanın sabit kamera parametreleri öncülüğünde etkili olması gerekir. Comaniciu gibi bilim adamları, cilt rengi modelini oluşturmak için parametrik olmayan çekirdek işlevi olasılık yoğunluğu tahmin yöntemini kullanır ve yüz algılama ve izlemeyi sağlamak için yerel arama gerçekleştirmek için ortalama kaydırma yöntemini kullanır. Bu yöntem, yüz algılama hızını artırır ve ayrıca tıkanmaya ve aydınlatmaya karşı dayanıklıdır. Bu yöntemin dezavantajı, diğer yöntemlerle pek uyumlu olmamasıdır.Aynı zamanda, yüz tanıma için kullanıldığında karmaşık arka planlar ve çoklu yüzlerle uğraşmak zordur.

Yüz tanımada aydınlatma problemini çözmek için farklı aydınlatma için telafi yapıldıktan sonra görüntüdeki ten rengi alanı tespit edilir. Bu, renkli görüntülerde polarize ışık, karmaşık arka plan ve çoklu yüz algılama sorunlarını çözebilir, ancak yüz rengine, konumuna, ölçeğine, döndürmesine, duruşuna ve ifadesine duyarlı değildir.

2. Kenar özelliklerine dayalı algılama: Yüzleri algılamak için görüntünün kenar özelliklerini kullanırken, hesaplama miktarı nispeten küçüktür ve gerçek zamanlı algılama elde edilebilir. Kenar özelliklerini kullanan çoğu algoritma, insan yüzlerinin kenar kontur özelliklerine dayanır ve eşleştirme için yerleşik şablonlar (eliptik şablonlar gibi) kullanır. Bazı araştırmacılar, basit arka planlarda yüz algılamayı gerçekleştirmek için elips halka modelini ve kenar yönü özelliklerini de kullanır. Fröba ve diğerleri, kenar yönlendirme haritasındaki yüzleri algılamak için Kenar Yönlendirme Eşleştirmesine (EOM) dayalı bir yöntem kullandı. Bu algoritma, karmaşık bir arka planda nispeten yüksek bir yanlış algılama oranına sahiptir, ancak diğer özelliklerle birleştirildikten sonra iyi sonuçlar elde edebilir.

3. İstatistiksel teoriye dayalı yöntem: Bu makale, istatistiksel teoriye dayalı Adaboost yüz algılama algoritmasına odaklanmaktadır. Adaboost algoritması, sayısız yineleme yoluyla en uygun sınıflandırıcıyı bulma sürecidir. Yüz özelliği değerini bulmak için yüz örneğindeki zayıf sınıflandırıcı Haar özelliğinin herhangi bir özelliğini kullanın ve yüzün niceliksel özelliği, yüzler ve yüz olmayanlar arasında ayrım yapmak için daha fazla sınıflandırıcı basamaklamasıyla elde edilebilir . Haar işlevi, bazı basit siyah beyaz yatay ve dikey dikdörtgenlerden oluşur veya 45 ° döndürülür. Mevcut Haar özellikleri genel olarak üç kategoriye ayrılabilir: kenar unsurları, çizgi unsurları ve merkezi özellikler.

Bu algoritma, Cambridge Üniversitesi'nden Paul Viola ve Michael Jones adlı iki bilim insanı tarafından önerilmiştir.Bu algoritmanın avantajı, sadece hızlı bir hesaplama hızına sahip olması değil, aynı zamanda diğer algoritmalarla karşılaştırılabilir performansa ulaşabilmesi, dolayısıyla yüz tanımada yaygın olarak kullanılmaktadır, ancak aynı zamanda mevcuttur. Daha yüksek bir yanlış tespit oranı. Çünkü Adaboost algoritmasını kullanarak öğrenme sürecinde her zaman yüz olmayan desenlerden ayırt edilmesi zor olan bazı yüzler vardır ve algılama sonuçlarında yüz modellerine benzemeyen bazı pencereler vardır.

Yüz özelliği çıkarma

Şu anda, genel yüz tanıma sistemleri tarafından desteklenen özellikler genellikle yüz görsel özellikleri, yüz görüntüsü piksel istatistiksel özellikleri, vb. Olarak ikiye ayrılabilir ve yüz görüntülerinin öznitelik çıkarımı, yüzün bazı spesifik özelliklerine dayanır. Özellik basittir ve eşleştirme algoritması basittir, bu da büyük ölçekli kitaplık yapımı için uygundur; aksi takdirde küçük ölçekli kitaplık için uygundur. Özellik çıkarma yöntemleri genellikle bilgiye dayalı çıkarma yöntemlerini veya cebirsel özellik tabanlı çıkarma yöntemlerini içerir.

Bilgiye dayalı yüz tanıma ve çıkarma yöntemlerinden birini örnek olarak alın, çünkü yüz temelde gözler, alın, burun, kulaklar, çene, ağız ve diğer bölümlerden oluşur ve bu parçalar ile bunlar arasındaki yapısal ilişki mümkündür. Geometrik şekil özellikleriyle tanımlanmaktadır, yani her bir kişinin yüz görüntüsünün karşılık gelen bir geometrik şekil özelliğine sahip olabilmesi, yüzün önemli fark özelliğini tanımamıza yardımcı olabilir ki bu da bilgiye dayalı ekstraksiyon yöntemindedir. Biraz.

Yüz tanıma

Yüz tanıma sistemindeki yüz benzerlik derecesi için bir değer belirleyebilir ve ardından ilgili yüz görüntüsünü sistem veri tabanındaki tüm yüz görüntüleriyle karşılaştırabiliriz. Önceden ayarlanmış benzerlik değerini aşarsa, sistem Fazla yüz görüntüleri tek tek çıkarılacaktır. Şu anda yüz görüntülerinin benzerliğine ve yüzün kimlik bilgilerine göre hassas tarama yapmamız gerekiyor.Bu hassas tarama işlemi iki kategoriye ayrılabilir: Bir Bire bir tarama yani yüz kimliğinin doğrulanması süreci; ikincisi bire çok taramadır, yani yüzlerin benzerliğine göre eşleştirme ve karşılaştırma işlemidir.

In vivo tanımlama

Biyometrik tanımanın yaygın sorunlarından biri, sinyalin gerçek bir organizmadan gelip gelmediğini ayırt etmektir.Örneğin, parmak izi tanıma sisteminin, tanıma özellikli parmak izinin yüz tanıma sistemi tarafından toplanan bir insan parmağından mı yoksa parmak izi eldiveninden mi geldiğini ayırt etmesi gerekir. Yüz görüntüsü, gerçek bir yüz veya bir yüz içeren bir fotoğraftan alınmıştır. Bu nedenle, gerçek yüz tanıma sisteminin genellikle canlı bir vücut tanımlama bağlantısı eklemesi gerekir; örneğin, insanların başlarını sola ve sağa çevirmesini, gözlerini kırpmasını ve konuşmak için ağızlarını açmasını gerektirir.

2. Başlıca yüz tanıma yöntemleri

Yüz tanıma teknolojisi araştırması, görüntü işleme, fizyoloji, psikoloji, örüntü tanıma ve diğer bilgiler gibi birden çok disiplinin profesyonel bilgisi dahil olmak üzere birden çok disiplinin bilgisini kapsayan üst düzey bir teknik araştırma çalışmasıdır. Yüz tanıma teknolojisi araştırması alanında, şu anda birkaç araştırma yönü bulunmaktadır, örneğin: Biri, esas olarak özyüz yöntemi ve gizli Markov modelini içeren yüz özelliği istatistiklerine dayalı bir tanıma yöntemidir (HMM, Gizli Markov Modeli) yöntemi vb .; diğer bir yüz tanıma yöntemi, bağlantı mekanizması ile ilgilidir, özellikle yapay sinir ağı (YSA, Yapay Sinir Ağı) yöntemi ve destek vektör makinesi (SVM, Destek Vektör Makinesi) yöntemi vb. Çoklu tanımlama yöntemlerini entegre etme yöntemidir.

Özyüz tabanlı yöntem

Özyüz yöntemi, nispeten klasik ve yaygın olarak kullanılan bir yüz tanıma yöntemidir.Ana prensibi, görüntüyü bir boyut azaltma algoritması olarak kullanmaktır, bu da veri işlemeyi kolaylaştırır ve aynı zamanda daha hızlı hale getirir. Özyüzlerin yüz tanıma yöntemi aslında görüntü üzerinde Karhunen-Loeve dönüşümü gerçekleştirir, yüksek boyutlu bir vektörü düşük boyutlu bir vektöre dönüştürür, böylece her bileşenin korelasyonunu ortadan kaldırır, böylece dönüştürülen görüntü ona karşılık gelir. Karakteristik değer azalıyor. Görüntü K-L dönüşümünden geçtikten sonra, iyi yer değiştirme değişmezliği ve kararlılığına sahiptir. Bu nedenle, özyüzün yüz tanıma yöntemi, uygun uygulama, daha hızlı ve nispeten yüksek ön yüz görüntülerini tanıma oranı gibi avantajlara sahiptir. Bununla birlikte, bu yöntemin de eksiklikleri vardır, yani yüz ifadeleri, duruşlar ve aydınlatma değişiklikleri gibi faktörlerden etkilenmesi nispeten kolaydır ve bu da düşük bir tanıma oranına neden olur.

Geometrik özelliklere dayalı yöntemler

Geometrik özelliklere dayalı tanıma yöntemi, yüz organlarının özelliklerine ve geometrik şekillerine dayalı bir yüz tanıma yöntemidir.En eski araştırma ve kullanılan tanıma yöntemidir.Ağırlıklı olarak farklı yüzlerin farklı özellikleri gibi bilgileri kullanır. Eşleşen tanıma, bu algoritma daha hızlı bir tanıma hızına sahiptir, aynı zamanda nispeten küçük bir bellek kaplar, ancak tanıma oranı yüksek değildir. Bu yöntemin ana yöntemi, önce ağız, burun ve gözler gibi yüzün ana özellik organlarının konumunu ve boyutunu tespit etmek ve ardından bu organların geometrik dağılım ilişkisini ve eşleşecek oranlarını kullanarak yüz tanıma sağlamaktır.

Geometrik özelliklere dayalı tanıma süreci kabaca şu şekildedir: öncelikle her bir özellik noktasını ve yüzün burnunun, ağzın ve gözlerin konumu gibi konumunu tespit edin ve ardından her bir özellik yüzünün ifadesini elde etmek için bu özellikler arasındaki mesafeyi hesaplayın. Gözlerin konumu, kaşların uzunluğu gibi vektör özellik bilgileri ve ardından her özellik arasındaki ilgili ilişkiyi hesaplayın, yüz veritabanındaki bilinen yüzün ilgili özellik bilgileriyle karşılaştırın ve son olarak en iyi eşleşen yüzü elde edin . Geometrik özelliklere dayalı yöntem, insanların yüz özelliklerini tanıması ile uyumludur.Ayrıca, her yüz yalnızca bir özelliği depolar, bu nedenle nispeten küçük bir yer kaplar; aynı zamanda bu yöntem, aydınlatmanın neden olduğu değişikliklerin fark edilme oranını azaltmaz. Dahası, özellik şablonunun eşleştirme ve tanıma oranı nispeten yüksektir. Bununla birlikte, geometrik özelliklere dayalı yöntemlerin de sağlamlığı zayıftır İfade ve duruş biraz değiştiğinde, tanıma etkisi büyük ölçüde azalacaktır.

Derin öğrenmeye dayalı yöntemler

Derin öğrenmenin ortaya çıkışı, yüz tanıma teknolojisinde bir çığır açmıştır. Yüz tanımanın en son araştırma sonuçları, derin öğrenme ile elde edilen yüz özelliği ifadesinin, manuel özellik ifadesinin sahip olmadığı önemli özelliklere sahip olduğunu, örneğin orta derecede seyrek olduğunu ve yüz kimliği ve yüz özellikleri için güçlü seçiciliğe sahip olduğunu göstermektedir. , Kısmi tıkanmaya karşı iyi bir sağlamlığa sahiptir. Bu özellikler doğal olarak büyük veri eğitimi yoluyla elde edilir ve modele hiçbir açık kısıtlama veya sonradan işleme eklenmez.Bu, derin öğrenmenin yüz tanımaya başarılı bir şekilde uygulanabilmesinin ana nedenidir.

Yüz tanımada derin öğrenmenin 7 tipik uygulaması vardır: evrişimli sinir ağlarına (CNN) dayalı yüz tanıma yöntemleri, derin doğrusal olmayan yüz şekli çıkarma yöntemleri ve derin öğrenmeye dayalı güçlü yüz pozları modellemesi , Kısıtlı bir ortamda tam otomatik yüz tanıma, derin öğrenmeye dayalı video gözetimi altında yüz tanıma, derin öğrenmeye dayalı düşük çözünürlüklü yüz tanıma ve derin öğrenmeye dayalı diğer yüzle ilgili bilgi tanıma.

Bunların arasında, Convolutional Neural Networks (CNN), çok katmanlı bir ağ yapısını gerçekten başarılı bir şekilde eğiten ilk öğrenme algoritmasıdır.Konvolüsyonel Sinir Ağlarına dayalı yüz tanıma yöntemi, derin gözetim altında bir makine öğrenme modelidir. Verinin yerel özelliklerini araştırabilir, küresel eğitim özelliklerini ve sınıflandırmasını çıkarabilir, ağırlık paylaşım yapı ağı, onu biyolojik sinir ağına daha benzer hale getirir ve örüntü tanımanın çeşitli alanlarında başarıyla uygulanmıştır. CNN, model yapısını optimize etmek ve belirli bir yer değiştirme değişmezliğini sağlamak için yüz görüntüsü uzayının yerel algılama alanını, paylaşılan ağırlıkları ve uzamsal veya zamansal alt örneklemeyi birleştirerek, verilerin kendisinde bulunan yerellik özelliklerinden tam olarak yararlanır.

CNN modelini kullanarak, Hong Kong Çin Üniversitesi Deep ID projesinin yüz tanıma doğruluk oranları ve LFW veritabanındaki Facebook Deep Face projesinin yüz tanıma doğruluk oranları sırasıyla% 97.45 ve% 97.35 idi ve bu, insan görsel tanımanın% 97.5 doğruluğundan sadece biraz daha düşüktü. Çığır açan sonuçlara ulaştıktan sonra, Hong Kong Çin Üniversitesi'nin DeepID2 projesi tanınma oranını% 99,15'e çıkardı. Deep ID2 LFW

SVM

Özyüz

Sirovich Kirby1987Low- dimensional procedure for the characterization of human faces Matthew Turk Alex Pentland Eigenfaces for recognition İlk olarak, bir grup yüz görüntüsünü, ilk eğitim görüntü kümesinin temel bileşenleri olan "Özyüzler", yani "özyüzler" olarak adlandırılan bir özellik vektör setine dönüştürün. Tanıma süreci, özyüz alt uzayına yeni bir görüntü yansıtmak ve onu alt uzaydaki projeksiyon noktasının konumu ve yansıtma çizgisinin uzunluğu ile yargılamak ve tanımaktır.

Görüntüyü başka bir alana dönüştürdükten sonra, aynı kategorideki görüntüler birleşir ve farklı görüntü kategorilerinin yakınsaması nispeten uzaktır.Orijinal piksel alanında, farklı görüntü kategorilerinin dağıtımında basit çizgi veya yüzey bölümleme, dönüştürme kullanmak zordur. Başka bir alana, iyi ayrılabilirler. Eigenfaces PCA PCA Her özellik vektörü veya özellik yüzü, insan yüzleri arasındaki bir değişikliği veya özelliği yakalamaya veya açıklamaya eşdeğerdir. Bu, her insan yüzünün bu karakteristik yüzlerin doğrusal bir kombinasyonu olarak ifade edilebileceği anlamına gelir.

Yerel İkili Örüntüler (LBP)

Local Binary Patterns LBPLBP T.Ojala 1996 A comparative study of texture measures with classification based on featured distributions2002 T.Ojala PAMI LBP Multiresolution gray-scale and rotation invariant texture classification with local binary patterns LBP LBP

LBP LBP LBP

Balıkçı yüzlü

Sir R. A. Fisher1936 The use of multiple measurements in taxonomic problems Sınıflar arası en büyük dağılımı ve en küçük sınıf içi dağılımı elde etmek için bir özellik kombinasyonu yöntemi bulmak için. Fikir basit: düşük boyutlu bir temsilde, aynı sınıflar sıkı bir şekilde bir arada kümelenmeli ve farklı sınıflar olabildiğince uzak olmalıdır. 1997 Belhumer Fisher Fisherface Eigenfaces vs. fisherfaces: Recognition using class specific linear projection

Klasik kağıtlar

Sirovich,L.,Kirby,M.(1987).Low-dimensional procedure for the characterization of human faces.Josa a,4(3),519-524. Eigenpictures Eigenpictures

Turk,M.,Pentland,A.(1991).Eigenfaces for recognition.Journal of cognitive neuroscience, 3(1), 71-86. Bu yöntem, yüz tanıma problemini iki boyutlu bir tanıma problemi olarak ele alır. Tanıma süreci, bilinen yüz görüntüleri arasındaki önemli değişiklikleri yakalayan özellik yüz alt alanına yeni bir görüntü yansıtmaktır. Yüz setlerinin öznitelik vektörleri oldukları için önemli özellikler özyüzler olarak adlandırılır.

Ojala,T.,Pietikäinen,M.,Harwood,D.(1996).A comparative study of texture measures with classification based on featured distributions.Pattern recognition,29(1),51-59. LBP

Ojala,T.,Pietikainen,M.,Maenpaa,T.(2002).Multiresolution gray-scale and rotation invariant texture classification with local binary patterns.IEEE Transactions on pattern analysis and machine intelligence,24(7),971-987. Bu yöntem, sağlam gri tonlama değişimi ve basit hesaplama özelliklerine sahiptir.

Fisher,R.A.(1936).The use of multiple measurements in taxonomic problems.Annals of eugenics,7(2),179-188. Çözüm şudur: düşük boyutlu temsil altında, aynı sınıflar sıkı bir şekilde bir arada kümelenmeli ve farklı sınıflar olabildiğince uzak olmalıdır.

Belhumeur,P.N.,Hespanha,J.P.,Kriegman,D.J(1997).Eigenfaces vs.fisherfaces:Recognition using class specific linear projection. Yale University New Haven United States. Fisher Fisherface

ERET

FERET Bu bölümde aynı kişinin fotoğrafları farklı ifadeler, ışık, duruş ve yaş değişikliklerine sahip. 1 Çoğu Batılıdır ve her bir kişinin içerdiği yüz imgelerindeki değişiklikler nispeten basittir.

CMU Multi-PIE

Carnegie Mellon Üniversitesi tarafından kurulmuştur. Sözde "PIE" Pose, Illumination ve Expression'ın kısaltmasıdır. CMU Multi-PIE CMU-PIE 337 75000 Duruş ve aydınlatma değişikliği görüntüleri de sıkı kontrollü koşullar altında toplanır ve giderek yüz tanıma alanında önemli bir test seti haline gelir.

YALE

15 165

Yale 10 ORL Yale

YALE B

ttps://computervisiononline.com/dataset/1105138686

10 5850 9 64 Duruş ve aydınlatma değişikliklerinin görüntüleri sıkı bir şekilde kontrol edilen koşullar altında toplanır ve esas olarak aydınlatma ve duruş problemlerinin modellenmesi ve analizi için kullanılır. Toplanan insan sayısının az olması nedeniyle, veritabanının daha fazla uygulanması büyük ölçüde kısıtlandı.

MIT

16 2592 27

ORL

https://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase.html

ATT 40 400 , 90%

ORL 10 92×112 20

BioID

https://www.bioid.com/facedb/

1521

UMIST

İngiltere, Manchester Üniversitesi tarafından kurulmuştur. 20 564

IMDB-WIKI

https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

524230 IMDB Wikipedia Regresyonu sınıflandırmaya dönüştüren yeni bir yaş algoritması uygulanmaktadır. 0-100 101 0-100

1

AMiner TOP1000

TOP1000

h-index

h-index h h

h-index 48 h-index 20 40 33% h-index 40 60 60 27% 28% h-index 10 2%

AMiner 1000

IEEE International Conference on Automatic Face and Gesture RecognitionFG citation h-index

Citation

Citation

h-index

h-index

2

6 5

Uygulama alanı

ATM

1

2

3

4

5

pazarlama

Val Morgan OutdoorVMO

VMO DART DART

CVVCheck Value Verify

110 ATM ATM CRS

Gelecek eğilim

1

95%

23D

2D 2D 2D

2017 iPhone X 3D Face IDFace ID

3D

iPhone X 3D 2010 3D 2013 3.45 3D PrimeSense 3D

Face ID Apple pay Face ID emoji Face ID 3D Animojis iMessage

3

4

2D 3D

AI

····

python Öğrenin

Aşama 1: Python girişi Aşama 2: Derinlemesine Python ve iyileştirme Aşama 3: Python ağı ve eşzamanlı programlama Aşama 4: Veritabanı programlama temeli Aşama 5: Linux ortamı programlama temeli Aşama 6: Python temel özellikleri Aşama 7: Web sayfası Programlamanın Temelleri Aşama 8: Python_Django Çerçevesi Aşama 9: Python_Tornado Çerçevesi Aşama 10: Python_ Büyük E-ticaret Projesi Aşama 11: Python Tarayıcı Geliştirme Aşaması 12: Başarılı İş Arama için Mülakat ve Gizli Beceriler Aşama 13: İstihdam Sonrası CTO'ya hızlı büyüme

,

Ruby Ruby tatil fotoğrafları çekti, ancak Huo Jianhua'yı görmedi. Lavaboda otururken öfkeyle övüldü: iyi ayakkabılara sahip bir kız
önceki
Song Qian çok akıllı. Kruvaze ceket hafif gazlı bezle eklenmiştir ve kot pantolonlarla giyilebilir.
Sonraki
TensorFlow, klasik LeNet ağı ayrıntılı öğreticisini uygular
Wuhan'daki bu robot şirketi CCTV'ye gitti ve "Kuşak ve Yol" pazarına girmek için köklü bir İtalyan şirketini satın aldı
Li Zixuan'ın tulum ve netizenler ile sonbahar kıyafetleri giydiğini görene kadar çok zayıf olduğunu düşünmüştüm: sırtı gerçekten güçlü
Bir makalede TensorFlow'un 8 temel noktasını okuyun
Ying Er çok güçlü, bir çift yırtık kottan yeterince göz küresi kazanıyor, netizenler: Sadece dışarı çıkma cesaretiniz varsa
Evergrande 2-1 Luneng, Taliska iki gol attı + serbest vuruş geri sayımı
Ülkenin net yetenek girişi oranında ikinci sırada yer alan Ningbo yetenekleri nasıl çekiyor?
Deng Enxi, 14 yaşındaki bir kıza çok benzemeyen, uzun pembe saçlı beyaz bir elbise giyiyor
RNN-sin sinüs dizisinin en temelli anlaşılması ve gerçekleştirilmesi
La Liga: Aspers, Girona ve Vallecanoping Huesca'yı yakalamak için Celta'yı vurdu
Kazanmak için 6 tur! Tianhai 0-0 SIPG, ikinci yarıda iki kez
Zeng Zhuangshan, gevşek bir ceket giyen ve eksik kıyafetlerin altında oynayan Wu Xuanyi'yi yendi, bacaklar Ju Jingyi'den daha ince
To Top