Uygulama açısından kapsamlı yüz tanıma analizi

Görüntü kaynağı @Visual China

Metin | Bulut Bilgisi (ID: zhiquysk)

Öngörü Endüstrisi Araştırma Enstitüsü'nün Yüz Tanıma Pazarı tahminine göre, 2022'ye kadar Çin'in yüz tanıma pazarı 6,6 milyar yuan'ı aşacak.

Yüz tanıma ile ilgili çeşitli parçalı raporlar da durmadan ortaya çıkıyor, ancak çok az makale yüz tanımayı uygulama perspektifinden sistematik olarak derinlemesine açıklayabilir.

Bu amaçla, okuyucuların, özellikle AI + uygulamalarını düşünen pratisyenlerin, teknoloji uygulamasının ve iş modelinin iki boyutundan bütün resmi görmesini sağlamak için elimizden gelenin en iyisini yapacağız.

Bu yazıda ilk olarak yüz tanımanın teknik uygulamasından bahsediyoruz.

01 Temel yetenekler üst katman uygulamaları-temel katman algoritmalarını belirler

Yüz tanıma ve yüz tanıma gibi algoritmaları aralıklı olarak duymuş olabiliriz, ancak bu algoritmalar arasında bir bağlantı var mı ve bir sistem var mı? Cevap Evet."

Yüz tanıma algoritmalarını temel katman algoritmalarına ve uygulama katmanı algoritmalarına ayırabiliriz.

Temel katman algoritması, yüzün ön işlemesine eşdeğerdir. Bir insan yüzü, uygulama katmanı algoritmaları tarafından işlenmeden ve gerçek sahnelere uygulanmadan önce yüz algılama, özellik anahtar noktası işleme ve kalite modeli filtrelemeden geçmelidir.

Temel katman algoritmasının artıları ve eksileri, son yüz tanıma doğruluğunu ve etkisini büyük ölçüde etkileyecektir.

02 Uygulama inişi, her biri ihtiyaç duyduğu şeyi alıyor - uygulama katmanı algoritması

Şu anda yüz tanıma, kimlik doğrulama ve karşılıklı eğlence alanında en yaygın kullanılanıdır; akıllı etkileşim, veri analizi ve işleme alanlarında, yüz tanıma da aktif olarak keşfediliyor.

Kimlik doğrulama / güvenliğin temel işlevi "kim olduğunuzu" doğrulamaktır ve karşılıklı eğlence alanının özü "özel efekt işleme ile yüzleşmektir"; iki alan ve iki kanalın kendi farklı endüstriyel zincirleri vardır.

Kimlik doğrulama, kimlik doğruluğu ve anti-saldırı gibi göstergelere çok dikkat eden ve iş süreçlerini bağlamak için uygulama senaryolarını birleştiren titiz bir mühendis gibidir.Aynı zamanda endüstriyel İnternet ile birleştirilmiş tipik bir AI örneğidir.

Karşılıklı eğlence alanı, insan doğasını inceleyen, güzellik, çıkartma vb. Gibi çeşitli yüz efektleri yaratan, platform kullanıcı tercihleriyle birleştirilen, hedefe yönelik yüz efekt stratejileri kullanarak insanları yönlendiren ve hatta şekillendiren bir ürün yöneticisi gibidir. Estetik akım.

2.1 Sen kimsin? Kimliği kanıtlayacak medya yok

Günlük hayatımızda hepimizin kimliğimizi medya aracılığıyla (nüfus cüzdanı, çalışma ruhsatı, ehliyet vb.) Kanıtlaması gerekirken, yüz tanıma ile temsil edilen biyometri medyaya ihtiyaç duymaz.

Kimlik doğrulama / güvenliğin temel teknolojileri canlı algılama, yüz karşılaştırma ve yüz aramadır; esas olarak şu alanlarda kullanılır: çevrimiçi uzaktan kimlik doğrulama senaryoları (finansal hesap açma, yüz kaydı, yüz oturum açma vb.), Çevrimdışı gözetimsiz sahneler ( Akıllı ulaşım, yüz erişim kontrolü, yüz çekme, yüz ödeme vb.).

  • Canlı algılama

Bu, kimlik doğrulamasının ilk adımıdır, çünkü önce bu kişinin videolar, fotoğraflar ve maskeler gibi dolandırıcılık eylemleri değil, gerçek bir kişi olduğunu onaylamam gerekiyor.

Canlı vücut algılama teknolojisi açısından şu anda iki ana kategori bulunmaktadır: hareketli canlı bedenler ve sessiz canlı bedenler gibi donanıma nispeten düşük bağımlı olanlar; donanım için belirli gereksinimleri olan ve dürbün canlı cisimler, 3B yapılandırılmış ışık gibi donanıma uyarlanması gerekenler Canlı vücut vb. İkincisinin maliyeti öncekinden daha yüksek olmasına rağmen, daha iyi bir anti-saldırı etkisine sahiptir Çevrimdışı senaryolarda, donanım doğal olarak gereklidir, bu nedenle ikincisi çevrimdışı senaryolar için en iyi seçim haline gelmiştir.

Prensip olarak, tüm yüz fotoğrafları toplanır, fotoğraflar işaretlenir (doğru / yanlış örnekler) ve algoritmayı elde etmek için eğitim için modele gönderilir. Farklı in vivo algılama, çünkü örnek kaynağı farklıdır, örneğin, kızılötesi kameralarla toplanan fotoğraflar gri ölçekli özelliklere sahiptir; 3B yapılandırılmış ışıkla toplanan fotoğraflar derinlik bilgisine sahiptir ve bu da farklı tanıma efektlerine neden olur. Bu nedenle, algoritma ve model yapısına ek olarak, canlı algılamanın anahtarı, görüntü örneğinin kendisinde bulunan bilgi miktarıdır.

  • Yüz karşılaştırması

Benzerliği elde etmek için iki yüz fotoğrafını karşılaştırın; ilki yerinde toplandı, ikincisini nasıl elde edersiniz? Genellikle iki kaynak vardır:

1. Kimlik kartları, ehliyet, ehliyet ve diğer kimlik fotoğrafları gibi kimliğinizi temsil edebilecek başka bir taşıyıcı Bu tür sahneler, finansal hesap açma, yüz kaydı, çevrimiçi araç selamlama sürücüsü kimlik doğrulaması vb. İçin kullanılır ve fotoğraflar yerinde toplanır. Kimlik fotoğrafı bilgileriniz için kişi olduğunuzu onaylayın.

2. Hesap altında bağlanmış yüzler: Genel olarak, ilgili yüzü elde etmek için önce hesaba girmeniz gerekir. Bu tür bir sahnenin tipik uygulaması, yüz girişini kaydırmak, yüz ödemesini kaydırmak vb. Gibi orijinal şifre işlevini değiştirmektir.

  • Yüz araması

Toplanan yüzleri taban veri tabanındaki tüm yüzlerle karşılaştırarak en benzer yüz tabanlı fotoğrafları elde ederek benzerliği elde eder.Belirli bir eşiği aşarsa aynı kişi olarak kabul edilebilir. .

Yüz arama, önceden bir yüz fotoğrafı çekmenize gerek yoktur, sadece yüzünüzü kaydırmanız yeterlidir. Çevrimdışı erişim kontrolü ve çevrimdışı yüz ödeme gibi güvenlik alanlarında yaygın olarak kullanılır. Elbette farklı iş alanlarında yanlış tanımanın sonuçlarına göre yüz aramanın hata toleransı farklıdır; örneğin şantiyede yüz tanımada hata tolerans oranı yüz ödemede hata tolerans oranından daha düşüktür.

Yüz aramanın doğruluğunun, yüz veritabanındaki yüz fotoğraflarının sayısına bağlı olduğu unutulmamalıdır.Veritabanında ne kadar çok yüz fotoğrafı olursa, tanıma doğruluğu o kadar düşük olur. Bu insanlarla aynıdır. 2-3 kişi arasında tanıdığınız kişileri bulmak daha kolaydır ama milyonlarca insan için benzer görünüşe sahip insanlar ne kadar fazlaysa tespit etmek o kadar zordur. Şu anda, endüstrinin iyi yaptığı şey genellikle milyon düzeyli bir yüz veritabanıdır ve tanıma doğruluğu% 95'in üzerindedir.

2.2 Araçlardan topluma, önce eğlence

Karşılıklı eğlence uygulamaları da endüstrinin gelişimiyle derinden uyumludur.

Önceleri akıllı telefonların yükselişiyle birlikte insanların selfie paylaşma ihtiyacı daha da güçlendi. Cep telefonu donanımıyla derinlemesine entegre bir ürün olan güzellik filtreleri, insanların güzelleştiği döneme tanık oldu. Bu dönemde algoritmalar ağırlıklı olarak üçüncü taraf algoritma şirketleri tarafından sağlanıyordu.

4G çağının başlamasıyla birlikte, kısa video sosyal ağ, insanların hayatlarında bir sıcak nokta haline geldi. Güzellik filtreleri ve çıkartmaları aynı zamanda büyük etkileşimli eğlence platformlarına da uygulandı ve bunun ayrılmaz bir parçası haline geldi; kısa video içerik üreticileri için bile, Temel rekabet gücü. Bu nedenle, Kuaishou ve Douyin gibi platformlar kendi geliştirdiği algoritmaları kullanır ve bağımsız olarak geliştirmek için müşteri grubu portrelerini birleştirir.

  • Güzelliği filtrele

Bu, görüntü güzelleştirmede vazgeçilmez bir adımdır Sözde filtre, orijinal olarak, renk düzeltmesi elde etmek ve efektler eklemek için doğal ışığı filtrelemek için kamera merceğinin önüne takılan ek bir merceğe atıfta bulunur. 2008'de Meitu bir hit oldu.İnsanlar orijinal filtrenin hala bu şekilde oynanabileceğini keşfetti.O zamandan beri, güzellik filtresi bir araçtan estetik bir tanımlayıcıya dönüşmeye başladı.

İlk geleneksel algoritma, etkili alanı ana hatlarıyla belirtmek için esas olarak yüz özelliklerinin temel nokta algoritmasını kullandı ve ardından güzellik filtresini gerçekleştirmek için farklı alanlarda parlaklık geliştirme ve gürültü giderme gibi algoritmalar gerçekleştirdi.

Derin öğrenmenin yükselişiyle birlikte araştırmacılar sonuçlara daha fazla önem vermeye başladılar.Tasarımcılar orijinal P görüntüsünü güzelleştirilmiş bir sonuç görüntüsüne dönüştürüp eğitim için kullanıyorlar. İnsanlar yüzlerini güzelleştirdikten sonra ne olmak isterler? Araştırma odağı da değişmeye başladı.

  • Çıkartmalar, yüz füzyonu

Bu daha yüksek bir oyun seviyesi. Çekirdek hala yüz özelliklerinin kilit noktalarıdır.Yüzlerin ve çıkartmaların birleşmesi için, anahtar noktaların sayısı arttıkça, hizalama daha iyi ve daha doğru olur. Yüz füzyonu, iki yüzün kilit noktalarını birleştirmektir.

2.3 İlerlemeye devam edin ve zeka algısı zeka

Yapay zeka, endüstrinin dünyanın dönüşümü için beklentilerini taşır. Bir dereceye kadar, öznitelik tanıma, görüş hattı tahmini, gan vb. Algısal zeka açısından bir adım daha ileriye gitmiştir, ancak olgunlaşmamış teknoloji ve dar ticari uygulama alanları vb. Şimdiye kadar büyük ölçekli bir ticari uygulama elde edilmemiştir. Görsel yapay zekanın bilişsel zekaya geçiş yapmak istediği söylenebilir ve yapay zeka ile yapay zekanın entegrasyonu için hala uzun bir yol var.

Kullanıcıların daha boyutlu verilerini elde etmek, kullanıcı portrelerini, kişiselleştirilmiş önerileri, reklamları ve diğer senaryoları zenginleştirmek için öznitelik tanıma, yaş, cinsiyet, mutluluk, üzüntü, öfke ve diğer duygular ... Kulağa güzel geliyor, değil mi? Sonuçta, verilerin kral olduğu bir çağda, veriler değerdir. Bununla birlikte, ticarileştirmede hala teknik kusurlar var ve tanınma doğruluğu sadece% 70 civarında.

Son zamanlarda, Amerika Birleşik Devletleri de dahil olmak üzere beş uzman, "İnsan Duygusal İfadesini Yeniden Tartışmak: İnsan Yüz İfadelerinden Duyguları Tanımlamanın Metodolojisine Zorluklar" başlıklı makaledeki 1000'den fazla çalışmayı incelemek için iki yıl harcadı (makalenin başlığı "Duygusal İfadeler Yeniden Değerlendirildi: "İnsan Yüz Hareketlerinden Duygu Çıkarmanın Zorlukları") ifade etti: İnsan duygularının ifadesi o kadar zengin ve karmaşıktır ki, basit yüz ifadelerini tanımak zordur.İnsanlar kızdığında, ortalama% 30'dan daha az kaşlarını çatarlar. Kaşlarını çatmak öfke anlamına gelmez, kaşlarını çatmak öfkenin birçok ifadesinden biridir. Aynı zamanda yüz ifadeleri, dil ve durum arasındaki ilişki de çok büyüktür.

  • Görüş hattı tahmini

Yüz özelliklerinin kilit noktalarına benzerdir.Yüz tespit edildikten sonra gözler ve gözbebekleri tespit edilerek gözbebeklerinin merkezi gibi anahtar noktalar kilitlenir ve görüş yönünün koordinatlara göre kilitlenmesi sağlanır. Temelde sınıfta öğrencilerin dikkatini değerlendirmek için kullanılır; AR VR ve diğer yeni donanım etkileşimleri, görüş yönü aracılığıyla videodaki konumu otomatik olarak değiştirir, vb .; reklam, yayaların reklama dikkatini değerlendirmek için; şu anda, piyasa sistemi hala nispeten küçüktür , Yaygın olarak kullanılmamıştır

  • GAN

Tam adı, üretken yüzleşme ağıdır. Asıl amaç, yapay zekanın yaratıcılığa veya hayal gücüne sahip olması için gerçek dünyada var olmayan verileri üretmektir. Ayrıca YZ alanında popüler bir araştırma yönüdür.

GAN'ın çekirdek ağı, bir jeneratör ve bir ayırıcı olarak bölünmüştür; jeneratör, verilerin gerçek veri olup olmadığına karar vermekten sorumludur; iki çekirdek ağ, dinamik dengeye kadar birbirleriyle oyunlar oynar, böylece üretilen veriler sonsuz gerçekçi ve gerçek veriler olur.

Şekilde gösterildiği gibi, rastgele gürültü, gan tarafından üretilen görüntülerin kaynağı olan rastgele oluşturulmuş bazı sayılardır.

Jeneratör, bir dizi rastgele sayıya dayanan sahte bir görüntü oluşturur ve bu sahte görüntüleri, ayrımcıyı kandırmak için kullanır.

Ayırıcı, iki sınıflı bir sinir ağı eğitimi gerçekleştirmek için gerçek görüntünün ve sahte görüntünün verilerini (doğal bir etikete eşdeğer) kullanır ve girdinin gerçek bir görüntü mü yoksa sahte bir görüntü mü olduğuna karar verir ve bir puan verir.

Örneğin, gerçek resim bir dizi yüz fotoğrafıdır. İlk başta, jeneratör tarafından oluşturulan fotoğraflar dağınık olmalıdır, ancak ayırıcı, puanı değerlendirecek ve oluşturduğunuz şeyin gerçek bir görüntü olmadığını (yüz fotoğrafı), bu nedenle jeneratör derin öğrenme, geri yayılım vb. Kendi resimlerinizi değiştirmeye devam edin, ardından oluşturulan resimler dinamik dengeye gelene kadar gerçek yüze daha da yaklaşacaktır.

GAN, aşağıdakiler gibi birçok nedenden dolayı dikkat çekmiştir:

1. Kendi başına denetimsizdir. Şu anda, yapay zekanın ticari uygulamalarında kullanılabilen algoritmaların çoğu denetimli algoritmalardır.Sözetim altında olan algoritmalar çok sayıda örnek gerektirir ve bunları manuel olarak etiketleyerek, yapay olarak derin öğrenme ağının doğru olup olmadığını söyler ve eğitimi yayar, bu nedenle endüstride de "Alay konusu olan" kadar çok insan var.

2. Yapay zekanın bulanık görüntüleri temizleme (yağmuru giderme, buğu çözme, sarsıntı giderme, mozaik giderme vb.) Gibi hayal gücüne sahip olmasına izin verin ve olay örgüsünü tamamlayabilir.Birçok makale gan'ın gelişim umutlarını inceliyor.

03 sonunda yazılı

Herhangi bir teknoloji, teknolojik gelişmeyi de takip eder > Olgun teknoloji > Ticari iniş geliştirme yasası

Teknolojik havuz yenilenmeye devam ederken, iş dünyası da dünyayı dönüştürmek için teknolojik havuzdan uygun teknolojileri araştırıyor;

Bir kompozit teknoloji olarak, yüz tanıma sadece bugünü değil, aynı zamanda geleceği de açmaya devam ediyor. Zor olmasına rağmen beklentiler heyecan verici.

[Titanium Media'nın yazarı: Yunzhike (id: zhiquysk), sahne tanımaya odaklanan bir yapay zeka hizmet sağlayıcısı]

Daha heyecan verici içerik için Titanium Media WeChat ID'yi (ID: taimeiti) takip edin veya Titanium Media Uygulamasını indirin

Bingcheng Kuş Atıcılık Uzmanı Wang Weili: Uçan Kuşlar ve Düşler
önceki
"Nezha" da çeşitli yaşam biçimlerini gördünüz mü?
Sonraki
Aşk? Guangdong'daki en zengin kadın, Qixi Festivali'nden önce kocasına 600 milyon verdi! İşte arkasındaki gerçek geliyor
Kou Jingyao, A Sınıfı, Kamu Güvenliği Bakanlığı'ndan aranan suçlu: 19 yaşında evli ve 4 çocuğu var, kozmetik için yılda 2 milyon harcıyor
190726 Lovely Long Live Serisi Chen Linong'un Size Özel Fan Boyalı Emoji Paketi
Batı Girişimciliği'nin altı aylık raporunun toplu "muhalefetinin" arkasında: Bağlı şirketler 3.600 sahte fatura çıkardı
Henan'daki kıza tecavüz edildi ve öldürüldü ve polis onu "mühürlemek" için para aldığından şüphelenildi. 18 yıl sonra, Interpol Teknik Filo başkanı tutuklandı.
190726 Shun Mao Nong, oyun oynayarak ve mutlu bir şekilde Yazi oynayarak havaalanında göründü.
Bir büyük ve bir küçük Samsung Galaxy Note 10: Destek 5G, S Pen "sihirli değnek" olur
Kazma ve yarasa sert vurdu ... Heilongjiang'daki "siyah bir arabanın" sürücüsü, yolculara misilleme yapmak için yüzünü maskelerdi.
Orak, vahşi "aile yanında kalma otlaklarında" asılı duruyor
Manzaralı noktada 8 deniz ürünü 3.600 yuan harcadı Görevli: İşadamları vicdan sahibi olmalı ve düzeltmek için işi askıya almalı
Telekom dolandırıcılık raporu: Pornografik dolandırıcılıkların% 98'i erkektir ve bu tür kişiler ortalama olarak 7000 aldatılmıştır.
Kore medyası, Güney Kore'deki kozmetik cerrahi endüstrisindeki kaosu ortaya çıkardı: 10 reklam ve dört sahte aracı komisyon% 50'ye ulaştı
To Top