Kuru ürünler Sun Qichao: Yüz Tanıma Teknolojisinde Evrişimli Sinir Ağı Uygulaması

AI Technology Review Press : İPhone X'in piyasaya sürülmesiyle Face ID yüz tanıma teknolojisi insanların günlük hayatına girmeye başladı. Telefonu elimize alıp baktığımızda telefonun kilidini açabiliriz. Yüz tanımada anahtar teknoloji, evrişimli sinir ağıdır.

Son zamanlarda, Leifeng.com AI Araştırma Enstitüsü'nün açık sınıfında, Fransa'daki Montpellier Üniversitesi'nden Sun Qichao, evrişimli sinir ağlarının temel ilkelerini ve yüz tanıma teknolojisinin nasıl çalıştığını anlattı. Açık sınıf oynatma video URL'si:

Paylaşımcı tanıtımı

Sun Qichao: Fransa, Montpellier Üniversitesi'nde MBA öğrencisi, CSDN milyon blog uzmanı.

Konuyu paylaş: Yüz Tanıma Teknolojisinde Evrişimli Sinir Ağının Uygulanması

Ana hatları paylaşın:

  • Evrişimli sinir ağlarının temel ilkelerini ve iş akışını tanıtın

  • Evrişimli sinir ağlarının dört temel bileşenini tanımlayın: havuzlama işlemi, aktivasyon işlevi, tamamen bağlı katman, amaç işlevi

  • Genel yüz tanıma teknolojisinin analizi

AI Araştırma Enstitüsü paylaşım içeriğini şu şekilde düzenler:

Bugün sizlerle yüz tanıma teknolojisindeki evrişimli sinir ağının uygulamasını paylaşacağım. Önce derin öğrenme ve makine öğrenimi arasındaki ilişkiyi tanıtın. Yapay zeka, makine öğreniminin alt alanını içerir, makine öğrenimi ayrıca temsil öğrenmeyi (özellikleri otomatik olarak çıkarabilen bir öğrenme yöntemi) içerir ve derin öğrenme, temsil öğrenmede en temsili öğrenmedir. Bugün bahsedeceğimiz CNN, bir tür derin öğrenme olan evrişimli bir sinir ağıdır.

Makine öğreniminin temel fikri, aslında ihtiyaç duyduğumuz bilgileri öğrenmek için özellikleri kullanmaktır. Bu nedenle, yeni bir tür çalışma, yani özellik mühendisliğinde uzmanlaşmış bir tür mühendis ortaya çıktı. Özellik mühendisliğinin kalitesi, makine öğreniminin nihai etkisini etkileyecektir. Bilim adamları, makinenin, insanların özellik mühendisliği yapmasına gerek kalmadan özellikleri otomatik olarak öğrenebileceğini düşündü. Sonuç şudur: evet. Öğrenmenin, öğrenmek için özellikleri kullanmak olduğu anlamına gelir.

Derin öğrenmenin kullanımı aslında çok basit, yani uçtan uca öğrenmedir. Yalnızca üç adım gereklidir: birincisi, verileri ona (makineye) verin; ikincisi, derin öğrenmenin işlemeyi bitirmesini bekleyin; üçüncüsü, sonuçları alın.

Aşağıda, bugün bahsedeceğimiz evrişimli sinir ağının gelişim geçmişine bir göz atalım:

1980'de bilim adamları, "Neurocognition" Şimdi "nörobiliş", evrişimli sinir ağlarının öncülü olduğuna göre;

1998'de iki bilim adamı, gradyan öğrenmeye dayalı evrişimli bir sinir ağı önerdi. LeNet . Görüntü tanımanın ilk büyük ölçekli uygulamasıdır. O zamanlar Amerika Birleşik Devletleri'nde çok sayıda posta işi, özel personelin posta kodunu ve posta adresini bildirmesini gerektiriyordu. Manuel yaparsanız, verimlilik çok düşük, bir kişi bir saniyede kaç tanesini tanıyabilir? Tanıma hızı hızlı olsa bile, insan hızı ne kadar hızlı olursa, hata oranı o kadar yüksek olabilir Bu nedenle, bu LeNet el yazısıyla yazılan numaraların karakter tanımasına uygulanır ve hata oranı sadece% 1'dir ve bu büyük ölçekte kullanılabilir;

2012 yılında Hinton ekibi evrişimli sinir ağı Alex-net'i önerdi ve ekip Profesör Li Feifei'nin Image Net yarışmasına katıldı ve şampiyonluğu kazandı. O zamanlar, ikinci sıraya göre% 12 daha yüksek bir doğruluk oranıyla çok ilerideydi. Geçmişte, birincilik genellikle ikinci sıranın sadece bir veya iki puan önündeydi ve yüzde üç veya dört puan çok fazlaydı, ancak bu sefer takım yüzde 12 puan öndeydi. Bunun nedeni, Alex-net'in ReLU etkinleştirme işlevini, maksimum havuzlamayı, DROP Out'u ve GPU hızlandırmayı ilk kez kullanmasıdır.

2014 yılında Google, Başlangıç-net , Ana fikir, tekrar tekrar istiflenebilen, hata oranını Alex-net'in yarısına düşüren, oldukça verimli bir evrişimli sinir ağı yapısıdır;

2015'te Microsoftun ResNet Başarıyla eğitildi 152 kat Derin ağ. Daha önceki bazı sinir ağlarının buraya girişi vardır ve ortada birçok nöron vardır, ancak yalnızca bir katman vardır. Bununla birlikte, artan seviyelerin teknolojisinde atılımlara ulaşmak zordu. Microsoft'un ResNet'in 152 katmana çıkarılması bir dönüm noktasıdır. Aynı zamanda hata oranını% 3,46'ya düşürdü ve kaydı yeniden yeniledi.

O zamandan beri, temelde her yıl veya hatta birkaç ayda bir, yeni ağ yapısı, daha derin ağ eğitim yöntemleri vb. Gibi yeni nesil bir teknoloji olacaktır. CNN'in derin öğrenme dalgasına öncülük ettiği söylenebilir .

Öyleyse, evrişimli bir sinir ağı tam olarak nedir? Çekirdeği evrişim işlemidir.

Aşağıdaki şekle bakabilirsiniz: Sol üst köşe 5 * 5 yeşil matristir ve matristeki sarı alan 3 * 3 evrişimli çekirdektir. Sarı alanın işlevi, matriste kapsanan sayıların ağırlıklı toplamını gerçekleştirmektir ve hesaplanan sayı (mor alana bakın) yeni bir matrise konulacaktır.

Sonra sağ üst köşedeki ikinci resme bakın.Sarı alan bir sıra sağa hareket eder, bu bir adımdır. Bu "adım" adım uzunluğunu ifade eder - CNN'deki başka bir parametre (bir parametre evrişim çekirdeğidir), burada Adım boyutu 1 adıma ayarlanır. 1 adım ilerledikten sonra sarı alana aynı ağırlıklı toplam yapılır ve yeni bir sayı elde edilir (ilk numara ile birlikte mor alana konulur).

Sarı alanın tamamını bir fotoğraf çerçevesi olarak kabul edebiliriz, boyutu, uzunluğu ve genişliği sabittir, sıra soldan sağa, yukarıdan aşağıya, üç kez hareket eder, üç yeni numara birer birer ve sonra birer birer görünür. Matriste hesaplayın. Bu kısmi bir işlemdir.Orijinal veriler (5 * 5 giriş), evrişimin sonucunu elde etmek için 9 kez çevrilir. Bu sonuç, yeni bir 3 * 3 matris olan evrişim özelliği olarak adlandırılır - bu matris, bir sonraki işlem katmanının girdisi olarak kullanılır ve bazı havuzlama işlemleri gerçekleştirilir.

Daha sonra CNN'in iş akışına bakacağız. İlk önce birkaç temel konsepte bakın: Birincisi az önce bahsettiğimiz evrişim işlemi; ikincisi de çok önemli olan havuzlama işlemi; üçüncüsü ise aktivasyon işlevi, tamamen bağlantılı katman ve amaç işlevi.

Sonra aşağıdaki uzun resme bakın. İlk adımda, önce orijinal veriyi ona (makineye) giriyoruz ve ardından evrişim işlemini evrişimli katman + havuz katmanı + aktivasyon fonksiyonunun bir kombinasyonu şeklinde gerçekleştiriyoruz. Bundan sonra, sonraki evrişim işlemlerini gerçekleştirmek için bu kombinasyonu kullanın ... ve tüm özellikler çıkarılıncaya kadar döngüye devam edin. Ardından, çıkarılan tüm özellikler, tahmin edilen değeri elde etmek ve hedef değer ile karşılaştırmak için tam olarak bağlı katmana bağlanır. Son olarak, makine ikisi arasındaki farkı onaracak ve yeniden alacaktır. Bu tam bir iş akışıdır.

Sonra evrişim işlemine bakarız, parametresi yoktur, sadece bunun için maksimum havuzlamayı ve ortalama havuzlamayı ayarlamamız gerekir. Maksimum havuzlama, kapsama alanının maksimum değerini çıkarmak anlamına gelir - amacı, en önemli özellikleri çıkarmak ve daha az belirgin olan bazı özellikleri göz ardı etmektir.

Evrişim işleminin üç özelliği vardır:

Birincisi, özellik değişmezliğidir. Bir resim sarıldıktan sonra resmin sağ alt köşesinin düz bir çizgi olduğunu düşünebiliriz.Görüntünün sol üst köşesinde tanımlanan (grafik) evrişim özelliği, düz çizginin evrişim özelliği ile tutarlıysa, sol üst köşedeki grafiğin de bir çizgi olması gerekir. Düz çizgi, çünkü özellikleri aynı. Bu aynı zamanda evrişimli sinir ağlarının bir özelliğidir, yani iki özelliğin göreceli konumu, resimdeki mutlak konumlarından daha önemlidir.

İkinci özellik, özellik boyutunun azaltılmasıdır. Yukarıda 5 * 5'lik bir matris kullandık ama aslında 10024 * 798 resim pikselinin çok fazla performans tüketmesi gerekiyor ve çoğu gereksiz hesaplamalar.Maksimum havuzlama en önemli özellikleri ortadan kaldırmaktır. Bazı bilgi işlem kaynaklarını kurtarmak için bu daha az belirgin özellikleri bırakın.

Üçüncü özellik, fazla takmayı önlemektir. En belirgin özellikler çıkarıldığı için aşırı uyum önlenebilir.

Aktivasyon fonksiyonuna tekrar bakalım. Daha önce makine öğrenimi ile uğraşan öğrenciler, 0-1 değer aralığına sahip bir eğri olan başka bir etkinleştirme işlevi olan sigmoid işleviyle karşılaşabilirler.

Bahsedeceğimiz ReLU fonksiyonu aşağıdaki şekilde mavi çizgi ile ifade edilebilir. Aslında parçalı bir fonksiyondur.Bu işleve 0'dan küçük bir değer verdiğinizde, ne kadar negatif olursa olsun, 0 döndürür. 0'dan büyük veya 0'a eşit bir değer verdiğinizde, hangi değer verilirse verilsin, kendisini döndürebilir (X) Bu aslında çok basit bir fonksiyondur.

Peki aktivasyon işlevinin kullanımı nedir?

Mesela elimde bir iğne tutuyordum ve öbür elimi delecektim, ilk başta çok uzaktı ve hiç ağrı hissetmedim sonra iğne diğer elime yavaşça yaklaştı. , Elimdeki sinir beynime eğer elim sıkıştığında ağrı hissedeceğimi söyleyecek, bu da "aktivasyona" eşdeğerdir.

İğne ile diğer elim arasındaki mesafe için bir eşik var. Mesafe bu eşikten az olduğunda ve sonunda yaklaştığında, sinirlerim hemen beynime (ağrıyı) söyleyecek ve böylece "acımı" harekete geçirecek. -Aktivasyon işlevi bu ilkedir. Makine genellikle bir şey eğitiyorsa, eşiğe ulaşmazsa özellik etkinleştirilmeyecek; eşiği aşarsa özellik etkinleştirilecek ve çıktı alınacaktır.

Daha aşağıda, evrişimli sinir ağlarının işleyişine genel bir perspektiften bakacağız. Önce aşağıdaki resme bakın.Bu bir harf A'dır.Önce bir evrişim işlemi gerçekleştirin ve ardından ayarlanmış evrişim çekirdeği ve adım boyutuna göre evrişim çekirdeğinin özelliklerini bulun ve son olarak tüm aktif nöronları ve son bütünü birleştirin. Bağlantı katmanları bire bir karşılık gelir ve matris çarpımı yoluyla gerçekten aktif olup olmadıklarına bakın.

Tamamen bağlantılı katman, genellikle sonunda uygulanan tüm CNN'de bir "sınıflandırıcı" rolünü oynar.

Sonra amaç işlevi var. Evrişimsel sinir ağlarındaki çoğu regresyon problemi Öklid mesafesini kullanır. Algoritma:

. Genellikle 1'den n'ye kadar olan ve iki sayı arasındaki farkı hesaplayan bir toplama formülü olan en sağdaki formülü kullanırız.

Bu Avrupa mesafesinin faydası nedir? Örneğin, iki hedef yakınsa benzerlik daha yüksek olacaktır. Bu nedenle, Öklid mesafesini bularak benzer olup olmadıklarını yargılayabiliriz.

Evrişimli sinir ağlarının temel ilkeleri ve birkaç temel kavram tanıtıldı. Sonra giriyoruz Yüz tanıma süreci dört adıma bölünmüştür: ilk adım yüz sınırı algılama, ikinci adım görüntü kalibrasyonu, üçüncü adım görüntü dönüştürme ve dördüncü adım vektör karşılaştırmadır.

İlk adım, yüz sınırı tespitidir. Bir resimde birden fazla yüz olabilir, ancak birden çok yüz olabilir. Kaç tane yüz olursa olsun, önce yüzün özelliklerini karşılayan çerçeveyi bulup çerçeveyi kesiyoruz.

Nasıl müdahale edilir? Konumlandırma. Yüzün özelliklerine göre konumlandırmaktır Az önce söylendiği gibi, belli bir pozisyonda göz varsa ve simetrik yerde göz varsa (makine) gözün pozisyonunu ve sonra gözün köşesini bulabilir. . Yüz tanımada, sınır özelliklerinin aralığı çok önemlidir, çünkü makine bunlara dayanarak tam bir yüz pozisyonu çizebilir. Makinenin başvurabileceği temel özelliklerden biri çenedir çünkü ağız köşeleri açılıp kapanabilir, ancak çene genellikle fazla değişmez. İkincisi kaşlar - gözleri bulduğunuzda kaşları bulmak kolaydır. Üçüncüsü burun köprüsü, burun ucu, üst ve alt dudaklardır.

Bu özellikleri bulduktan sonra, yüzün sınırını bulmanız gerekir - bu bir kare yüz, bir kavun çekirdeği yüzü ve bir yuvarlak yüz olabilir.Makine, yüz sınırında bazı noktalar oluşturacak ve ardından karşılaştırmak için bir grafik kenarlık (yuvarlak kenarlık gibi) kullanacaktır. Biraz kısa bulunursa, tamamen tutarlı olana kadar katsayıyı ayarlamaya devam edecektir.

Ancak yakalarken, yüze yakın sınıra göre tam olarak kesilemeyecek belirli bir mesafe bırakmanız gerekir.Örneğin yukarıdaki resimdeki saç kısmında (kişi) şapka takıyor olabilir, bu nedenle makine tam olarak yakalama yapamaz ama etrafta bırakabilirsiniz. Belirli bir boşluk bırakın ve ardından resmi kesin. Bir yüzün birden çok noktası varsa, birden çok yüzün kenarlıklarını kesin.

İkinci adım, görüntüyü kalibre etmektir. Bu kavram aslında bilgisayar veri işleme fikri ile tutarlıdır. Makineye resimler, sesler, sayılar, dizgiler veya diğer bazı verileri verirseniz verin, bunları bilgisayarın tanıyabileceği verilere dönüştürür.

Aynısı yüz kalibrasyonu için de geçerlidir.Makinenin kafasının eğilmiş, alçaltılmış veya kaldırılmış olmasına bakılmaksızın - konum doğru değildir, önce yüzün çerçevesini kesin ve her noktayı (aşağıdaki şekilde yeşil nokta) bulun ve sonra Noktaya göre bir koordinat bulun ve onu gerçekte düzeltilmiş yüzün koordinatı ile karşılaştırın. İkisi arasındaki fark, kafa eğiminin açısıdır. Görüntüyü ters yönde döndürürseniz, görüntü düzeltilecektir.

Bu etki aynı zamanda çok kullanışlıdır çünkü gereksiz hataları azaltabilir. Aynısı makine öğrenimi için de geçerlidir. Onu bir grup işlenmemiş veri üzerinde eğittiğinizde, nihai eğitim sonucu sadece kötü değil, aynı zamanda tam tersi de olabilir. Hepiniz için alınan kararlar Yanlış. Örneğin, akıllı ürün tavsiyesi için, girdi verileri işlenmezse veya ayarlanan boyutlar işe yaramazsa, makine yanlış yönde önerilerde bulunabilir.

Bu nedenle verilerin işlenmesi çok önemlidir.Gereksiz hataları ortadan kaldırmak ve tüm algoritmaları gerçekten faydalı hesaplamalara sokmak gerekir - bu fikir çok önemlidir.

Üçüncüsü, vektör için görüntüdür. Görüntü dönüştürme vektörü nasıl oluşturulur? Evrişim ve havuzlama işlemlerinden sonra oluşturulan görüntü vektörüdür. Vektörlerin hem büyüklüğü hem yönü vardır.İki vektör arasındaki açı çok küçükse, iki vektör birbirine çok yakındır.

Vektörler arasındaki açıyı karşılaştırarak, iki hedefin benzer olup olmadığı değerlendirilebilir. Örneğin, bilgisayarla görme ile ilgili iki makalenin benzer olup olmadığına karar vermeliyiz. İlk olarak, iki makale bulmalı ve makalelerden birinin anahtar kelimelerini çıkarmalıyız - bir anahtar kelime bir vektördür. Tüm anahtar kelimeler bulunduktan sonra, Vektörün yönünü ve büyüklüğünü hesaplayın. Aynı işlem diğer makalede de gerçekleştirilir.Son olarak, makine iki vektör setini karşılaştırır.Eğer hemen hemen örtüşüyorlarsa, iki makalenin içeriği çok benzerdir. Vektörlerin rolü, makine öğrenmesinde çok önemlidir.

Görüntü bir vektöre dönüştürüldükten sonra, bu vektörü hesaplamanız ve ardından bunu amaç fonksiyonunun vektörüyle karşılaştırmanız ve ardından aralarındaki açıyı bulmak için geri kalan teoremi kullanmanız gerekir - önceki iki benzer makale arasındaki karşılaştırma bunu kullanır. Gerekçe. Bu vektör ve hedef vektörün tamamen çakışması gerekmez İç açı küçük olduğunda, açı eşik içinde olduğu sürece, ikisinin benzer olduğu ve eşiklerin hepsinin yapay olarak ayarlandığı yargılanabilir.

Son adım, vektör karşılaştırmasıdır. Aynı yüz için karşılık gelen vektör mesafesi küçüktür; Farklı yüzler için vektör mesafesi doğal olarak daha büyüktür.

Vektör hesaplamasında, karşılık gelen elemanların çarpımlarının toplamı olan iç çarpım bir isim vardır ve yukarıda bahsedilen açı hesaplanabilir. Formül şudur:

. Açı ne kadar küçükse, iki yüz o kadar benzerdir.

Yukarıdakiler, bu sayıda davetliler tarafından paylaşılan tüm içeriklerdir. Daha fazla genel sınıf videosu için lütfen izlemek için Leifeng.com'daki AI Araştırma Derneği'ne gidin. WeChat genel hesabını takip edin: AI Araştırma Enstitüsü (okweiwu), en son genel sınıf canlı yayın süresi önizlemesini alabilirsiniz.

"Infernal Affairs" üçlemesi yüksek ve alçak mı gidiyor? Önce kral bombasını fırlatmak, dört 2s o kadar da şaşırtıcı olmayacak
önceki
Ulusal Gün kendi kendine sürüş turunuzun güvenli olduğundan emin olmak için bu güvenlik önlemlerini aklınızda bulundurun.
Sonraki
TGP'den sonra, Tencent'ten Douyu'nun oyun satışlarına dahil olması güvenilir mi?
Ke Pei, Tsinghua Üniversitesi: Küçük Sohbet ve Diyalogda Cümle Kontrolü AI Araştırma Topluluğu 65. Ders
Bin yuan makine olmasına rağmen, fotoğraf çekmek asla bin yuan değildir! Lenovo S5 Pro Ice Soul Blueprint Ödülü
Yeni nesil Hyundai Accent resmi sürümü: genç ve dinamik tarz
Tencent çukurda oyun satmaya devam ediyor, başka bir steam'i kopyalayabilir mi?
Huawei'nin ilkbahar yeni ürün lansmanının resmi duyurusu: Changxiang 9S + Changxiang 9e + Tablet M5 Youth Edition bir araya geliyor
NEIGHBORHOOD x CORE JEWELS takı, değeri ve dokusu ne olursa olsun tam nottur!
Yu Nan ile çalışan yönetmenler, sadece Wu Jing ve "Wolf Warrior 2" yi mi tanıyorsunuz?
Tencent, Google'ı takip ederek oyuna girdi, bulut oyunları bir sonraki büyük hit olacak mı?
Uzun beyaz saçlar korkunç değil! Gri saç ve vücut arasındaki ilişkiyi netleştirmek için
Apple H1 yongasıyla donatılmış, kablosuz şarj kutusu ile donatılmış yeni nesil AirPod'lar açıklandı
On yıl önce Tayvan'ın idol dramasında Joe Chen ve Wang Xinling, ülkenin yarısını işgal etmek için bir araya geldi.
To Top