Jest tanımada Sugeno fuzzy modeline dayalı ANFIS uygulaması

Jiang Leilei, Qin Lijuan, Li Wuju

(Bilgi Bilimi ve Mühendisliği Okulu, Shenyang Ligong Üniversitesi, Shenyang 110159, Liaoning)

: Hareket tanıma, insan-bilgisayar etkileşimi teknolojisi araştırmalarında önemli bir mod haline geliyor.Kameralar ve bilgisayarla görme teknolojisi, statik hareket görüntülerini yakalamak için kullanılıyor, YCrCb uzayında ten rengini modellemek için Gauss dağılımı kullanılıyor ve arka plan rengi piksel olasılığı hesaplanarak temiz pikseller bölümlere ayrılıyor. Hareketli görüntü ve ardından hareketleri tanımak için Sugeno bulanık modeline dayalı uyarlanabilir nöro-bulanık çıkarım sistemini kullanın. Geleneksel sinir ağı tanıma sistemi ile karşılaştırıldığında, bu tanıma yöntemi daha iyi uyarlanabilirliğe ve sağlamlığa sahiptir. Deneysel sonuçlar gösteriyor ki Sugeno fuzzy modeline dayalı uyarlanabilir nöro-bulanık çıkarım sistemi özellik öğrenmeyi etkin bir şekilde gerçekleştirebiliyor ve doğru tanıma oranı yaklaşık% 95'e varabiliyor Statik jest tanıma için çok etkili bir yöntem.

: İnsan-bilgisayar etkileşimi; jestler; Sugeno bulanık modeline dayalı; uyarlanabilir nöro-bulanık akıl yürütme

: TP751; TP753 Belge tanımlama kodu: ADII: 10.19358 / j.issn.1674-7720.2016.24.015

Alıntı biçimi : Jiang Leilei, Qin Lijuan, Li Wuju. Hareket tanımada Sugeno fuzzy modeline dayalı ANFIS uygulaması J. Mikrobilgisayar ve Uygulama, 2016,35 (24): 50-53.

0 Önsöz

Son yıllarda, bilgisayar teknolojisinin hızla gelişmesi ve İnternet uygulamalarının hızla yaygınlaşması ile insan-bilgisayar etkileşimi insanların günlük yaşamlarının vazgeçilmez bir parçası haline geldi [1]. Doğal insan-bilgisayar etkileşimi yöntemi, işlemin zorluğunu azaltabilir ve vücudun tek bir bölümünün tekrarlanan emeğini önleyebilir. Geleneksel anlamda, cihazda okumak için fare, klavye, uzaktan kumanda, dokunmatik ekran, oyun kumanda kolu vb. Gibi bilgisayara bilgi girmenin etkileşimli yöntemlerinin tümü makine merkezlidir ve kullanıcıların makineyi uygulamadan önce önceden belirlenmiş özellikleri öğrenmeye adapte olması gerekir. Temel operasyon. Bu insan-bilgisayar etkileşim yöntemleri, insan-bilgisayar iletişiminin darboğazı haline geldi, çünkü kullanıcılar bilgisayarlarla etkileşimde bulunmak için en alışkın oldukları yöntemleri (jestler vb.) Kullanamıyorlar.

Jestler, insanların bilinçli olarak yaptığı el hareketleridir.İster alet çalıştırma, ister başkalarıyla iletişim kurma, jestler, hareketi yapan kişinin düşüncelerini ve niyetlerini ifade edebilir. Ortaya çıkan hareket tanıma teknolojisi, insanlara bilgisayarlarla etkileşim kurmanın en doğal yolunu sağlar. Hareket tanıma teknolojisine dayalı olarak, insanlar bilgisayar tarafından oluşturulan sanal ortamla doğrudan etkileşime girebilir. Şu anda, hareket tanıma teknolojisi araştırması, sanal gerçeklik teknolojisi araştırmalarının ana içeriklerinden biridir.

1 Hareket görüntülerinin ön işleme ve segmentasyonu

ANFIS [2], Şekil 1'de gösterildiği gibi jest görüntü işlemenin [3] genel sürecinde kullanılır.

1.1 Görüntü ön işleme

Karmaşık bir arka planda, farklı aydınlatma değişiklikleri de ten renginin parlaklığının değişmesine neden olur ve bu da güvenilir bir renk alanı modeli gerektirir. Çalışmalar, YCrCb renk uzayının [4], insan ten rengini tam olarak ifade edebilen ve parlaklığın etkisini büyük ölçüde ortadan kaldırabilen, renk uzayının boyutunu küçültebilen ve hesaplama karmaşıklığını azaltan parlaklık ve renk ayrımı avantajlarına sahip olduğunu göstermiştir. YCrCb uzayında cilt rengini modellemek için Gauss dağılımı kullanılır ve ten rengine ait görüntüdeki her noktanın olasılık değeri hesaplanır ve hareket alanı bölümlere ayrılabilir. Gauss dağılımına dayalı cilt rengi modellemesi için hesaplama formülü aşağıdaki gibidir:

P (Cb, Cr) = exp {0,5 (x m) TC 1 (x m)}

Bunlar arasında: x, YCrCb uzayındaki örnek pikselin değeridir x = (Cb, Cr) T, m, YCrCb uzayındaki cilt renginin örnek ortalama değeridir, m = E (x); C, cilt benzerlik modelinin kovaryans matrisidir, C = E {(x-m) (x-m) T}.

Görüntünün her pikselinin cilt rengine ait olduğu olasılık değeri P hesaplanarak, tam bir ten rengi olasılık dağılım matrisi oluşturulabilir ve cilt rengi olasılık matrisinin uyarlanabilir değer ikilileştirmesini gerçekleştirmek için maksimum sınıflar arası varyans yöntemi (OTSU) kullanılır. Dönüştürülen görüntüde, 1 piksel değerine sahip parlak bir renk alanı, bir cilt rengi noktasını temsil eder ve 0 piksel değerine sahip koyu renk alanı, ten rengi olmayan bir renk noktasını temsil eder.

Gauss filtreleme, hareket görüntülerindeki gürültüyü ortadan kaldırmak, yararlı hareket bilgilerini geri yüklemek, hareket hedeflerinin algılanabilirliğini artırmak ve arka plan görüntü verilerini büyük ölçüde basitleştirmek için kullanılır. İkilileştirme ve filtrelemeden sonra, hareket alanının kenarında çapaklı veya eksik konturlu farklı boyutlarda delikler olacaktır.Morfolojik genişletme algoritması ikili görüntüdeki parlaklık alanını genişletebilir ve erozyon algoritması ikili görüntüyü genişletebilir. Görüntüdeki karanlık alanlar. İkili görüntüdeki izole gürültü noktalarını ve hareket alanının kenarının düzensiz çıkıntılı kısmını kaldırın ve aynı zamanda ikili görüntüdeki delikleri doldurun.

1.2 Hareket görüntülerinin segmentasyonu

OTSU yöntemi [5] dinamik bir eşik segmentasyon algoritmasıdır. Hareket görüntüsünün gri özelliklerine göre, hareket görüntüsü hedef ve arka plan olmak üzere iki kısma bölünür ve arka plan ile hedef arasındaki farkı en büyük yapmak için eşik değeri seçilir. Arka plan ve hedef arasındaki sınıflar arası fark ne kadar büyükse, iki parça arasındaki fark o kadar büyük olur ve hedef görüntünün arka plan görüntüsünden bölümlere ayrılması o kadar kolay olur.

Şimdi, hareket görüntüsünün gri değeri 1 ~ N'dir ve t seçilen eşiktir, ardından görüntü iki gruba ayrılır. A'nın arka planı temsil ettiğini varsayarsak, PA arka planın olasılığıdır, B hedeftir, PB hedefin olasılığıdır ve Pi, N gri seviyelerinin her birinin olasılığıdır. Arka plan ve hedef bölgelerin sınıflar arası varyansını hesaplama süreci aşağıdaki gibidir:

(1) Arka plan ve hedef olasılığı:

T'nin değerini 1 ile N arasında değiştirin. 2 maksimum olduğunda, karşılık gelen t değeri optimal eşiktir, dolayısıyla 2 eşiği seçmenin bir fonksiyonudur. Bu yöntem, görüntünün histogramının bariz çift tepe noktalarına sahip olup olmadığına bakılmaksızın tatmin edici sonuçlar elde edebilir. Bu makale, iyi sonuçlar elde etmek için yukarıdaki yöntemi kullanır.Şekil 2 ve Şekil 3, iç ve dış hareket segmentasyonunun etki diyagramlarıdır.

2 Uyarlanabilir Nöro-Bulanık Çıkarım Sistemi (ANFIS)

Uyarlanabilir Sinir Bulanık Çıkarım Sistemi [6] (Uyarlanabilir Sinir Bulanık Çıkarım Sistemi, ANFIS), sinir ağı bilgi depolama yetenekleri ve öğrenme yetenekleri yardımıyla bulanık mantık yöntemlerini ve sinir ağı yöntemlerini organik olarak bütünleştiren yeni bir sinir ağı yapısıdır. Çok çeşitli eğitim örneklerinden öğrendikten sonra, kontrol kuralları, her dil değişkeninin üyelik işlevi ve her kuralın çıktı işlevi optimize edilir, böylece ANFIS sistemi kendi kendine adaptasyon, kendi kendine organizasyon ve kendi kendine öğrenme yönünde gelişir.

Sugeno bulanık modeli, belirli bir girdi / çıktı veri kümesinde bulanık kurallar oluşturmanın sistematik bir yoludur. Birinci dereceden Sugeno bulanık modeli aşağıdaki gibidir:

y = k0 + k1x1 + k2x2 + + kmxm

Şekil 4, Sugeno bulanık modeline dayalı bir uyarlanabilir nöro-bulanık çıkarım sistemi modelini göstermektedir.

Her katmanın rolü aşağıda tartışılmaktadır.

İlk katman, girdi katmanıdır. Bu katmandaki nöronlar, dış sinyalleri basitçe ikinci katmana, yani

y (1) i = x (1) i

Bunlar arasında, x (1) i, birinci katmandaki i nöronunun girdisidir ve y (1) i, birinci katmandaki i nöronunun çıktısıdır.

İkinci katman, bulanıklaştırıcı katmandır. Bu katmandaki nöronların rolü fuzzifikasyon işlemlerini gerçekleştirmektir. Bulanık nöronun bir zil aktivasyon işlevi vardır. Çan şeklindeki etkinleştirme işlevi, şu şekilde tanımlanan çizgi ile normal çan şeklindedir:

Bunların arasında, x (2) i, ikinci katmandaki i nöronunun girdisidir ve y (2) i, ikinci katmandaki giriş nöronunun çıktısıdır. ai, bi, ci, sırasıyla nöron i'nin çan şeklindeki aktivasyon fonksiyonunun merkezini, genişliğini ve eğimini kontrol eden parametrelerdir.

Üçüncü katman, bulanıklaştırıcı katmandır. Kural nöronu, ilgili bulanık nörondan girdi alır ve temsil ettiği kural uyarımının yoğunluğunu hesaplar. ANFIS'te, önceki kuralın bağlantısı "ürün" işlemi ile değerlendirilir. Bu nedenle, üçüncü katmandaki nöronların çıktısı şu şekilde ifade edilebilir:

Bunlar arasında, x (3) ji ve y (3) i, normal nöron i'nin üçüncü katmanının girdisi ve çıktısıdır. Örneğin:

y (3) 1 = A1 × B1 = 1

1 değeri, kural 1'in uyarma yoğunluğunu veya gerçek değerini temsil eder.

Dördüncü katman, normalleştirme katmanıdır. Bu katman, belirli bir kural için normalleştirilmiş uyarma yoğunluğunu alır ve hesaplar. Normalleştirilmiş yoğunluk, belirli bir kuralın uyarma yoğunluğunun tüm kuralların uyarma yoğunluklarının toplamına oranıdır ve verilen kuralın nihai sonuca katkısını temsil eder. Bu nedenle, katman 4 nöron i'nin çıktısı:

Beşinci katman, bulanıklaştırma katmanıdır. Bu katmandaki her bir nöron, kendi normalleştirilmiş nöronuna bağlanır ve aynı zamanda ilk giriş x1 ve x2'yi alır. Bulanıklaştırma nöronu, verilen kuralın ağırlıklı post-term değerini hesaplar:

y (5) 1 = x (5) i [ki0 + ki1x1 + ki2x2] = 1 [ki0 + ki1x1 + ki2x2]

Bunların arasında, x (5) i ve y (5) i sırasıyla beşinci katman bulanıklaştırma nöron i'nin girdisi ve çıktısıdır ve ki0, ki1 ve ki2, i kuralının sonraki parametrelerinin kümesidir.

Altıncı katman, işlevi ANFIS'in toplam çıktısını y üretmek için tüm bulanıklaştırma nöronlarının çıktısının toplamını hesaplamak olan toplam nörondur:

y = ni = 1x (6) i = ni = 1i ki0 + ki1 + ki2

3 Hareket tanımada Sugeno fuzzy modeline dayalı ANFIS uygulaması

3.1 ANFIS öğrenme örneği

İlk olarak, eğitim için 1 ~ 10 hareket örneği seçin. Eğitim örneklerinin sayısındaki farklılık nedeniyle bireysel kategorilerin tepkisinin çok hassas veya çok yavaş olmasını önlemek için her bir hareket türü için eğitim örneği sayısı yaklaşık olarak eşit olmalıdır. Aynı zamanda, eğitim hızını büyük ölçüde artırabilir ve ağ tuzaklanmasını önleyebilir Yerel minimum.

Şekil 5'te gösterildiği gibi geleneksel Çin standart hareketlerini örnek olarak alın.

Sinir ağının [7] değişmez tanıma yeteneği olmadığından, ağı hareketlerin dönüşüne ve genişlemesine değişmez kılmak için, çeşitli durumlarda mümkün olduğunca hareket örneklerini seçmek gerekir. Her hareket, eğitim için 200 örnek seçer ve ağ sisteminin daha karmaşık bir arka plan altında daha yüksek bir tanıma oranına sahip olmasını sağlamak için farklı yönlere ve farklı boyutlara sahip hareket örneklerini seçmeye çalışır. Eğitim örneği Şekil 6'da gösterilmektedir.

Önceden işlenmiş hareket görüntüsü özelliği vektörünü çıkarın ve sistem parametrelerini birlikte eğitin.

3.2 Hareket tanıma sonuçlarında Sugeno bulanık modeline dayalı ANFIS

Özellik vektörü, tanıma sisteminin girdisi olarak bölümlere ayrılmış hareket görüntüsünden çıkarılır. Bu makale aşağıdaki üç tanıma yöntemini kullanır: uyarlanabilir nöro-bulanık çıkarım sistemine (ANFIS) dayalı tanıma yöntemi, BP sinir ağına dayalı tanıma yöntemi [8] ve bulanık sinir ağına [9] dayalı tanıma yöntemi ve üçünün tanıma oranı karşılaştırılır. Sistem öğrenimi ve girdisinin rahatlığı için, bu makale öğrenme için aynı ve aynı sayıda örnek kullanır.Aynı koşullar altında 200 deneyden sonra elde edilen sonuç şudur: Uyarlanabilir nöro-bulanık çıkarım sistemine (ANFIS) dayalı hareket tanıma oranı diğerlerinden daha yüksektir İki yöntemin tanınma oranı yüksektir. Spesifik deneysel veriler Tablo 1'de gösterilmektedir.

Şekil 7'de gösterildiği gibi, üç tanıma yönteminin artılarını ve eksilerini görsel olarak göstermek için tablodaki verilere göre bağlantılı bir liste yapılır. Ek olarak, tanıma oranı, Şekil 8'de gösterildiği gibi, sistem öğrenme sürelerinin sayısından da etkilenir.

4 Sonuçlar ve beklentiler

Geleneksel sinir ağlarının eksikliklerini hedefleyen bu makalede önerilen uyarlanabilir nöro-bulanık çıkarım sistemi, kendini uyarlama, bulanıklaştırma ve sinir ağının avantajlarına tam anlamıyla katkıda bulunur, güçlü uyarlanabilirlik ve iyi öğrenme yeteneği özelliklerine sahiptir ve sistemin sağlamlığını geliştirir. Ek olarak, hareketlerin tanıma oranı da önemli ölçüde iyileştirildi. Jestin kendisinin çeşitliliği, belirsizliği, farklılığı ve teknik sınırlamaları ile ilgili olarak, özellikle karmaşık bir ortamda, insan eli ile yüzün örtüştüğü veya insan eli arka plan ten rengine benzediğinde çok iyi değildir. Görüntüden eksiksiz, parazitsiz bir hareket görüntüsü çıkarın. Ayrıca şu anda kullanılan tanıma sistemi aynı anda mükemmel tanıma oranını ve zaman verimliliğini sağlayamamaktadır.Hedef tanıma oranı sağlanırken ideal işlem hızının nasıl elde edileceği ve sistemin uygulanabilirliğinin nasıl artırılacağı önemli bir araştırma konusu olacaktır.

Referanslar

1 Wu Xia, Zhang Qi, Xu Yanxu. Hareket tanımanın gelişim durumuna genel bakış J. Electronic Science and Technology, 2013, 26 (6): 171174.

2 NEGNEVITSKY M. Yapay Zeka: Akıllı Sistemler İçin Bir Kılavuz M. Beijing: Mechanical Industry Press, 2012.

[3] Fan Huimin, Wang Hao. Örüntü Tanıma Yöntemlerine Genel Bakış J. Elektronik Tasarım Mühendisliği, 2012, 20 (19): 4851.

[4] Qiu Di HSV ve YCrCb renk uzayına dayalı cilt rengi tespiti üzerine araştırma J Bilgisayar Programlama Becerileri ve Bakımı, 2012 (10): 7475.

[5] Li Mei. Otsu algoritmasına dayalı görüntü bölütleme araştırması D. Hefei: Hefei Teknoloji Üniversitesi, 2011.

[6] Zhang Xiaojuan Adaptive Neuro-Bulanık Çıkarım Sistemi (ANFIS) ve simülasyonu J Elektronik Tasarım Mühendisliği, 2012, 20 (5): 11-13.

[7] Feng Tong. Sinir ağına dayalı jest tanıma üzerine araştırma D. Beijing: Beijing Institute of Technology, 2015.

[8] Li Ge. BP sinir ağına dayalı jest tanıma araştırması D Qinhuangdao: Yanshan Üniversitesi, 2013.

[9] Qi Gangquan Dinamik bulanık sinir ağına [D] dayalı hareket tanıma algoritması üzerine araştırma Chongqing: Southwest Üniversitesi, 2011.

Dünyada en çok satan ilk on ilacın çoğu yenilikçi ilaçlardır, ancak Çin patentli ilaçlar Çin'de daha popülerdir.
önceki
Bu, bu yıl görülen en şirin çizgi film
Sonraki
"Arabaların Hırsızı" çıktı ... Marlon Brando'ya benzeyen bu küçük taze et nasıl patlamaz?
"Fantasy Three Kingdoms 5", bu ayın 25'inde resmi olarak yayınlanan bir medya deneyimi toplantısı düzenledi
Ekran Süresi | Dane De Haan'ın süper model yüzü
Çok Fazlı Enterpolasyona Dayalı Video Ölçekleme Sisteminin FPGA Uygulaması
Yeni film değerlendirmesi IMAX, "Yıldızlararası Ajanlar" ı açmanın doğru yoludur
"Gossip Girl" 10. yıl dönümü, kahramanlar şimdi nasıl?
Çift modlu oyun deneyimi, HyperX Cloud Mix Skyline Bluetooth oyun kulaklığı değerlendirmesi Titanium Geek
Medya ağ geçidi sisteminde geliştirilmiş ana / bağımlı anahtar tasarımı
Bilim ve Teknoloji Akşam Haberleri: Yurtdışında iPhone9'da görünen yeni yerli Red Devils çarpıcı!
Xinliangtian YL1020AF yüksek hızlı kamera değerlendirmesi: pragmatizm altında mükemmel bir ürün
FC Anahtar Çip MT Bağlantı Noktası Yumuşak Çekirdeğinin Tasarımı ve Uygulanması
Görevi her gün köpekler tarafından ısırılmak.
To Top