Makine Görüsüne Dayalı Akıllı Kılavuz Camların "Akademik Belge" Tasarımı

Özet

Makine görüşüne dayalı bir akıllı kılavuz gözlük sistemi tasarım şeması önerilmiştir. Akıllı kılavuz gözlük sisteminin donanımını oluşturmak için dürbün toplama, GPS konumlandırma, ses yayını, GSM kısa mesajları, sesli aramalar ve kablosuz iletim için altı temel işlevsel modülle donatılmış, bir Linux sistemi ile donatılmış, merkezi işlemci olarak Samsungun Cortex-A8 mimarisi S5PV210'u kullanma Derin öğrenme algoritması ile birleştirilen platform, uzak bulut sunucusunda hedef sahnenin akıllıca tanınmasını tamamlar ve son olarak, gerçek zamanlı olarak ses biçiminde körlerin yürümesi konusunda doğru rehberlik sağlar. Sistem test sonuçları, akıllı kılavuz gözlük sisteminin sadece test ortamında seyahat ederken perdeyi doğru bir şekilde yönlendirmekle kalmayıp, aynı zamanda görme engellilerin basit nesneleri sınıflandırmasına yardımcı olabilecek belirli bir hedef tanıma yeteneğine de sahip olduğunu göstermektedir. Sistem ayrıca GPS konumlandırma, sesli aramalar ve GSM metin mesajları gibi çoklu yardımcı fonksiyonlara sahiptir.

Dar ev dekorasyonu: iç dekorasyona atıfta bulunur; iç mekanı daha güzel hale getirmek için güzelleştirme perspektifinden düşünülür;

Geniş anlamda ev geliştirme: İç mekânın tadilatı ve dekorasyonu dahil; bugün geniş anlamda iç dekorasyon ve dekorasyonun birleşimi olan ev tadilatından bahsediyoruz.

Çince alıntı biçimi: He Tengpeng, Zhang Rongfen, Liu Chao, et al.Makine görüşüne dayalı akıllı kılavuz camların tasarımı.Elektronik teknoloji uygulaması, 2017, 43 (4): 58-61.

İngilizce alıntı biçimi: He Tengpeng, Zhang Rongfen, Liu Chao, et al.Makine görüşüne dayalı akıllı görme gözlüklerinin tasarımı.Elektronik Tekniğin Uygulanması, 2017, 43 (4): 58-61.

0 Önsöz

Dünya Sağlık Örgütü'nün istatistiklerine göre, dünyada% 90'ı gelişmekte olan ülkelerde yaşayan yaklaşık 78 milyon kör insan var. Çin'deki körlerin sayısı şu anda dünyanın toplam kör sayısının% 18'ini, yani 14 milyonu oluşturuyor. Toplumda dezavantajlı bir grup olan kör insanlar, görme engelliler ve göz hastalıkları nedeniyle yaşamlarına pek çok sıkıntı yaşamaktadır. Öte yandan, son yıllarda Çin'de yaşlanan nüfusun sürekli artmasıyla birlikte görme engellilerin sayısı da hızla artmıştır.Körlerin ve görme engellilerin güvenli ve etkili yolculuklarının nasıl sağlanacağı özellikle önemlidir. Bu nedenle, bu makale, kör arkadaşların yürürken yoldaki engelleri güvenli ve etkili bir şekilde engellemelerine yardımcı olmayı ve seyahat güvenliğini mümkün olduğunca sağlamayı amaçlayan makine görüşüne dayalı bir tür akıllı kılavuz gözlük tasarlar. Düşük kılavuz etkinliğine sahip piyasadaki kılavuz bastonlar ve pahalı kılavuz köpeklerle karşılaştırıldığında, makine görüşüne dayalı akıllı kılavuz gözlük sistemleri daha rekabetçidir.

1 Akıllı kılavuz gözlük kontrol sisteminin genel tasarımı

Bu yazıda yer alan akıllı perde kılavuz camları kontrol sistemi, iki bölümden, bir ön uç gömülü toplama ve iletim sistemi ve bir uzak bulut platform sunucusundan oluşmaktadır. Gömülü toplama ve iletim sistemi, akıllı kılavuz gözlükler oluşturmak için binoküler toplama, GPS konumlandırma, sesli yayın, GSM kısa mesaj, sesli arama, kablosuz iletim ve diğer temel işlev modülleri ile donatılmış, Linux çekirdeği ile donatılmış Samsung Cortex-A8 mimarisinin S5PV210 işlemcisini temel alır. Sistemin donanım platformu temel olarak bilgi toplama ve iletme ve akıllı talimat kör rehberliği işlevlerini tamamlar. Bulut platform sunucusu, akıllı kılavuz gözlüklerin uzaktan veri işleme merkezi olarak kullanılır.Sunucu konfigürasyonunda bulut sunucusu olarak Alibaba Cloud seçilerek daha sonra derin öğrenme ve binoküler mesafe ölçümü gibi ilgili algoritmalar entegre edilerek akıllı kılavuz camların ön uç sahne hedefinin görüntüsünün gerçekleştirilmesi sağlanır. Tanıma, mesafe algılama ve yönelim yargısı. Ek olarak, sunucu, gözlük kullanıcılarının gerçek zamanlı olarak etkin bir şekilde yerini belirleyebilen akıllı kılavuz gözlüklerin varlığı ile birleştirilmiş bir GPS uydu veri eşleştirme platformu da oluşturdu. Bu sistemin genel tasarım blok diyagramı Şekil 1'de gösterildiği gibidir.

2 Akıllı kılavuz camların kontrol sisteminin donanım tasarımı

2.1 Binoküler edinim modülü tasarımı

Binoküler edinim modülü, görme engelli kişilerin ön hedefleri ve ilgili sahne bilgilerini elde etmesine yardımcı olmak için akıllı kılavuz gözlüklerin önünde sahne bilgilerini toplamak için tam olarak aynı performans parametrelerine sahip iki CMOS yüksek çözünürlüklü kamera kullanır.

2.2 GPS konumlandırma modülü tasarımı

Küresel Konumlandırma Sistemi (GPS), küresel kullanıcılara düşük maliyetli, yüksek hassasiyetli üç boyutlu konumlar sağlayabilir ve küresel ölçekte tüm hava koşullarında, çok yönlü gerçek zamanlı konumlandırma gerçekleştirebilir. Sistem, esas olarak kör kişinin coğrafi konumunun enlem ve boylam koordinatlarını gerçek zamanlı olarak elde etmek için kullanılan GPS modülünün temel birimi olarak İsviçre'nin Ublox'un NEO-6M modülünü kullanıyor.

2.3 Kablosuz iletişim iletim modülünün tasarımı

Kablosuz iletişim aktarım modülü, esas olarak 3G çiplerinden ve ilgili çevresel devrelerden oluşur ve akıllı kılavuz gözlükler ile uzak bulut platform sunucusu arasındaki iki yönlü iletişimi gerçekleştirmek için 3G kablosuz teknolojisini kullanır. Bir yandan dürbün kamera modülü tarafından toplanan resimler ve GPS modülü tarafından elde edilen coğrafi konum koordinat bilgileri 3G ağı üzerinden uzak bulut sunucu platformuna gönderilirken, diğer yandan sunucunun görüntü tanıma ve coğrafi konum eşleştirme sonuçları geri gönderilir. Körler için akıllı kılavuz gözlükler, ses yayını gerçekleştirir ve körler için sonucu gerçek zamanlı olarak söyler. Akıllı kılavuz gözlük sistemi aynı zamanda 3G modülünün GSM kısa mesaj fonksiyonunu kullanarak bulut sunucusundan elde edilen sonuçlardan görme engelli aile üyelerine de kısa mesajlar şeklinde bilgi verecektir. Ayrıca, özel koşullar altında, görme engelli kişiler de akrabalarıyla doğrudan sesli görüşme yapmak için 3G telefon işlevini kullanabilir. Şekil 2, kablosuz iletişim iletim modülünün bir uygulama devre diyagramıdır.

2.4 Sesli yayın modülü tasarımı

Akıllı kılavuz gözlük kontrol sisteminin ses yayın işlevi, esas olarak görüntü tanıma sonuçlarını, mesafesini, yönelim bilgilerini ve hedefin coğrafi konumunu, çevredeki çevreyi zamanında bilgilendirmek için ses modülü aracılığıyla kılavuz gözlüklerin önünde yayınlamak için kullanılır. Sistem, metinden sese dönüşümü gerçekleştirmek için konuşma yayın modülünün ana gövdesi olarak SYN6288 Çince konuşma sentez çipini seçer.Çevresel devresi Şekil 3'te gösterilmiştir.

3 Akıllı kılavuz camların kontrol sisteminin yazılım tasarımı

Bu sistemin yazılım tasarımı iki bölüme ayrılmıştır: uzak bulut platform sunucusundaki programlama ve akıllı kılavuz gözlüklerin ön ucundaki programlama. Uzak bulut platform sunucusundaki yazılım tasarımı, temel olarak görüntü tanıma, aralık ayarlama, yön belirleme ve diğer ilgili algoritmaları, akıllı kılavuz gözlüklerin uzak bulut sunucusunu gerçekleştirmek için bilgisayar sistemi tarafından tanınabilen program talimatlarına dönüştürmek için C / C ++ gibi yüksek seviyeli programlama dillerini kullanmaktır. Tanıma, aralık belirleme, konum algılama ve diğer işlevler. Ek olarak, GPS enlem ve boylam çözünürlüğü de bulut sunucusunda yazılım programlama yoluyla gerçekleştirilir. Kılavuz camların ön uç yazılım tasarımı, temel olarak, dürbün kameranın görüntü toplama, GPS coğrafi koordinatlarının edinilmesi, kablosuz iletişim iletim modülünün veri iletimi ve alımı, ses yayın modülünün programlanması ve düğme kesintisinin yapılandırılması gibi işlev modülü alt programlarının derlenmesini içerir. Ana program akış şeması Şekil 4'te gösterilmektedir.

4 Derin inanç ağına dayalı doğal sahne tanıma

Derin öğrenmede en yaygın kullanılan algoritma modeli olan Deep Belief Network (DBN), çoğunlukla el yazısı yazı tipi tanıma ve doğal sahne tanıma olmak üzere iki yönde kullanılır. Akıllı kılavuz gözlük kontrol sisteminde, derin inanç ağı esas olarak doğal sahnelerde ortak nesne tanıma için kullanılır ve bu, aynı zamanda makine görüşü alanında derin öğrenmenin bir uygulamasıdır. Şekil 5, bir derin inanç ağının tipik bir ağ yapısı modelidir.

Şekil 5'te derin inanç ağının birden fazla Kısıtlı Boltzmann Makinasından (RBM) oluşan derin bir ağ olduğu görülmektedir.Bu ağda, DBN'nin eğitim süreci katman katman bir eğitim yöntemini benimsemektedir. Her bir RBM katmanı ayrı ayrı eğitilir ve parametreler ayrı ayrı ayarlanır. Bir katmanın eğitiminden sonra, bu katmanın eğitim sonucu, her bir RBM katmanının eğitimi tamamlanıncaya kadar bir sonraki RBM katmanının girdisi olarak kullanılır.Bu sürece ön eğitim denir. Derin inanç ağındaki tüm RBM eğitimi tamamlandıktan sonra, geri yayılım algoritması, numunenin etiket değerine göre geriye doğru ince ayar yapmak için kullanılır.

Akıllı kılavuz gözlüklerin görüntü eğitimi sürecinde, test eğitimi örneği olarak geliştirilmiş CIFAR-10 doğal sahne kitaplığı kullanılır. Orijinal CIFAR-10 veri seti, 10 kategoriye ayrılmış 60.00032 × 32 renkli görüntü içerir: uçaklar, arabalar, kediler, kuşlar, geyikler, köpekler, kurbağalar, atlar, tekneler ve kamyonlar. Akıllı kılavuz camların pratikliğini arttırmak için körlerdeki özel durumla birlikte bu makale, gerçek sistem görüntüsü eğitiminde yemek masaları, sandalyeler, insanlar, çöp kutuları ve ağaçlar gibi günlük hayatta bazı ortak hedef sahneleri ekliyor. -10 doğal sahne kitaplığı iyileştirildi ve daha sonra, Şekil 6'da gösterilen derin inanç ağı modelini eğitmek ve tanımak için geliştirilmiş CIFAR-10 doğal sahne kitaplığı kullanıldı.

Yukarıdaki eğitim modelinde, geliştirilmiş CIFAR-10 doğal sahne kitaplığındaki her resim 32 × 32 renkli bir resimdir, bu nedenle giriş katmanı boyutu 3.072 düğümdür (3.072 = 32 × 32 × 3), iki Gizli katman düğüm sayısı sırasıyla 1.000 ve 200'dür.Çok sınıflı sınıflandırma için Softmax sınıflandırmasından sonra çıktı katmanı 10 birim ve sistemin son model yapısı 3072-1000-200-10'dur. Akıllı kör gözlük sisteminin gerçek görüntü eğitimi aşamasında, eğitim modelindeki iki katmanlı RBM'nin eğitim yinelemelerinin sayısı 200'e ve öğrenme oranı 0.1'e ayarlanmıştır. Eğitim tamamlandıktan sonra, sistem tarafından öğrenilen ağırlıklar sinir ağını başlatmak, ağ parametrelerinde ince ayar yapmak ve Sigmoid işlevi ile sinir ağını etkinleştirmek için kullanılır. Sistem eğitim sürecinde, çok sayıda örnek ve karmaşık veri nedeniyle, gizli katman, daha iyi özellikleri öğrenmek için nispeten çok sayıda düğüm gerektirir.Ayrıca, görüntünün kendisi büyük miktarda bilgiye sahiptir ve birden fazla yineleme gerektirir. Tüm eğitim süreci ortalama 10 alır Saatler Derin öğrenmedeki evrişimli sinir ağı ve otomatik kodlama modeli ile karşılaştırıldığında, eğitim süresi büyük ölçüde kısalır ve aynı zamanda nispeten ideal bir tanıma oranına sahiptir.Bu, bu sistemin tanıma eğitim modeli olarak derin inanç ağını seçmesinin ana nedenidir. .

5 Sistem test sonuçları ve analizi

Yukarıda bahsedilen derin inanç ağı eğitim modelini kullanarak, geliştirilmiş CIFAR-10 kütüphanesinde 10.000 test resmi üzerinde rastgele bir gösteri testi gerçekleştirilmiştir Tablo 1, çeşitli örneklerin tanıma oranını ve ortalama tanıma oranını göstermektedir.

Tablo 1'den, geliştirilmiş CIFAR-10 kütüphanesindeki 10 tip test örneğinin kör gözlük sisteminin derin inanç ağı eğitim modelini geçtikten sonra, ortalama tanıma oranının% 82.9 olduğu görülmektedir ki bu, destek vektör makine eğitimi tanıma modeline dayalı tanıma oranına benzerdir. Buna karşılık, ortalama tanıma oranı, destek vektör makinesi modelinin yaklaşık% 10'unu aşarak, genel akıllı kılavuz gözlük sisteminin daha fazla test edilmesi için temel oluşturuyor. Son olarak, jaluzinin yaşam ihtiyaçlarına göre, akıllı kılavuz gözlüklerin diğer işlevleriyle birlikte, akıllı kılavuz gözlüklerin kontrol sistemi gerçek sahnede koordine edilir.Dürbün kameranın toplama kare hızı 3 kare / s olarak ayarlanır ve ses Gezinme frekansı, her iki saniyede bir perdeye rehberlik edecek şekilde ayarlanmıştır ve uzak sunucu tarafı test sonuçları Şekil 7 ve Şekil 8'de gösterilmektedir. Şekil 7'den görülebileceği gibi, akıllı kılavuz gözlüklerin GPS işlevi, kılavuz gözlükleri takan kullanıcının boylam ve enlemini gerçek zamanlı olarak doğru bir şekilde elde edebilir ve doğru coğrafi konum eşleşmesi için kablosuz iletişim iletim modülü aracılığıyla uzak sunucuya gönderebilir. Şekil 8, gerçek sahnede akıllı kılavuz gözlüklerin yalnızca ön hedefin kategorisini doğru bir şekilde tanımlayamadığını, aynı zamanda hedef nesne ile kılavuz camlar arasındaki mesafeyi ölçebildiğini ve engelin azimut özelliklerini doğru şekilde gösterdiğini göstermektedir. Gerçek zamanlı sesli yönlendirme, görme engelli kişilerin zamanında ve etkili bir şekilde engellerden kaçınmasına yardımcı olmak için kullanılır, böylece körlerin güvenli bir şekilde seyahat etmesini sağlar.

6. Sonuç

Bu sistem, makine görüşüne dayalı akıllı kılavuz gözlükler oluşturmak için ana denetleyici olarak S5PV210'u kullanır.Linux çekirdeğini taşıyarak, binoküler toplama, GPS konumlandırma, sesli yayın, GSM kısa mesaj, sesli arama ve kablosuz iletimin altı temel işlevsel modülüyle donatılmıştır. Sistemin donanım devre tasarımını ve yazılım tasarımını tamamladı. Sistem testi sayesinde akıllı kılavuz gözlükler sadece körlerin bağımsız seyahatleri için gerçek zamanlı sesli navigasyon gerçekleştirebilmekte, aynı zamanda özel durumlarda körler akıllı gözlükler üzerindeki tetik butonu ile kılavuz gözlüklerin GPS, GSM SMS, sesli arama vb. Özelliklerini kullanabilmektedir. Fonksiyon, zamanında akraba ve arkadaşlardan yardım alın. Ek olarak, akıllı kılavuz gözlükler aynı zamanda görüntü tanıma yeteneklerine sahip olduğu için, körlerin basit nesneleri sınıflandırmalarına yardımcı olabilir ve bir dereceye kadar körlerin kendilerine bakma yeteneklerini de geliştirebilirler.Bu, özellikle geniş bir kör tabanına sahip Çin için önemlidir.

Referanslar

Milan Sonka, Vaclav Hlavac, Roger Boyle, vb. Görüntü işleme, analiz ve makine görüşü Pekin: Tsinghua University Press, 2016.

Yue Ronggang, Wang Shaoping, Li Kai ve diğerleri Benzer prensiplere dayalı yeni bir binoküler mesafe ölçüm yöntemi Optoelektronik Mühendisliği, 2008, 35 (4): 64-68.

Chen Cuiping Derin inanç ağına dayalı metin sınıflandırma algoritması Bilgisayar Sistemi Uygulaması, 2015, 24 (2): 121-126.

Zhang Chunxia, Ji Nannan, Wang Guanwei. Kısıtlı Boltzmann makinelerine giriş.Mühendislik Matematiği Dergisi, 2013 (2): 159-173.

HINTON GE, SRIVASTAVA N, KRIZHEVSKY A, ve diğerleri.Özellik dedektörlerinin birlikte uyarlanmasını önleyerek sinir ağlarını iyileştirme Bilgisayar Bilimi, 2012, 3 (4): 212-223.

Wang Shuang, Ma Wenping, Xie Huiming ve diğerleri.Yığın kodlama ve softmax'a dayalı bir polarizasyon SAR görüntüsü sınıflandırma yöntemi

.CN104156728A, 2014.

Zhang Xuewei, Wang Yan.Sigmoid fonksiyonunun parametre ayarlamasına dayalı çift gizli katmanlı BP sinir ağının düzlük tahmini, Chemical Industry Automation and Instrumentation, 2010, 37 (4): 42-44.

Chen Xianchang. Derin Öğrenme Algoritması Araştırması ve Evrişimli Sinir Ağına Dayalı Uygulama. Hangzhou: Zhejiang Gongshang Üniversitesi, 2013.

Wu Haiyan. Otomatik kodlayıcıya dayalı yarı denetimli temsil öğrenme ve sınıflandırma öğrenme üzerine araştırma. Chongqing: Chongqing Üniversitesi, 2015.

Cui Pengyu Destek vektör makinelerine dayalı sınıflandırıcı eğitimi araştırması Dijital Teknoloji ve Uygulama, 2016 (6): 58-58.

yazar bilgileri:

He Tengpeng, Zhang Rongfen, Liu Chao, Fang Lenan, Liu Yuhong

(Büyük Veri ve Bilgi Mühendisliği Fakültesi, Guizhou Üniversitesi, Guiyang 550025, Guizhou)

Noon Star News "Yixiu Brother" seiyuu Fujita Shuko 68 yaşında hastalıktan öldü; Li Xiaolu ve diğer sanatçılar bir sağlık bakım ürünü konusunda kamuoyunun girdabına karıştı ve Zhao Yazhi açıklığa ka
önceki
Halka arz olan ilk lidar şirketi mi? Quanergy 2018'de piyasaya sürmeyi planlıyor
Sonraki
İstediğiniz güzel, kullanımı kolay ve ucuz arabalar burada
"Furong Girls 'Festivali" ni kutlamak için "Swagger" ın yerini kontrol etmek için Nisan ayında Xiangxi'ye geldi
2018 Çin Ev Aletleri Endüstrisi Yıllık Raporundan ev aletleri sektörünün gelişimine bakıldığında
Beş Kardashian kız kardeşin en son gişe rekorları kıran filmi ortaya çıktı, seksi sıralar uyuyor
"Industry Hotspot" eLuomeng piyasaya karşı yükseldi, sır nedir?
Mobike tarihteki en hafif paylaşımlı bisikleti piyasaya sürdü, ancak ilk lansman Pekin'de değil
Ortak girişim arabalarının katili! Bu uygun maliyetli bağımsız sedan modelleri, aylık 3000 maaşla kazanılabilir.
Mahkeme duruşması sahnesi ortaya çıktı: 3 yetkili fuhuştan tutuklandı, milyonlarca kişiyi polis karakolu şoförleri tarafından gasp edildi
Altın Küre hostesi Lin Yongjian'ın yüzüne vurur, tanrı cevap verir: uzun yıllardır ayrılmış olan erkek ve kız kardeş
Sony, tümü balık ekranlı 21: 9 kullanan yeni Xperia ürünlerini piyasaya sürdü
Altın Erik Ödülü adaylıkları açıkladı, "Transformers 5" dokuz aday arasında en kötü rekabete sahip olanı
Infiniti ve Mercedes-Benz teknolojiyi paylaşıyor, kim kimin uyluğunu tutuyor?
To Top