Derin Öğrenmeye Dayalı Karmaşık Sıralama Görüntülerinin Hızlı Tanıma Yöntemi Üzerine Araştırma

Ayıklama sistemi genellikle öğeler deponun içinde ve dışında olduğunda kullanılır.Çok çeşitli birim malzemeler için otomatik ayırma sisteminde, makine vizyonuna dayalı akıllı tanıma teknolojisinin uygulanması daha yaygındır ve ilgili alanlarda temel teknoloji araştırmaları, araştırma ve eğitim dahil olmak üzere sürekli olarak derinleşmektedir. Daha hızlı ve daha yüksek tanıma doğruluğuna sahip akıllı tanıma teknolojisi, her zaman bir araştırma noktası ve akıllı teknolojinin en son teknolojisi olmuştur. Zhang Juan, seyrek gösterim algoritmasına dayalı 3B multimedya görsel görüntüleri için bir yapay zeka tanıma yöntemi önerdi. Makine öğrenimi alanındaki en son araştırma sonucu olarak, derin öğrenme, görüntü işleme alanında güçlü modelleme ve temsil yeteneklerine sahiptir ve çığır açan sonuçlar elde etmiştir. Çeşitli derin sinir ağı yapıları arasında, Convolutional Neural Network (CNN) en yaygın kullanılanıdır ve görüntü tanıma alanında büyük ilgi görmüştür. Farklı soyut görüntü katmanlarının anlamlarını hesaplamak için evrişimi kullanır ve denetimsiz koşullar altında sınıflandırma özelliklerinin yakalanmasını gerçekleştirmek için her evrişim çekirdeğinin iç parametrelerini, veri setinin eğitimi ve uyumu yoluyla ayarlar. O zamandan beri, daha derin AlexNet ağı başarıya ulaştı. O zamandan beri, evrişimli sinir ağı gelişti ve çeşitli alanlarda yaygın olarak kullanılıyor. Birçok konuda mevcut en iyi performansı elde etti. Bai Fan, görüntülerde hedef tanıma gerçekleştirmek için derin öğrenme CNN kullanır; Sun Pingan, CNN ile birleştirilmiş gelişmiş bir yinelemeli derin öğrenme algoritması önerir; Dai Peng, yarı denetimli derin öğrenmeye dayalı bağlantı elemanı kusurlarının görüntü tanıma yöntemi için bir yöntem önerir; Wang Guihuai, gemilerde tek bir çoklu denetim kurar İç su gemilerinin daha yüksek algılama doğruluğunu elde etmek için derin öğrenme çerçevesi ve sınıflandırma çerçevesinin ince ayarı; Huang Hongwei, tam evrişimli ağa dayalı bir tünel görüntü tanıma algoritması önerdi; Yang Tianqi toplu normalizasyon kullandı, gelişmiş evrişimli katman yapısı ve fazladan sınıflandırma ekledi CNN geliştirildi ve eğitim setini genişletmek için görüntü sayısı artırıldı, böylece sınıflandırma doğruluğu ve hızı iyileştirildi; Zhang Huina, doğal sahne görüntü sınıflandırması için Haar dalgacık dönüşümü-CNN'ye dayalı görüntü özelliği çıkarma sorununu araştırdı; Xu Lieutenant evrişimli sinir kullandı Ağ, derin öğrenmeye dayalı bir görüntü sınıflandırma yöntemi önerdi; Jiang Zhaojun, evrişimli bir sinir ağı aracılığıyla derin öğrenme tabanlı bir drone tanıma algoritması önerdi; Zhou Jiankai, pilin elektrolüminesans görüntüsündeki kusurları tanımlamak için TensorFlow çerçevesine dayalı evrişimli bir sinir ağı oluşturmayı önerdi. Pratik uygulamalarda, 2016 yılının Haziran ayında JD Group'un Guan Akıllı Lojistik Merkezi'ne inen JD Akıllı Ayıklama Merkezi sistemi, manuel işlemlerden ayrılabilen akıllı giriş ve teslimatı gerçekleştiren akıllı ayırıcıları ve kızağı tanıttı. Doğru koli ayırma oranının kullanım gereksinimlerini karşıladığından emin olun. Derin öğrenmenin, sıralanan görüntülerin hızlı tanınması alanında iyi bir uygulama olasılığına sahip olduğu görülebilir. Lojistik ayıklama depo ortamı karmaşıktır, aydınlatma yüksek değildir ve ekspres dış ambalaj arasındaki fark açık değildir, bunların tümü otomatik ayırmanın doğruluğunu etkiler.Bu nedenle, derin öğrenmeye dayalı karmaşık sıralama görüntülerinin hızlı tanıma yöntemini incelemek gerekir.

1 Derin öğrenme evrişimli sinir ağı

CNN, hala hiyerarşik bir ağ olan gelişmiş bir sinir ağıdır, ancak katmanın işlevi ve biçimi değişmiştir. Bir CNN yapısı temel olarak üç tür katmandan oluşur: evrişimli katman, havuz katmanı ve tam bağlantılı katman. Evrişimli katmanı, havuz katmanı ve son olarak da tamamen bağlı katman izler. Bu seviyeler Şekil 1'de gösterilmektedir, burada Ci evrişimli katman ve Si, havuzlama katmanı anlamına gelir.

(1) Evrişimli katman: En önemli katmandır. Evrişimli hesaplama, üç önemli fikir aracılığıyla makine öğrenimini geliştirir: seyrek etkileşim, parametre paylaşımı ve eşdeğer temsil.

(2) Havuzlama katmanı: Evrişim, önceki denetimsiz özelliği öğrenen hesaplama karmaşıklığı problemini çözerken, alt örnekleme, daha sonra denetlenen özellik sınıflandırıcı için, özellik haritasındaki önemli sınıflandırma özelliklerini, ilgisiz ayrıntıları göz ardı ederek öğrenir. Ek olarak, eğitilmesi gereken özellik parametrelerinin sayısı azaltılır ve sonuç iyileştirilir (aşırı sığdırma meydana gelmesi daha az olasıdır), böylece özellikler döndürme, çevirme ve ölçekleme gibi değişmez kalır. CNN modelinde yaygın olarak kullanılan aşağı örnekleme yöntemleri arasında Ortalama havuzlama ve Maksimum havuzlama bulunur.

(3) Tamamen bağlantılı katman: Tam bağlantılı katman genellikle sigmodal nöronlardan veya RBF nöronlarından oluşur. Genel olarak, ağın son birkaç katmanı tamamen bağlantılı katmanlardır. Özelliklerin boyutsallığını azaltmak için, son katmandaki nöron sayısı, girdi görüntü türlerinin sayısı ile aynıdır.

Geleneksel kalibrasyon robotları için, robotun konumunun değiştirilmesi akıllı tanımanın doğruluğu üzerinde büyük bir etkiye sahiptir ve tanıma doğruluğunun daha da iyileştirilmesi gerekir. AlexNet derin öğrenme sinir ağı, yalnızca tanıma doğruluğunu ve eğitim hızını artırmakla kalmayan, aynı zamanda kendi konumundaki değişikliklere karşı da dayanıklı olan sıralanmış nesneleri tanır. Ağın daha düşük başlangıç öğrenme hızı, aktarım katmanındaki öğrenme hızını azaltacaktır. Bu çalışmada, tasarlanan yeni son katmanın öğrenmesini hızlandırmak için tamamen bağlı katmanın öğrenme hızı faktörü daha yüksek olacak şekilde ayarlanmıştır. Bu kombinasyon daha hızlı olabilir Evrişimli katmanın mimarisini değiştirmeden tutarken yeni sıralanmış nesneleri tanıyın. AlexNet derin sinir ağı modeli, Şekil 2'de gösterildiği gibi 8 katmanlı bir yapıya sahiptir: 5 evrişimli katman ve her biri farklı işlevlere sahip alt katmanlara sahip 3 tam bağlantılı katman içerir.

2 Derin öğrenmeye dayalı karmaşık sıralanmış görüntülerin hızlı tanıma yöntemi

Derin öğrenmeye dayalı karmaşık sıralanmış görüntüler için hızlı tanıma yönteminin süreci Şekil 3'te gösterilmektedir.

2.1 Karmaşık sıralama görüntüleri için hızlı tanıma yöntemi

Lojistik ayırma deposunun karmaşık ortamını, düşük aydınlatma ve büyük gürültü etkisini ele almak için, gürültüyü azaltmak için ikili ağaç karmaşık dalgacık dönüşümü kullanımı da dahil olmak üzere toplanan eğitim görüntü verileri üzerinde bir dizi görüntü ön işleme gerçekleştirildi, Düzeltme, gri tonlamalı görüntü, filtreleme ve keskinleştirme ve diğer ön işlemler.

Resimleri tanımak için evrişimli bir sinir ağı oluşturmak için, erken aşamada büyük miktarda eğitim verisi gereklidir ve ardından bir CNN ağı oluşturun. CNN ağı aşağıdaki katmanları içerir:

(1) imageInputLayer: görüntü girdi katmanı;

(2) evrişimli2dLayer: CNN'nin 2D evrişimli katmanı;

(3) reluLayer: Doğrultulmuş Doğrusal Birim (ReLU) katmanı;

(4) maxPooling2dLayer: Maksimum havuzlama katmanı;

(5) fullConnectedLayer: tamamen bağlı katman;

(6) softmaxLayer: Softmax katmanı;

(7) sınıflandırma Katmanı: CNN'nin sınıflandırma çıktı katmanı.

Görüntü giriş katmanının boyutu eğitim setinin boyutu ile aynıdır ve ardından ağın orta katmanı tanımlanır Orta katman tekrarlı evrişim, ReLU (düzeltilmiş doğrusal birim) ve havuz katmanlarından oluşur. Bu üç katman, evrişimsel sinir ağının temel yapı bloğunu oluşturur Evrişimli katman, eğitim süresi boyunca sürekli olarak güncellenecek olan filtrenin ağırlık setini tanımlar.

Evrişimli katmanın parametrelerini ayarlayın İlk evrişimli katman 325x5x3 filtreye sahiptir ve görüntü çerçevesinin işlemeye dahil edilmesini sağlamak için 2 piksellik bir simetrik dolgu eklenir, bu da kıvrımlı katmanda kaçınılması önemlidir. Sınır bilgisini vaktinden önce ortadan kaldırmak çok önemlidir. Son tasarlanan evrişimli ağ, Şekil 4'te gösterilmektedir.

İlk evrişimli katmanın ağırlıklarını normal dağıtılmış rasgele bir sayı ile 0.0001 standart sapma ile başlatın ve ardından tasarlanan evrişimli sinir ağını eğitin Eğitimden sonra, ilk katmanın ağırlığı görselleştirilebilir. Tasarlanan evrişimli sinir ağını eğitmek ve ardından test veri setini tanımlamak için veri seti aracılığıyla, elde edilen tanıma doğruluğu oranı% 74,56'dır. Evrişim çekirdeğinin boyutu değiştiğinde, Tablo 1'de gösterildiği gibi nihai tanıma doğruluğu üzerinde etkisi olduğu görülebilir. Tablodan, evrişim çekirdeği arttıkça ve daha sonra azaldıkça test veri setindeki sınıflandırma doğruluk oranının arttığı görülebilir. Bunun nedeni, daha büyük evrişim çekirdeğinin aşırı uyuma neden olabilmesidir. Havuzlama alanı için, havuz alanı daha büyüktür. , Örnekleme işlemi sırasında daha fazla bilgi kaybedilir.

Lojistik deponun özel ortamı ve tanımlanması gereken belirlenmiş nesneler için AlexNet değiştirildi. Yeni bir sınıflandırma problemi için, AlexNet'in son 3 katmanı 1.000 sınıf olarak yapılandırılır ve son 3 katman tamamen bağlantılı katman, Softmax katmanı ve çıktı sınıflandırma katmanıdır. Bu 3 katman ayarlanır ve son 3 dışındaki tüm katmanlar önceden eğitilmiş ağdan çıkarılır. Yeni verilere göre yeni tam bağlı katmanın parametrelerini belirtin. Tamamen bağlı katmanın çıktı sayısını, yeni verilerdeki kategori sayısıyla aynı olacak şekilde ayarlayın. Derin öğrenme eğitilirken aşırı uyuma neden olabilir. Bu nedenle, eğitim setini artırın ve son tamamen bağlı katmana bir bırakma katmanı ekleyin ve her gizli katman nöronunun çıktısını 0,5 olasılıkla sıfıra ayarlayın. Bu "bırakma" yöntemindeki nöronlar ne ileri yayılmada ne de geri yayılmada yer alırlar. Ağın her girişi farklı bir yapıya karşılık gelir ve tüm bu yapılar ağırlıkları paylaşır ve nöronlar nispeten bağımsızdır.Bu teknoloji, nöronların karmaşık karşılıklı adaptasyon ilişkisini azaltır ve aşırı uyumu önler. Devletin görünümü.

2.2 Deneysel sonuçlar ve analiz

Yeni ağ sınıflandırma görevlerine uyum sağlamak için eğitimli evrişimli sinir ağını kullanın.Farklı ambarlarla veya farklı sıralama görevleriyle karşılaşıldığında, yeniden öğrenmek için büyük miktarda veri gerekir ve yeni veriler üzerinde eğitim için az miktarda veri kullanılabilir. İstenilen etki elde edilebilir. Yeni sınıflandırma görevini tespit etmek ve test edilen resmin ne tür bir nesne olduğunu tespit etmek için orijinal resmin eğitimli ağını kullanın. Şekil 5, sinir ağını eğitmek için kullanılan yeni eklenen bir eğitim resmidir.

Eğitim resim programının çalışma sürecinde, sınıflandırılmış resimdeki resim bilgi özelliklerini sürekli öğrenir. Daha sonra, öğrenmek için evrişimli sinir ağını kullanın ve evrişimli sinir ağının son sınıflandırma çıktı katmanını, yalnızca girdi resim kategorisini tanıyacak şekilde değiştirin.

Öğrendikten sonra, eğitimli evrişimli sinir ağının tanıma etkisini test etmek için test seti resimlerini kullanın ve resimdeki tanıma alanını işaretleyin. Simülasyonu devam ettirmek için MATLAB kullanın, sonuç Şekil 6'daki gibi gösterilir.

Şekil 6'daki sonuçlardan, derin öğrenme evrişimli sinir ağının belirtilen resimleri etkili ve doğru bir şekilde tanımlayabildiği ve tanıma doğruluğunun yüksek olduğu, lojistik merkez robotunun nesneleri tanımlama ve ayırma ve istenen etkiyi elde etme verimliliğini karşılayabileceği görülmektedir. Eğitim verileri yeterliyse, doğruluk daha da iyileştirilebilir. Bu makaledeki eğitim örnekleri ve test örnekleri küçük olduğundan, sadece onlarca resimden oluştuğu için bu makaledeki test sonuçları% 100 tanınma oranına ulaşmıştır.

3 Sonuç

Lojistik deposunun özel ortamı ve tanımlanması gereken belirtilen nesneler için, bu makale önce gürültü azaltma gibi ön işlemleri gerçekleştirmek için ikili ağaç karmaşık dalgacık dönüşümünü kullanır; daha sonra AlexNet sinir ağına dayalı olarak, lojistik görüntü tanımaya uygun bir hacim tasarlanır. Evrişimsel sinir ağı, sinir ağının öğrenme hızını hızlandırmak için evrişimli sinir ağının evrişimsel katmanını, ReLU katmanını ve havuz katmanı parametrelerini yeniden tanımlayın; son olarak yeni görüntü sınıflandırma görevi için, sinir ağının son 3 katmanı tamamen birbirine bağlıdır Katman, Softmax katmanı ve sınıflandırma çıktı katmanı, yeni görüntü tanımaya uyum sağlamak için tanımlanmıştır. Ağ, daha karmaşık sıralama görüntü tanıma ile karşılaşıldığında daha yüksek eğitim hızına ve tanıma doğruluğuna sahiptir.

Referanslar

Zhang Juan. 3B multimedya görsel imge için yapay zeka tanıma yönteminin simülasyonu Bilgisayar simülasyonu, 2018, 35 (9): 435-438.

HINTON GE, SALAKHUTDINOV R R. Sinir ağları ile verinin boyutluluğunun azaltılması. Science, 2006, 313 (5786): 504-507.

KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet sınıflandırması ile derin evrişimli sinir ağları NIPS.Curran Associates Inc., 2012.

Bai Fan, Cao Zhaorui.Derin öğrenmeye dayalı beyaz ışık-termal görüntüleme çift kanallı görüntü tanıma sistemi tasarımı.Bilim Teknolojisi ve Mühendisliği, 2018, 18 (21): 264-267.

Sun Pingan, Qi Jun, Tan Qiuyue. Yinelemeli derin öğrenme algoritmasını iyileştirmek için evrişimli sinir ağını kullanan görüntü tanıma yöntemi üzerine araştırma. Bilgisayar Uygulama Araştırması, 2019, 36 (7): 2223-2227.

Dai Peng, Wang Shengchun, Du Xinyu ve diğerleri.Yarı denetimli derin öğrenmeye dayalı balastsız ray bağlantı elemanı kusurlarının görüntü tanıma yöntemi.Çin Demiryolu Bilimi, 2018, 39 (4): 43-49.

Wang Guihuai, Xie Shuo, Chu Xiumin ve diğerleri.Derin öğrenmeye dayalı, insansız yüzey gemilerinin önündeki gemilerin görüntü tanıma yöntemi Gemi Mühendisliği, 2018, 40 (4): 19-22.

Huang Hongwei, Li Qingtong. Kalkan tünellerinde su sızıntısının derin öğrenmeye dayalı görüntü tanıma. Chinese Journal of Rock Mechanics and Engineering, 2017, 36 (12): 2861-2871.

Yang Tianqi, Huang Shuangxi. Sınıflandırma ve öneride geliştirilmiş evrişimli sinir ağının örnek uygulaması. Bilgisayar Uygulama Araştırması, 2018, 35 (4): 974-977.

Zhang Huina, Li Yumei, Fu Yingying.Haar-CNN modeline dayalı doğal sahne görüntüsü sınıflandırması üzerine araştırma. Journal of Sichuan Normal University (Natural Science Edition), 2017, 40 (1): 119-126.

Xu Xiaowei, Chen Siyu. Derin öğrenmeye dayalı görüntü sınıflandırma yöntemi. Elektronik Teknoloji Uygulaması, 2018, 44 (6): 116-119.

Jiang Zhaojun, Cheng Xiaogang, Peng Yaqin, vb. Derin öğrenmeye dayalı İHA tanıma algoritması üzerine araştırma Elektronik Teknoloji Uygulaması, 2017, 43 (7): 84-87.

Zhou Jiankai, Xu Shengzhi, Zhao Ergang ve diğerleri.Derin öğrenmeye dayalı hücre kusurlarını tanıma üzerine araştırma.Elektronik Teknoloji Uygulaması, 2019, 45 (5): 66-69, 77.

yazar bilgileri:

Chen Zhixin, Dong Ruixue, Liu Xin, Wang Yibin, Liang Shixiao

(Pekin Malzeme Üniversitesi, Pekin 101149)

En İyi Küçük Dünya Ağı Senkronizasyon Modelini Seçme Araştırması
önceki
Elektrik Enerjisi İşletmelerinde PUKÖ Döngüsüne Göre İç Denetim Erken Uyarı Sisteminin Kurulmasına İlişkin Ön Çalışma
Sonraki
Altı elemanlı uzaysal diziye dayalı ses kaynağı yerelleştirme sisteminin gerçekleştirilmesi
Akıllı sayaç PCB'si için entegre RFID etiket anteninin tasarım optimizasyonu
Uyarlanabilir yük ayarı ve dinamik güç kontrolü, analog çıkışın verimli ısı dağılımı tasarımını gerçekleştirir
FPGA'ya Göre Ayarlanabilir Kanal Sayısı ile Yüksek Hassasiyetli Alım Sisteminin Modüler Tasarımı
İspanya'ya Çin'den yarım milyon maske geldi
Otobüse binerken lütfen şu üç noktayı unutmayın: gerçek isim kaydı, yeşil kod erişimi ve tarama kodu
Toplu taşıma, yolcuları düzenli bir yolculukta yönlendirmek için birden fazla önlem alır ve Wuhan İstasyonu'ndan ayrıldıktan sonra otobüs gönüllü hizmet rehberliği olacaktır.
99 rehabilitasyon ve izolasyon personeli eve gidiyor | Galeri
Bu iki günde sipariş ettiğiniz tüm paketler geri geldi
Hong Kong-Tayvan aksanı: "Tayvan-ABD diplomatik ilişkilerini" değiştirmek mi? Yine parçalandı
Boşa harcanan 2 ayda Trump 3 şey yaptı
Pekin Xiaotangshan tayin edilen hastanesi ilk yabancı personel grubunu kabul etti
To Top