Derin Öğrenmeye Dayalı "Academic Paper" Duman Tanıma Araştırması

Özet

Google'ın ikinci nesil yapay zeka öğrenme sistemi TensorFlow'u temel alan bir sinir ağı, duman görüntülerini tanımlamak ve algılamak ve şüpheli duman alanlarının görüntülerini yakalamak için gelişmiş bir hareket algılama algoritması kullanmak ve TensorFlow platformu altında duman gerçekleştirmek için PCA boyut azaltma algoritması ile Inception Resnet v2 ağ modelini birleştirmek için oluşturulmuştur. Özelliklerin tanınması eğitimi. Bu algoritma, çok çeşitli gerçek zamanlı yangın algılama ve alarmı gerçekleştirir.Deneyler, tüm algılama sürecinin video akışındaki duman alanını doğru bir şekilde tanımladığını kanıtlamıştır.Geleneksel duman algılama yöntemiyle karşılaştırıldığında, daha yüksek doğruluk ve uyarlanabilirliğe sahiptir. Yangın ve duman alarmları yelpazesi etkili bir çözüm sağlar.

Dar ev dekorasyonu: iç dekorasyona atıfta bulunur; iç mekanı daha güzel hale getirmek için güzelleştirme perspektifinden düşünülür;

Geniş anlamda ev geliştirme: İç mekanların tadilatı ve dekorasyonu dahil; bugün geniş anlamda, iç dekorasyon ve dekorasyonun birleşimi olan ev geliştirme hakkında konuşuyoruz.

Çince alıntı biçimi: Wang Tao, Gong Ningsheng, Jiang Guixiang.Derin Öğrenmeye Dayalı Duman Tanıma Araştırması. Elektronik Teknoloji Uygulaması, 2018, 44 (10): 131-135.

İngilizce alıntı biçimi: Wang Tao, Gong Ningsheng, Jiang Guixiang.Derin öğrenmeye dayalı duman tanıma.Elektronik Tekniğin Uygulanması, 2018, 44 (10): 131-135.

0 Önsöz

Yangının insan toplumuna verdiği zarar ölçülemezdir.Her yıl çok sayıda can ve mal yangın nedeniyle büyük kayıplara uğrar.Olgun iç mekan yangın izleme teknolojisinin aksine, dış ortam yangın koşulları çeşitli faktörler nedeniyle gerçek zamanlı izlemeyi beraberinde getirmiştir. zor. Bilgisayar teknolojisinin gelişmesi ve görüntü tanıma teknolojisinin yaygınlaşmasıyla birlikte, video gözetimi yoluyla akıllı yangın izleme, gelecekte yangın erken uyarı için önemli bir araç olacaktır. Yabani yangın oldukça gizlendiğinden, doğrudan alev algılama etkisi çok küçüktür ve yangın meydana geldiğinde ortaya çıkan büyük miktarda dumanın tespiti etkili bir çözüm haline gelir.Dumanın tanıma oranı ve verimliliği nasıl artırılır? araştırmanın odak noktası.

Son yıllarda, birçok araştırmacı duman tespiti üzerine çok sayıda araştırma yaptı ve birçok bilim insanı duman tespiti için birçok yöntem ve şema önerdi. Li Hongdi ve diğerleri, piramit dokusu ve kenar özelliklerini kullanan bir algılama yöntemi önerdi, Wang Xingang ve diğerleri algılama için hareket algılama ve dalgacık analizi kullandı ve Yuan Feiniu ve diğerleri hareket yönüne dayalı bir algılama yöntemi önerdi. Bu yöntemlerin çoğu duman tanıma alanındaki ana yöntemlerdir.Ancak, bu tür algoritmalar çoğunlukla duman algılamada tek bir renk ve hareket değişikliklerine dayandığından veya çok sayıda hesaplama gerektirdiğinden, gerçek zamanlı algılamayı sağlamak zordur ve karmaşık ortam koşulları altında uygulama hala yetersizdir. Sahada saman yakma izlenirken, parazit miktarı ve gerçek zamanlı ve doğruluk için yüksek gereksinimler nedeniyle, bu durumda geleneksel yöntemin beklenen sonuçları elde etmesi zordur.

Derin öğrenme alanı son zamanlarda hızla gelişti ve büyük ilgi gördü ve hayatın her kesiminde bir araştırma noktası haline geldi.Ülke aynı zamanda yapay zeka derin öğrenmeyi de güçlü bir şekilde destekliyor. Kısa bir süre önce, AlphaGo'nun Go'daki büyük zaferi, derin öğrenmeyi sıcak bir konu haline getirdi.Derin öğrenme, yapay zeka, konuşma tanıma ve görüntü tanımada olağanüstü performansa sahiptir. Bunların arasında, görüntü tanıma uygulaması daha olgun hale geldi. Ağ, yaygın olarak kullanıldığını belirlemek için hedef özellikleri çıkarır. Bu nedenle, geleneksel duman algılama algoritmalarının eksiklikleri göz önüne alındığında, bu makale dumanın gerçek zamanlı izlenmesi ve erken uyarılması için derin öğrenme algoritmalarını kullanır.Deneyler, algoritmanın yüksek bir tanıma oranına ve iyi algılama sonuçlarına sahip olduğunu ve karmaşık sinir ağları nedeniyle derin öğrenmeyi büyük ölçüde optimize ettiğini doğrulamıştır. Geleneksel görüntü tanıma yöntemleriyle karşılaştırıldığında, ortaya çıkan çok sayıda hesaplama daha iyi uyarlanabilirlik ve esnekliğe sahiptir.

1 Video hareket algılama

Duman durağan değil, yangın oluştuğunda ve duman oluştuğunda hareket halinde olduğundan, videodaki hareketli nesneler şüpheli duman hedefini çıkarmak için algılanabilir, ancak duman yavaş hareket özelliklerine sahip olduğu için geleneksel optik akış yöntemi , Çerçeveler arası enterpolasyon, arka plan enterpolasyonu ve diğer hareket algılama algoritmaları, zayıf algılama sonuçlarına sahiptir. Bu eksiklikleri hedefleyen bu makale, hareket alanını doğru ve etkili bir şekilde tespit etmek için kare enterpolasyonunun ve arka plan enterpolasyonunun sonuçlarını entegre eder.

İlk olarak, n kareli sürekli bir video segmentindeki tüm n karelerde üç kare enterpolasyon işlemi gerçekleştirin, yani i'inci kare ile i-1 ve i + 1'in üç karesi arasında iki veya iki kare enterpolasyonu yapın. Çerçeve enterpolasyon formülü aşağıdaki gibidir. :

Son olarak, üç çerçeve enterpolasyon sonucu D ve arka plan enterpolasyon sonucu OReddir ve sonuç, bu makalenin hareket algılama sonucudur. Daha sonra tespit edilen hareketli hedef alan, test için derin öğrenme modeline gönderilir.

Şekil 1, temelde dumanın genel şeklini koruyan ve ideal bir etkiye sahip olan alan dumanı üzerindeki hareket algılamanın etkisini göstermektedir Duman alanı temel olarak seçilebilir.

2 Veri ön işleme

Derin öğrenme, verilerin özelliklerini analiz ederek modelin eğitimini tamamlar.Genellikle bir görüntü verisi çok fazla bilgi içerir ve yalnızca ana özelliklerin nihai öğrenme etkisi üzerinde etkisi vardır ve çok sayıda özellik veri yedekliliğine neden olur ve hesaplama verimliliği sağlar Büyük ölçüde indirimli. 500 × 500 video çerçeve görüntüsünün orijinal özelliği, M = 250.000 boyutuna ulaşacaktır, bu da uygulama sürecinde hesaplama verimliliğini ciddi şekilde etkileyen büyük miktarda hesaplama oluşturur. Bu yazıda kullanılan sistemin amacı dumanı gerçek zamanlı olarak izlemek ve alarm vermek olduğu için, algoritmanın gerçek zamanlı performansı için yüksek gereksinimleri vardır.Bu nedenle görüntünün eğitim, test ve tespit sürecinde hesaplama miktarını azaltmak ve hesaplama verimliliğini artırmak için görüntü verilerinin deneyim değeri kullanılır. Yöntem grileştikten sonra, PCA algoritması, ilgisiz özelliklerin etkisini azaltmak için verilerin boyutluluğunu azaltmak için kullanılır.

3 Evrişimli ağ modeli yapımı

Convolutional Neural Network (CNN), yapay zeka, metin işleme, görüntü tanıma vb. Alanlarda yaygın olarak kullanılan bir derin öğrenme mimarisidir. Duman tanıma için evrişimli sinir ağının ana süreci, ağı eğitmek için mevcut duman görüntüsünü kullanmak ve ardından duman görüntüsünün özelliklerini çıkarmaktır.İnsanların bellek öğrenme sürecine benzer olduğu için ağın öğrenme süreci olarak adlandırılır. Bu kağıt, duman özelliklerini çıkarmak için evrişimli sinir ağını eğitmek için önceden işlenmiş duman görüntüsü veri setini kullanır ve duman algılaması gerçekleştirmek için Inception Resnet v2 ağ modelini birleştirir.TensorFlow tabanlı çoklu GPU desteğiyle, duman özelliklerini çıkarmak için eğitim süresi büyük ölçüde kısalır.

3.1 Temel evrişimli sinir ağı ilkeleri

Evrişimli sinir ağı, özellik eğitimi için geri yayılım algoritmasını kullanan çok katmanlı bir sinir ağıdır. Evrişim çekirdeği çekirdeğidir ve şu anda çeşitli alanlarda yaygın olarak kullanılmaktadır. Temel bir evrişimli sinir ağı, genellikle bir dizi evrişimli katman, doğrusal olmayan katmanlar, havuz katmanları ve tamamen bağlı katmanlardan oluşur. Sıradan sinir ağlarından farklı olarak, evrişimli katmanda, bir nöron yalnızca bitişik katmandaki bazı nöronlara bağlanır Şekil 2, evrişimli bir sinir ağının temel yapısını gösterir.

Şekil 2'den, önceki katmanlardaki her katmanın düğümlerinin üst katmanın bazı düğümlerine bağlı olduğu ve tam bağlı katmandaki her düğümün üst katmanın tüm düğümlerine bağlandığı görülebilmektedir. Çok katmanlı sinir ağları, farklı ihtiyaçlara göre kurulabilir.Nöral ağların daha karmaşık sorunları çözmesini sağlamak için, daha gelişmiş özellikleri tanımlamak için daha fazla katmana sahip ağlar kullanılabilir.Çok katmanlı ağdaki önceki evrişimli katmanın çıktısı sonraki adımdır. Katman girişi. Bununla birlikte, ağ katmanlarının sayısındaki artış, aşırı parametreler, aşırı kaynak tüketimi ve ağ bozulması gibi sorunları da beraberinde getirir.

3.2 Ağ modeli yapımı

Derin ağ bozulması, düşük verimlilik ve yüksek kaynak tüketimi sorunlarını hedefleyen bu makale, Inception Resnet v2 ağ modeline dayalı olarak sinir ağını iyileştirir. Özellik çıkarımının doğruluğunu artırmak için evrişimli katmanların sayısını artırırken, ağ derinleştirme eğitim hatalarından ve artan test hatalarından kaynaklanan ağ bozulmasını önler ve kaynak tüketiminin mümkün olduğunca düşük olmasını sağlar. Başlangıç yapısını ve küresel havuzu kullanın. Optimizasyon katmanı, hesaplama verimliliğini artırır ve derin ağın bozulma problemini çözmek için Resnet artık bloğunu kullanır.

Inception yapısı, farklı evrişimli katmanları paralel olarak birbirine bağlar; Inception, ilgili işleme sonuçlarını daha derin bir matrise dikmek için farklı boyutlarda filtreler kullanır; Inception yapısı ağın derinliğini ve genişliğini artırır ve özellikleri daha iyi çıkarabilir. Aynı zamanda parametreler azaltılır ve hesaplama verimi sağlanır. Şekil 3, Başlangıç modülünün yapısını göstermektedir.

Resnet artık ağı, bir artık blok oluşturmak üzere bir evrişimli katmanın giriş ve çıkışını bağlamak için kısayollar kullanır. Artık fonksiyon F (x) giriş vektörüyle aynı boyutta olduğunda, artık blok formülünü ifade etmek için denklem (9) kullanın :

Denklemde (10), boyut eşleştirme için doğrusal projeksiyon Ws kullanılmıştır. Kalan ağ kullanımı, ağ derinliğinin büyük ölçüde artmasının neden olduğu bozulma sorununu çözer. Ağın son katmanında, tamamen bağlı katman yerine global havuzlama katmanı kullanılır ve çıktıyı elde etmek için tüm çıktı özelliği haritalarının genel ortalama havuzlaması gerçekleştirilir.Tamamen bağlı katmanın iptali, parametreleri büyük ölçüde azaltabilir ve çok fazla parametre nedeniyle tamamen bağlı katmanı önleyebilir. Aşırı uygunluk ve aşırı kaynak tüketimi.

Şekil 4, geliştirilmiş ağ yapısını göstermektedir Daha sezgisel olarak görüntülemek için, derin model derinliği nedeniyle, kısmen tekrarlanan artık bloklar sıkıştırılmıştır. Tüm model mimarisi 40 Inception Resnet modülünden oluşur ve tüm modelde 233 evrişimli katman vardır. Inception Resnet modeli daha fazla özelliği hızlı ve doğru bir şekilde çıkarabilir, böylece eğitim ve tespit sürecindeki verimlilik ve doğruluk daha da garanti edilir.

4 Algoritma akışı

Bu makaledeki duman algılama sisteminin süreci iki bölüme ayrılmıştır: sinir ağının eğitimi ve duman algılamanın gerçekleştirilmesi. Şekil 5, algoritmanın genel akışını göstermektedir.

Şekil 5'te üst kısım ağın eğitim sürecidir.Ön işlemden sonra veri seti eğitim için ağ modeline gönderilir ve son olarak veri eğitimi alındıktan sonra ağ modeli elde edilir. Bir sonraki kısım duman video tespitidir.Orijinal video akışı üzerinde hareket tespiti yapıldıktan sonra hareketli hedef tanımlanması için eğitimli ağa gönderilir.Eğer bir duman görüntüsü olarak tespit edilirse orijinal görüntüde işaretlenir ve alarm verilir.

5 Duman tanımanın uygulanması ve analizi

Bu makale, Google'ın açık kaynaklı TensorFlow platformuna dayalı bir derin öğrenme ağ modeli oluşturur. Algoritmanın gerçek zamanlı performansını göz önünde bulundurmak, donanım desteği için GPU kullanımını gerektirir. Deneysel ortam, Windows 10 altında tensorflow1.2'nin GPU sürümüdür ve donanım cihazı NVIDIA TESLA K80 grafik kartıdır.

5.1 Veri seti hazırlama

İlk olarak, bir eğitim veri seti oluşturmak için duman içeren görüntüler toplayın Eğitim verisi olarak 1.000 duman içeren görüntü ve diğer 500 girişim görüntüsünü kullanın, bunların 1.000'i eğitim veri setleri ve 500'ü de test veri kümeleri olarak kullanılır. Tüm eğitim veri setlerinin ve test veri setlerinin görüntüleri gri renkte gösterilir ve PCA boyutunda azalma işlenir ve ardından eğitim ve öğrenme için derin öğrenme ağı kullanılır. Her görüntü karşılık gelen bir sınıflandırma etiketi içerir.

5.2 Model eğitimi

Eğitim veri seti elde edildikten sonra derin öğrenme ağ modeli ile veri seti eğitilir.Tensorboard görselleştirme aracı ile eğitim süreci gözlemlenebilir ve analiz edilebilir.

Şekil 6, eğitim süreci sırasında kayıp fonksiyonu Kaybının değişim eğilimini göstermektedir.Tüm eğitim sürecinin 10.000 yineleme gerçekleştirdiği ve 6.000'e ulaştığında kaybın temelde dengelendiği ve eğitim sürecinin temelde beklentileri karşıladığı görülmektedir. Bu algoritmanın eğitim verimliliği büyük ölçüde işletim ortamına bağlıdır.Bu yazıda yer alan deney yalnızca tek bir GPU ortamında gerçekleştirilir.Paralel işlemlerde GPU sayısını artırarak eğitim süresi büyük ölçüde azaltılabilir.

5.3 Sonuç analizi

Eğitim tamamlandıktan sonra model, görüntünün tanımlanmasında kullanılır.Açık havada gerçek zamanlı duman algılama sürecindeki algoritmanın etkisini test etmek için, farklı ortamlarda üç adet duman videosu yakalandı, toplam 52300 kare, dumanlı kare sayısı 37201 kare Test videosu durumu aşağıdaki gibidir.

Tarlalar, ormanlar ve fabrikaların farklı ortamlarında gözetim videoları tespit edilmiştir Tablo 1 deney sonrası sonuçların istatistiklerini göstermektedir.Derin öğrenme algoritması ile duman algılama sonuçlarının doğruluğu pratik uygulamaların gereksinimlerini karşılamaktadır. Tablo 2, bu makaledeki algoritma ile mevcut ana duman algılama algoritması arasındaki karşılaştırmayı göstermektedir.

Tablo 2'den görülebileceği gibi, bu yazıda yer alan algoritmanın diğer duman algılama algoritmaları ile karşılaştırıldığında, yanlış tespit ve kaçırılan tespitlerin oluşumunu azalttığı, tespit doğruluğunun diğer algoritmalardan daha yüksek olduğu ve bu yazıda yer alan algoritmanın doğruluğunun büyük ölçüde eğitim verileri ile ilişkili olduğu görülmektedir. Duman görüntülerinin sayısı ve yinelemelerin sayısı modeli daha da eğitir ve algılama doğruluğunun daha fazla iyileştirme için yeri vardır.

Şekil 7, her bir duman algılama algoritmasının algılama verimliliğini göstermektedir.Bu makaledeki algoritma, işletim verimliliği açısından mevcut ana yöntemlerden çok farklı değildir. Bunların arasında, Wang Xingang'ın algoritması, büyük miktarda hesaplama dalgacık analizi nedeniyle nispeten verimsizken, geleneksel derin öğrenme algoritması Video akışı olmadan hareket algılama ve veri boyutluluğunu azaltma işlemi çok fazla gereksiz hesaplamaya neden olduğu için, verimlilik çok düşüktür ve gerçek projelerde kullanılamaz.

Bu makaledeki algoritma, dumanın gerçek zamanlı izlenmesi amacına ulaşır ve algoritma doğruluğu ile verimlilik arasında iyi bir denge sağlar.

5.4 Gerçek uygulama etkisi

Şekil 8, bu algoritmanın belirli bir alandaki saman yakma izleme sistemindeki gerçek uygulama etkisini göstermektedir. Tanımlama işlemi sırasında, model% 50'den büyük olasılıkla bir duman alanı olarak kabul edilir.% 50'den büyük olasılıkla alan çerçevelenir. 4 görüntünün tümü dış mekan saman yakma dumanını kullanır Görüntüden dumanın doğru bir şekilde tespit edildiği görülebilir.

Pratik uygulama, algoritmanın sahada iyi bir duman algılama etkisine sahip olduğunu doğrulamıştır.Fabrika ortamında, bina ve diğer binaların müdahalesi ve fabrikada endüstriyel üretimden kaynaklanan duman paraziti nedeniyle tanıma etkisi azalmış ancak tanınma oranı% 90'a ulaşmıştır. Yukarıda, toplam kaçırılan algılama oranı% 3,3, yanlış algılama oranı% 4,3 ve nihai doğruluk oranı% 92'dir. Bu makaledeki algoritma, saman yakma izleme amacına başarılı bir şekilde ulaşmaktadır ve eğitim veri seti daha da artırıldığında doğruluğun daha da iyileştirilmesi için yer vardır.

6. Sonuç

TensorFlow platformunu temel alan bu makale, duman görüntüsünün ana özelliklerini çıkarmak ve görüntüdeki duman alanını belirlemek için önceden işlenmiş duman görüntüsünü eğitmek için PCA boyut azaltma algoritmasını ve derin öğrenmeyi kullanır. Geleneksel görüntü tanıma yöntemleriyle karşılaştırıldığında, derin öğrenmeye dayalı tanıma, kendi kendine öğrenme ve uyarlanabilir yeteneklere sahiptir ve hedefleri daha iyi tanıyabilir. Bu yöntemin yüksek bir tanıma oranına sahip olduğu, havai fişekleri etkili bir şekilde algılayabildiği ve dış mekan duman alarmı yangın önleme için iyi bir uygulama değerine sahip olduğu deneylerle doğrulanmıştır.

Referanslar

Li Hongdi, Yuan Feiniu. Piramit dokusu ve kenar özelliklerini kullanarak görüntü duman algılama Çin Görüntü ve Grafik Dergisi, 2015, 20 (6): 772-780.

Wang Xingang, Wei Zheng, Liu Dongchang, et al.Dumanın dinamik özelliklerinin analizine dayalı gerçek zamanlı yangın algılama Bilgisayar Teknolojisi ve Geliştirme, 2008, 18 (11): 9-12.

Yuan Feiniu, Zhang Yongming, Liu Shixing, ve diğerleri Kümülant ve ana hareket yönüne dayalı video duman algılama yöntemi. Çin Görüntü ve Grafik Dergisi, 2008, 13 (4): 808-813.

BENGIO Y. AI için derin mimarileri öğrenmek Makine Öğreniminde Temeller ve Eğilimler, 2009, 2 (1): 1-127.

GRAVES A, MOHAMED AR, HINTON G. Derin yinelenen sinir ağları ile konuşma tanıma IEEE Uluslararası Akustik, Konuşma ve Sinyal İşleme Konferansı IEEE, 2013: 6645-6649.

Chen Duansheng, Song Fengfei, Zhang Qun. Renkli görüntü gri tonlama için uyarlamalı bir küresel haritalama yöntemi Bilgisayar Sistem Uygulamaları, 2013 (9): 164-167, 171.

SZEGEDY C, IOFFE S, VANHOUCKE V, et al. Inception-v4, Inception-ResNet ve kalan bağlantıların öğrenme üzerindeki etkisi. 2016.

ABADI M, AGARWAL A, BARHAM P, ve diğerleri TensorFlow: heterojen dağıtılmış sistemlerde büyük ölçekli makine öğrenimi 2016.

yazar bilgileri:

Wang Tao, Gong Ningsheng, Jiang Guixiang

(Bilgisayar Bilimi ve Teknolojisi Okulu, Nanjing Teknoloji Üniversitesi, Nanjing 211816, Jiangsu)

En çok beklenen kameralı telefon burada: Nisan ayında piyasaya sürülen OPPO 10x hibrit optik zoom kutsaması
önceki
"Spider-Man" yayınlanmadan önce, bu sınırlı sürüm PS4 Pro'nun resmi fotoğraflarına bir göz atın
Sonraki
"The Name of the People" daki Hou Liangping, en pahalı SUV'yi destekleyebilir!
SoC tasarımının temel konsepti hakkında "Blog Makale Serisi"
Mobil fotoğrafçılığın "yeni ufku": OPPO 10x hibrit optik yakınlaştırma teknolojisi gösteri kanıt analizi
Üç kuşak akran kraldır ve geniş alanlı SUV'lar onları seçer
"Industry Hotspot" Nokia 9, tüm önemli özellikleriyle birlikte resmi olarak piyasaya sürüldü
OPPO 10x hibrit optik zoom İnovasyon Konferansı'nda sergilendi. Asıl el etkisi nedir?
Hırs ve güven birlikte uçuyor, araba gözlemcileri test sürüşü Great Wall WEY VV7c
Li Xiaolu mükemmel bir şekilde kaçtı! Kadın kahramandan kavun yiyen kalabalığa, bir gecede kapıda kalmak gerçekten zehirli ...
Uluslararası kara-deniz ticareti için yeni bir kanal olan Jiangjin-Beibu Körfezi liman treni başlatıldı
Şangay Otomobil Fuarı sadece yeni enerji değil, aynı zamanda VR, dronlar ve hatta helikopterler de geliyor!
Tavla tırmanmaya hoş geldiniz
"Blog Gönderisi Seçimi" Komik Grafik Endüktans
To Top