Lei Feng net notu: Bu makalenin yazarı Cai Bolun, Güney Çin Teknoloji Üniversitesi'nde doktora adayıdır. Ana araştırma yönleri, makine öğrenimi, bilgisayarla görme, görüntü işleme vb. .
Pekin şehri orta derecede kirli hava ile çevrilidir ve her yerde gri renktedir - pus tekrar geliyor. 11'inden itibaren puslu hava görünmeye başladı. Pekin Çevre İzleme Merkezi'nin en son tahminine göre, bu pus turu kısa vadede, özellikle bugün ve yarın önemli ölçüde iyileşmeyecek. Pekin'in hava kalitesi 4. seviyede ılımlı kirlilikte kalıyor. Pus bu Pazar gününe kadar devam edecek.
Smog, belirli bir iklim ve insan faaliyetleri arasındaki etkileşimin sonucudur. Yüksek yoğunluklu bir nüfusun ekonomik üretimi ve sosyal faaliyetleri, büyük miktarda ince partikül madde yayacaktır.Emisyonlar atmosferik sirkülasyonu ve taşıma kapasitesini aştığında, asılı partiküller statik ve istikrarlı havanın etkisi altında birikmeye devam edecek ve geniş bir duman yelpazesi kolayca ortaya çıkacaktır.
akım Görüntü gizleme (Görüntü Engelleme) Teknoloji, basit bir doğal modelden ayrılamaz Atmosferik Saçılma Modeli . Atmosferik saçılma modeli, pus ve ışığın birleşik etkisi altındaki görüntüleme mekanizmasını tanımlar:
Güneş ışığı, nesnenin yüzeyinde yansıyan ışığı J (x) oluşturur.Yansıtılan ışık pustan geçerken dağılır.J (x) t (x) enerjisinin sadece bir kısmı kameraya ulaşabilir. Aynı zamanda, güneş ışığı da kamera tarafından alınan atmosferik ışığı oluşturmak için asılı parçacıkların yüzeyine dağıtılır. Bu nedenle, kameradaki görüntüleme I (x) iki bölümden oluşabilir, iletilen nesne parlaklığı J (x) t (x) ve dağınık atmosferik aydınlatma (1-t (x)):
T (x) nerede Medya geçirgenliği (Orta iletim), adından da anlaşılacağı gibi Pusun içinden kameraya sorunsuz ulaşma oranı . Bu nedenle, geçirgenlik, nesne ve kamera arasındaki d (x) mesafesi ile ters orantılıdır.Nesne kameradan ne kadar uzaksa, pus daha fazla etkilenir. D (x) mesafesi sonsuza yaklaştığında, geçirgenlik t (x) sıfıra yaklaşır ve I (x) , = maxy {x | t (x) t0} I (y) 'e yaklaşır. Özetle, buğu çözmenin özü, ortam geçirgenliğinin t (x) daha doğru bir şekilde nasıl tahmin edileceğidir.
Manuel özellikler, geleneksel makine vizyonunun temelidir. Pratik yapmak mükemmelleştirir ve gerçek bilgiyi üretmek için uygulamaya dayanır. "Gözlem deneyim tasarım" yoluyla, çeşitli görev gereksinimlerini karşılamak için çeşitli özellikler oluşturulur. Görüntü buğu çözme teknolojisi de manuel özellikler boyunca kademeli olarak geliştirilir.
(1) Önceden Karanlık Kanal (DCP)
Gizleme özelliklerinden bahsetmişken, önceden karanlık kanaldan (DCP) bahsetmek zorundayız. Yolun yolculuğu basitlikte yatıyor CVPR 2009'un en iyi makalesi olan DCP, bulanıklık konsantrasyonu tahmini problemini kısa ve etkili önceki hipotezlerle çözüyor.
Net görüntü bloğunun RGB renk uzayındaki bir kanalın çok karanlık olduğu (değer çok düşük veya hatta sıfıra yakın) gözlenmiştir. Bu nedenle, önceki karanlık kanala bağlı olarak, sis yoğunluğu en karanlık kanalın değeriyle yaklaşık olarak tahmin edilebilir:
(2) Maksimum Kontrast (Maksimum Kontrast, MC)
Atmosferik saçılma modeline göre, pus, nesne görüntülemenin kontrastını azaltacaktır: xI (x) = txJ (x) xJ (x) . Bu nedenle, bu çıkarıma dayanarak, bulanıklık konsantrasyonunu yaklaşık olarak tahmin etmek için yerel kontrast kullanılabilir. Aynı zamanda, yerel kontrastı en üst düzeye çıkararak görüntünün rengi ve görünürlüğü de geri yüklenebilir.
(3) Renk Zayıflatma Öncesi (CAP)
Önceki renk bozulması (CAP), önceki karanlık kanala (DCP) benzer bir önceki özelliktir. Bulanıklığın eş zamanlı olarak görüntü doygunluğunun azalmasına ve parlaklığın artmasına neden olacağı ve genel performansın rengin zayıflaması olduğu görülmüştür. Önceki renk zayıflamasına göre, parlaklık ve doygunluk arasındaki fark, bulanıklığın konsantrasyonunu tahmin etmek için uygulanır:
İnsan görsel sisteminin sis yoğunluğunu ve sahnenin derinliğini iyi tahmin etmek için bu açık özellik dönüşümlerine güvenmesi gerekmez. DehazeNet Bu, bulanıklık özelliklerini akıllıca öğrenmek ve manuel özellik tasarımının zorluklarını ve acı noktalarını çözmek için derin öğrenmeyi kullanan, özel olarak tasarlanmış bir derin evrişimli ağdır.
(1) Özellik Çıkarma
Özellik çıkarma, geleneksel evrişimli sinir ağlarından farklıdır. DehazeNet, ağın ilk katmanı olarak "evrişim + Maxout" yapısını kullanır:
Ve "convolution + Maxout" un geleneksel manuel buğu çözme özelliğine eşdeğer olduğu kanıtlanabilir:
W1 bir Zıt filtre olduğunda, kanalın maksimum değeri, önceki karanlık kanala (DCP) eşdeğer olan minimum kanalına eşittir; W1 yuvarlak bir filtre olduğunda, kontrast çıkarma vb. İle eşdeğerdir. Maksimum kontrasta (MC) eşdeğerdir; W1 hem Karşıt filtre hem de Tüm geçişli filtre içerdiğinde, önceki renk zayıflamasına (CAP) eşdeğer olan RGB'den HSV'ye renk alanı dönüşümüne eşdeğerdir .
Ek olarak, makine öğrenimi açısından Maxout, aşağıdaki Şekil (d) 'de gösterildiği gibi daha güçlü doğrusal olmayan yerleştirme yeteneklerine sahip bir spline işlevidir.
(2) Çok Ölçekli Haritalama ve Yerel Ekstremum
Çok ölçekli özellikler, farklı çözünürlüklerde özellik çıkarmanın sağlamlığını artıracaktır . Geleneksel buğu çözme yöntemleri, özelliklerin farklı ölçeklerde sağlamlığını artırmak için farklı ölçeklerde (ortalama, medyan, minimum) filtreler de kullanır. GoogLeNet'teki başlangıç yapısından yararlanarak, DehazeNet'in ölçek sağlamlığını elde etmek için farklı ölçeklerde 3 set filtre (3 × 3, 5 × 5, 7 × 7) kullanılır:
MAX Pooling, derin evrişimli sinir ağlarının klasik bir işlemidir . Lokal ekstremum, transmitansın yerel tutarlılığını kısıtlar ve transmitansın tahmini gürültüsünü etkili bir şekilde bastırabilir. Ek olarak, yerel uç nokta, önceki karanlık kanalın yerel minimumuna (DCP) ve maksimum kontrastın (MC) yerel maksimumuna da karşılık gelir.
(3) Doğrusal olmayan regresyon (Olmayan -doğrusal Regresyon)
Atmosferik geçirgenlik bir olasılıktır (0'dan 1'e) ve sonsuz veya sonsuz küçük olamaz. Sigmoid ve ReLU uyarma fonksiyonlarından esinlenerek, iki taraflı olarak kısıtlanırken yerel doğrusallığı garanti eden bir İki Taraflı Doğrultulmuş Doğrusal Birim (BReLU) önerilmiştir.
BReLU'nun doğrusal olmayan regresyonu, geleneksel buğu giderme yöntemlerinde (DCP ve CAP gibi) kenar bastırma işlemlerine karşılık gelir. İkili kısıtlamalar, parametre arama alanını azaltmak için önceden bilgi sağlar ve ağın eğitilmesini kolaylaştırır; yerel doğrusallık, Sigmoid işlevinin tutarsız gradyanlarının neden olduğu yakınsama zorluklarını önler.
DehazeNet manuel özelliklere dayanır ve manuelden akıllıya kadar geleneksel yöntemlerin ötesine geçer . Bu nedenle, DehazeNet daha iyi gizlenme sonuçlarına, daha karşılaştırmalı deneylere ve kod kaynaklarına ulaşmıştır:
Proje ana sayfası
GitHub kodu
BReLU + Caffe
Diğer nüks (1); (2)
Referanslar
Cai B, Xu X, Jia K, vd.DehazeNet: Tek Görüntü Bulanıklığını Giderme için Uçtan Uca Bir Sistem Görüntü İşleme IEEE İşlemleri, 2016, 25 (11): 5187-5198.
He K, Sun J, Tang X. Önceden karanlık kanal kullanarak tek görüntü bulanıklığı giderme Model analizi ve makine zekası üzerine IEEE işlemleri, 2011, 33 (12): 2341-2353.
Tan R T. Tek bir görüntüden kötü hava koşullarında görünürlük // Bilgisayarla Görme ve Örüntü Tanıma, 2008. CVPR 2008. IEEE Konferansı. IEEE, 2008: 1-8.
Zhu Q, Mai J, Shao L. Önceden renk zayıflatmayı kullanan hızlı bir tek görüntü bulanıklığı giderme algoritması Görüntü İşleme IEEE İşlemleri, 2015, 24 (11): 3522-3533.
Goodfellow I J, Warde-Farley D, Mirza M, ve diğerleri, Maxout ağları. ICML (3), 2013, 28: 1319-1327.