Duman çok mu ağır? Derin sinir ağı, görüntülerden sisi nasıl kaldıracağınızı öğretir

Lei Feng net notu: Bu makalenin yazarı Cai Bolun, Güney Çin Teknoloji Üniversitesi'nde doktora adayıdır. Ana araştırma yönleri, makine öğrenimi, bilgisayarla görme, görüntü işleme vb. .

Kılavuz

Pekin şehri orta derecede kirli hava ile çevrilidir ve her yerde gri renktedir - pus tekrar geliyor. 11'inden itibaren puslu hava görünmeye başladı. Pekin Çevre İzleme Merkezi'nin en son tahminine göre, bu pus turu kısa vadede, özellikle bugün ve yarın önemli ölçüde iyileşmeyecek. Pekin'in hava kalitesi 4. seviyede ılımlı kirlilikte kalıyor. Pus bu Pazar gününe kadar devam edecek.

Smog, belirli bir iklim ve insan faaliyetleri arasındaki etkileşimin sonucudur. Yüksek yoğunluklu bir nüfusun ekonomik üretimi ve sosyal faaliyetleri, büyük miktarda ince partikül madde yayacaktır.Emisyonlar atmosferik sirkülasyonu ve taşıma kapasitesini aştığında, asılı partiküller statik ve istikrarlı havanın etkisi altında birikmeye devam edecek ve geniş bir duman yelpazesi kolayca ortaya çıkacaktır.

1. Görüntü bulanıklığını gidermenin özü

akım Görüntü gizleme (Görüntü Engelleme) Teknoloji, basit bir doğal modelden ayrılamaz Atmosferik Saçılma Modeli . Atmosferik saçılma modeli, pus ve ışığın birleşik etkisi altındaki görüntüleme mekanizmasını tanımlar:

Güneş ışığı, nesnenin yüzeyinde yansıyan ışığı J (x) oluşturur.Yansıtılan ışık pustan geçerken dağılır.J (x) t (x) enerjisinin sadece bir kısmı kameraya ulaşabilir. Aynı zamanda, güneş ışığı da kamera tarafından alınan atmosferik ışığı oluşturmak için asılı parçacıkların yüzeyine dağıtılır. Bu nedenle, kameradaki görüntüleme I (x) iki bölümden oluşabilir, iletilen nesne parlaklığı J (x) t (x) ve dağınık atmosferik aydınlatma (1-t (x)):

T (x) nerede Medya geçirgenliği (Orta iletim), adından da anlaşılacağı gibi Pusun içinden kameraya sorunsuz ulaşma oranı . Bu nedenle, geçirgenlik, nesne ve kamera arasındaki d (x) mesafesi ile ters orantılıdır.Nesne kameradan ne kadar uzaksa, pus daha fazla etkilenir. D (x) mesafesi sonsuza yaklaştığında, geçirgenlik t (x) sıfıra yaklaşır ve I (x) , = maxy {x | t (x) t0} I (y) 'e yaklaşır. Özetle, buğu çözmenin özü, ortam geçirgenliğinin t (x) daha doğru bir şekilde nasıl tahmin edileceğidir.

2. Yapay özelliklere dayalı

Manuel özellikler, geleneksel makine vizyonunun temelidir. Pratik yapmak mükemmelleştirir ve gerçek bilgiyi üretmek için uygulamaya dayanır. "Gözlem deneyim tasarım" yoluyla, çeşitli görev gereksinimlerini karşılamak için çeşitli özellikler oluşturulur. Görüntü buğu çözme teknolojisi de manuel özellikler boyunca kademeli olarak geliştirilir.

(1) Önceden Karanlık Kanal (DCP)

Gizleme özelliklerinden bahsetmişken, önceden karanlık kanaldan (DCP) bahsetmek zorundayız. Yolun yolculuğu basitlikte yatıyor CVPR 2009'un en iyi makalesi olan DCP, bulanıklık konsantrasyonu tahmini problemini kısa ve etkili önceki hipotezlerle çözüyor.

Net görüntü bloğunun RGB renk uzayındaki bir kanalın çok karanlık olduğu (değer çok düşük veya hatta sıfıra yakın) gözlenmiştir. Bu nedenle, önceki karanlık kanala bağlı olarak, sis yoğunluğu en karanlık kanalın değeriyle yaklaşık olarak tahmin edilebilir:

(2) Maksimum Kontrast (Maksimum Kontrast, MC)

Atmosferik saçılma modeline göre, pus, nesne görüntülemenin kontrastını azaltacaktır: xI (x) = txJ (x) xJ (x) . Bu nedenle, bu çıkarıma dayanarak, bulanıklık konsantrasyonunu yaklaşık olarak tahmin etmek için yerel kontrast kullanılabilir. Aynı zamanda, yerel kontrastı en üst düzeye çıkararak görüntünün rengi ve görünürlüğü de geri yüklenebilir.

(3) Renk Zayıflatma Öncesi (CAP)

Önceki renk bozulması (CAP), önceki karanlık kanala (DCP) benzer bir önceki özelliktir. Bulanıklığın eş zamanlı olarak görüntü doygunluğunun azalmasına ve parlaklığın artmasına neden olacağı ve genel performansın rengin zayıflaması olduğu görülmüştür. Önceki renk zayıflamasına göre, parlaklık ve doygunluk arasındaki fark, bulanıklığın konsantrasyonunu tahmin etmek için uygulanır:

Üç, derin zekaya dayalı

İnsan görsel sisteminin sis yoğunluğunu ve sahnenin derinliğini iyi tahmin etmek için bu açık özellik dönüşümlerine güvenmesi gerekmez. DehazeNet Bu, bulanıklık özelliklerini akıllıca öğrenmek ve manuel özellik tasarımının zorluklarını ve acı noktalarını çözmek için derin öğrenmeyi kullanan, özel olarak tasarlanmış bir derin evrişimli ağdır.

(1) Özellik Çıkarma

Özellik çıkarma, geleneksel evrişimli sinir ağlarından farklıdır. DehazeNet, ağın ilk katmanı olarak "evrişim + Maxout" yapısını kullanır:

Ve "convolution + Maxout" un geleneksel manuel buğu çözme özelliğine eşdeğer olduğu kanıtlanabilir:

W1 bir Zıt filtre olduğunda, kanalın maksimum değeri, önceki karanlık kanala (DCP) eşdeğer olan minimum kanalına eşittir; W1 yuvarlak bir filtre olduğunda, kontrast çıkarma vb. İle eşdeğerdir. Maksimum kontrasta (MC) eşdeğerdir; W1 hem Karşıt filtre hem de Tüm geçişli filtre içerdiğinde, önceki renk zayıflamasına (CAP) eşdeğer olan RGB'den HSV'ye renk alanı dönüşümüne eşdeğerdir .

Ek olarak, makine öğrenimi açısından Maxout, aşağıdaki Şekil (d) 'de gösterildiği gibi daha güçlü doğrusal olmayan yerleştirme yeteneklerine sahip bir spline işlevidir.

(2) Çok Ölçekli Haritalama ve Yerel Ekstremum

Çok ölçekli özellikler, farklı çözünürlüklerde özellik çıkarmanın sağlamlığını artıracaktır . Geleneksel buğu çözme yöntemleri, özelliklerin farklı ölçeklerde sağlamlığını artırmak için farklı ölçeklerde (ortalama, medyan, minimum) filtreler de kullanır. GoogLeNet'teki başlangıç yapısından yararlanarak, DehazeNet'in ölçek sağlamlığını elde etmek için farklı ölçeklerde 3 set filtre (3 × 3, 5 × 5, 7 × 7) kullanılır:

MAX Pooling, derin evrişimli sinir ağlarının klasik bir işlemidir . Lokal ekstremum, transmitansın yerel tutarlılığını kısıtlar ve transmitansın tahmini gürültüsünü etkili bir şekilde bastırabilir. Ek olarak, yerel uç nokta, önceki karanlık kanalın yerel minimumuna (DCP) ve maksimum kontrastın (MC) yerel maksimumuna da karşılık gelir.

(3) Doğrusal olmayan regresyon (Olmayan -doğrusal Regresyon)

Atmosferik geçirgenlik bir olasılıktır (0'dan 1'e) ve sonsuz veya sonsuz küçük olamaz. Sigmoid ve ReLU uyarma fonksiyonlarından esinlenerek, iki taraflı olarak kısıtlanırken yerel doğrusallığı garanti eden bir İki Taraflı Doğrultulmuş Doğrusal Birim (BReLU) önerilmiştir.

BReLU'nun doğrusal olmayan regresyonu, geleneksel buğu giderme yöntemlerinde (DCP ve CAP gibi) kenar bastırma işlemlerine karşılık gelir. İkili kısıtlamalar, parametre arama alanını azaltmak için önceden bilgi sağlar ve ağın eğitilmesini kolaylaştırır; yerel doğrusallık, Sigmoid işlevinin tutarsız gradyanlarının neden olduğu yakınsama zorluklarını önler.

DehazeNet manuel özelliklere dayanır ve manuelden akıllıya kadar geleneksel yöntemlerin ötesine geçer . Bu nedenle, DehazeNet daha iyi gizlenme sonuçlarına, daha karşılaştırmalı deneylere ve kod kaynaklarına ulaşmıştır:

  • Proje ana sayfası

  • GitHub kodu

  • BReLU + Caffe

  • Diğer nüks (1); (2)

Referanslar

Cai B, Xu X, Jia K, vd.DehazeNet: Tek Görüntü Bulanıklığını Giderme için Uçtan Uca Bir Sistem Görüntü İşleme IEEE İşlemleri, 2016, 25 (11): 5187-5198.

He K, Sun J, Tang X. Önceden karanlık kanal kullanarak tek görüntü bulanıklığı giderme Model analizi ve makine zekası üzerine IEEE işlemleri, 2011, 33 (12): 2341-2353.

Tan R T. Tek bir görüntüden kötü hava koşullarında görünürlük // Bilgisayarla Görme ve Örüntü Tanıma, 2008. CVPR 2008. IEEE Konferansı. IEEE, 2008: 1-8.

Zhu Q, Mai J, Shao L. Önceden renk zayıflatmayı kullanan hızlı bir tek görüntü bulanıklığı giderme algoritması Görüntü İşleme IEEE İşlemleri, 2015, 24 (11): 3522-3533.

Goodfellow I J, Warde-Farley D, Mirza M, ve diğerleri, Maxout ağları. ICML (3), 2013, 28: 1319-1327.

Kardeşim Leslie Cheung'un sayısız klasik komedisi var, bugün kardeşimin başrol oynadığı birkaç komedi öneriyorum
önceki
Üç görüşü yürekten izlemenize ve altüst etmenize olanak tanıyan bir başka süper yanan Kore draması
Sonraki
T3'ün piyasaya sürülmesinden önce Hammer'ın başka satın alma söylentileri vardı, bu kaç kez oldu?
Bağımlılıkla mücadele sistemi çevrimiçi olmaya devam ediyor, ancak "teknoloji bağımlılığının" tedavisi hala yanlış bir önermedir
Modal Oynatma Kontrolü: Özel Efektler Gundam, MG OZ-00MS2B Tallgeese III
"Rainbow Six Siege" harita kesiti: Yatın gecekondu bölgesi PVP'yi başlattı
Tüm öğrencilerin, öğretmenlerin ve velilerin izlemesi için 10 eğitici film önerin
Switch'te "Dynasty Warriors 7 Empires" dahil üç oyunun mevcut olacağını duyurmaktan onur duyuyoruz
"Shazam" Ya süper güçlerim varsa?
Ayrıntılı Android süreci (1): süreç mekanizması ve çoklu süreç özeti
Model oyun kontrolü: ayrıntıları artırın, X1fc'ye kadar HG korsan
Editör bugün erkeklere ait bir film önerecek.
Kadokawa Games, "Fanggen Letters" ın canlı aksiyon projesini başlatmak için Perfect World ile işbirliği yapacak.
Film Paylaşımı: Başlangıçta aile için mutlu bir yolculuktu, bir kabusa dönüştü
To Top