Derin Açma: Derin ağ ile geleneksel model arasında bir köprü

Editörün notu: Derin öğrenme, bilgisayar görüşü alanında büyük bir başarı elde etti.Bazı araştırmacılar, bu uçtan uca öğrenme stratejisinin, geleneksel model güdümlü algoritmaların tamamen yerini alabileceğini umdu. Bununla birlikte, birçok çalışma, karmaşık sorunlarla karşılaştığımızda, alan bilgisini tamamen terk etmenin çok akıllıca olmayan bir strateji olduğunu kanıtlıyor. Bu nedenle, alan bilgisinin ve önceliklerin derin ağlara nasıl entegre edileceği, derin öğrenme alanında yeni bir araştırma odağı haline geldi. Bunların arasında, Deep Unrolling bize bilgi ve verileri birleştirmenin etkili bir yolunu sunar.

Bu makalede, Dalian Teknoloji Üniversitesi'nden Doçent Doktor Liu Risheng, Unrolling'e dayalı derinlemesine yöntemi ve uygulamayı tanıtacak. Makalenin sonunda yazıda belirtilen referanslar için indirme linkleri verilmektedir.

Bu rapor esas olarak Unrolling'e dayalı derin öğrenme yöntemi, bunun bilgisayarla görme alanındaki çeşitli uygulamaları ve bu tür derin ağların bazı teorik analizleri üzerine yaptığımız son çalışmalardan bahsediyor.

Son yıllarda, derin öğrenmeyle ilgili birçok çalışma ortaya çıktı. Erken aşamada, araştırmacılar çoğunlukla deneyime ve problemin biraz anlaşılmasına dayalı olarak ağ yapısını sezgisel olarak tasarladılar ve uçtan uca öğrenme yoluyla belirli problemleri çözmek için derin bir model elde ettiler. Bu tür bir yöntem, bilgisayarla görme alanındaki bazı problemlerde büyük başarı elde etmiştir. Örneğin, yüz tanıma ve hedef algılama gibi üst düzey sorunlarda, çeşitli derin ağların performansı geleneksel yöntemlerden çok daha üstündür. Bununla birlikte, ilgili araştırmanın kademeli olarak derinleşmesiyle birlikte, bilim adamları, tamamen sezgisel bir tasarıma sahip derin bir ağın tüm görsel problemlerde tatmin edici sonuçlar elde edemeyeceğini de keşfettiler. Özellikle bazı düşük seviyeli görme problemlerinde, uçtan-uca öğrenme stratejilerini ve ampirik tasarım ağlarını doğrudan kullanma performansı tatmin edici değildir. Örneğin, mevcut sezgisel derin ağın görüntü körü bulanıklaştırma problemindeki performansı hala tatmin edici değildir.

Derin ağların temel özelliklerini daha derinlemesine anlamak için, önce geleneksel model odaklı düşünme ile uçtan uca öğrenme derin ağ modelleme yöntemleri arasındaki farklılıkları ve bağlantıları karşılaştırıyoruz. Spesifik olarak: Model güdümlü yöntemler, genellikle problem için matematiksel bir model oluşturmak için alan bilgisini kullanır ve ardından belirli bir optimizasyon algoritması veya çözüm stratejisi aracılığıyla modelin en uygun çözümünü elde eder. Buna uygun olarak, uçtan uca öğrenme yöntemi, doğrudan girdi verileri ve çıktı sonuçları arasında doğrusal olmayan bir eşleştirme ilişkisi kurmayı umar ve performansı genellikle eğitim verilerinin kalitesi ve ölçeği ile yakından ilgilidir. Özetlemek gerekirse, yukarıdaki iki yöntemin bilgisayarla görme problemlerini çözmek için temel olarak "alan bilgisi" veya "verileri (ve deneyimi)" kullanmaya odaklandığını görüyoruz. Doğal olarak, bu iki farklı stratejiyi etkili bir şekilde birleştirebilirsek, umarım daha güçlü ve daha yorumlanabilir bir derin ağ modeli tasarlarız. Bu aynı zamanda size daha sonra tanıtacağımız Derin Açma teknolojisine de yol açar.

Son yıllarda, Unrolling teknolojisi, "alan bilgisi" ve "veri (" ve deneyim) "kombinasyonu için etkili bir araç sağlamıştır. Spesifik olarak, sözde Unrolling, belirli bir sürekli modeli çözmenin yinelemeli optimizasyonunu bir Dinamik sistem ve daha sonra bu sistemi öğrenilebilir çeşitli modüllerle ayrıklaştırın ve veriye bağlı evrim süreci yöntemini (Veriye bağlı Yayılma) elde edin. Aslında, Unrolling süreci ve makine öğrenimi ve son LeCun alanındaki meta-öğrenme Ve diğerleri tarafından önerilen Farklılaştırılabilir Programlama (Farklılaştırılabilir Programlama) kavramı da çok yakın bir iç bağlantıya sahiptir.

Unrolling yönteminde, önce yinelemeli bir şema (Şema Şeması) tasarlamamız ve ardından öğrenilebilir modülü yinelemeye daha fazla yerleştirmemiz gerekir. Daha da önemlisi, tasarlanan evrim sürecinin gerekli teorik analizini de yapmamız gerekiyor.

Daha sonra, bilgisayar görüşü alanında Unrolling fikirlerini kullanma yöntemlerini kısaca gözden geçireceğiz. Bazı çalışmalarda, orijinal makale açıkça Unrolling kavramını kullanmasa da, yine de bu yöntemlerin ilkelerini ve etkililiğini Unrolling çerçevesi aracılığıyla açıklayıp analiz edebileceğimizi belirtmek gerekir.

Kısmi diferansiyel denklem / difüzyon süreci çok klasik bir görüntü işleme yöntemidir. Bu tür bir yöntem, esasen, değişken enerjinin gradyan akışını çözmek için düşünülebilir. 2010 yılında, çeşitli görüntü işleme problemlerini (denoising, segmentasyon, demonte etme vb.) Çözmek için ilk olarak Öğrenmeye dayalı PDE'yi önerdik. Bu yöntemin en büyük özelliği, dönme ve ötelemeye değişmeyen temel diferansiyel değişmezleri öğrenerek difüzyon sürecinin Çözülmesini gerçekleştirmektir. Ve optimum kontrol teknolojisi aracılığıyla sistem parametrelerinin uçtan uca öğrenilmesini gerçekleştirin. Öğrenmeye dayalı kısmi diferansiyel denklemlerin aslında basitleştirilmiş yapıya sahip diferansiyel operatörlere dayanan derin bir ağ modeli olduğuna dikkat çekmek önemlidir. Ek olarak, benimsediğimiz optimal kontrol çerçevesi, yaygın olarak kullanılan geri yayılma teknolojisi ile derin bir temel bağlantıya sahiptir. Daha sonra Chen ve Pork'un çalışması, difüzyon öğrenimi gerçekleştirmek ve görüntü denoising gibi sorunları çözmek için üst düzey operatörleri kullandı.

Yönlendirilmemiş grafikler sınıfının bir parametrik önceliği olan MRF, farklı görüntü türlerinin potansiyel dağılımını tanımlamak için de kullanılabilir. Son yıllarda, bilim adamları, temel yinelemeli format olarak farklı optimizasyon stratejileri (yarı karesel bölme, ilk ikilik, alternatif yön vb.) Kullanarak ve MRF'yi daha önce açmak için yüksek dereceli filtreler kullanarak, bir dizi farklı görüntü önerdiler. Algoritma geliştirildi ve farklı uygulama alanlarında iyi sonuçlar elde edildi.

CNN, özünde yüksek dereceli bir difüzyon operatörü olarak da kabul edilebildiğinden, optimizasyon yinelemeli sürecini açmak için doğrudan CNN kullanmak, son bir veya iki yılda çok popüler bir araştırma yönü haline geldi. Çok sayıda CNN yapıları ve Unrolling fikirleri ortaya çıktı. Burada belirtilmesi gereken, Unrolling yöntemindeki CNN'nin artık uçtan uca bir regresör olmadığıdır. Esasen, öğrendiklerinin, gerçek veriler üzerinde optimizasyon algoritmasının her adımının ürettiği yineleme hatası (veya model hatası) olduğunu düşünmeye daha meyilliyiz. Bu nedenle, bu tür Unrolling yönteminde, yinelemeli süreçte CNN modülünü eğitmek için genellikle farklı yoğunluklarda Gauss gürültüsünü kullanırız.

Ardından, altta yatan görsel alanda başarılı olan çeşitli derin ağ yöntemlerini analiz etmek ve anlamak için Unrolling fikrini daha fazla kullanacağız.

VDSR, Artık Yapıyı görüntü işleme problemlerine uygulayan bir derin öğrenme yöntemidir ve süper çözünürlük problemlerinde çok iyi sonuçlar elde etmiştir. Analiz yoluyla, VDSR ağ yapısının aslında tek adımlı bir gradyan iniş süreci olarak anlaşılabileceğini bulduk. CNN, düşük çözünürlüklü girdiden yüksek çözünürlüklü çıktıya düşüş yönünü öğrenir. Daha önceki süper çözünürlüklü ağlarla (düşük çözünürlükten yüksek çözünürlüğe kadar haritalamayı doğrudan öğrenen SRCNN, vb.) Karşılaştırıldığında, VDSR alçalma yönünü (yani artık) öğrenerek ağın öğrenme zorluğunu önemli ölçüde azaltır, böylece daha iyi başarır. İyi sonuçlar.

Daha sonra, DnCNN benzer fikirleri görüntü denoize etme problemine başarıyla uyguladı ve altta yatan görsel problemlerde azalan yönü öğrenmek için CNN kullanmanın etkinliğini tekrar doğruladı.

VDSR'nin bir iyileştirmesi olarak EDSR, VDSR'den daha iyi bir süper çözünürlük efekti elde etti. Unrolling'in bakış açısına göre, sezgisel olarak, yazarın ağ yapısında aslında gradyan iniş için daha fazla artık birim kullandığını ve daha fazla iniş modülünü basamaklayarak aslında bir CNN'e dayalı öğrenilebilir yinelemeli süreç. Optimizasyon bakış açısından, daha fazla yineleme adımı, karmaşık (dışbükey olmayan gibi) sorunlara en uygun çözümü elde etmemizi genellikle kolaylaştırabilir. Bu aynı zamanda EDSR'nin neden bir taraftan VDSR'den daha iyi olduğunu da açıklıyor.

Kör olmayan görüntü bulanıklaştırma probleminde IRCNN çok iyi bir performans elde etti. Bu yöntemin en büyük başarısı, CNN ağ yapısını görüntü restorasyon modelinin optimizasyon sürecine dahil etmektir.

Kör görüntü restorasyonu alanında, bazı yeni yöntemler, çeşitli CNN modüllerini optimizasyon modellerine (Li ve diğerleri gibi) entegre eder veya kademeli modeller aracılığıyla örtük gradyan akışları oluşturur (Nah ve diğerleri gibi). Yukarıdaki yöntemlerle önerilen ağ yapısı, Unrolling düşüncesi ile de açıklanabilir.

Ledig ve diğerlerinin çalışması, algısal kayba dayalı bir artık ağ eğitimi yöntemi verdi. Bu çalışma aslında, daha gerçekçi görüntü iyileştirme sonuçları elde etmek için kademeli gradyan iniş modülünü (artık birim) eğitmek için rakip ve algısal kayıp işlevlerini kullanabileceğimizi göstermektedir.

Yukarıda tanıttığımız Unrolling yöntemlerinin tümü, Düşük seviyeli problemlere yöneliktir (örneğin, parazit giderme, çapak giderme, süper çözünürlük vb.). Aslında, birçok Üst düzey sorun, Unrolling yöntemi kullanılarak da çözülebilir. Örneğin, LeCun ve diğerleri tarafından önerilen LISTA yöntemi, seyrek sözlük öğrenimini çözen birinci dereceden optimizasyon algoritmasını (ISTA) açmak için parametreli bir ağ kullanır. Ve Xiong ve De la Torre, doğrusal olmayan bir regresyon modelinin gradyan inişinin her adımını açmak için doğrusal regresyon kullandılar ve yüz özelliği nokta tespiti sorununu çözmek için yeni bir yöntem elde ettiler. Son zamanlarda, araştırmacılar ayrıca takviye öğrenme (Li ve Malik) ve yinelemeli ağ yapısını (Andrychowicz ve diğerleri), regresyon ve sınıflandırma modellerinin Unrolling sürecine dahil etmeye çalıştılar.

Özetlemek gerekirse, Unrolling temel olarak üç temel adımı içerir: iteratif format tasarlama, öğrenilebilir modülleri yerleştirme ve teorik analiz. Mevcut çalışma ilk iki bölüme odaklanmıştır ve yinelemeli formatın yanlış genişletilmesi ve hesaplanması için öğrenilebilir modüllerin kullanılması nedeniyle, orijinal sayısal algoritmanın (yakınsama vb.) Teorik özellikleri artık korunmamaktadır. Bu nedenle, Unrolling sürecinin teorik doğası hakkında acilen bazı analizler yapmamız gerekiyor. Ek olarak, Unrolling işleminin doğasında bulunan özelliklerin ve geçerlilik garantisinin teorik olarak nasıl kazılacağı da araştırmaya değer. Aşağıda, ilgili konulardaki bazı ön girişimlerimizi kısaca tanıtacağız.

İlk olarak birinci dereceden pürüzsüz olmayan optimizasyon formatına dayalı genel bir yinelemeli çerçeve veriyoruz. Bu temelde, alçalma yönünü tahmin etmek için öğrenilebilir bir ağ yapısı tasarlamak için kalıntı yapıyı daha da kullanırız. Mevcut Unrolling algoritmalarının çoğunun, yinelemeli hesaplama işleminin bir parçası yerine genellikle doğrudan ağ yapısını kullandığını fark ettik. Unrolling için öğrenilebilir iniş modülünün kullanılması temelinde, ek bir hata düzeltme modülü de ekledik. Bu modülün ana işlevi, zaman içinde yinelemeli süreçte ağ tarafından üretilen aşırı yineleme hatasını kontrol etmektir.

Spesifik olarak, ağ tabanlı Döndürme işleminin getirdiği hataları analiz ederek ve ağın yanlış hesaplamasını kontrol etmek için bitişik yinelemeli çıktıyı kullanarak, "gevşeme" adı verilen yeni bir ağ ileriye doğru ilerleme yayılım doğruluğu kontrol kriteri elde ettik. Optimallik kriterleri ".

Yukarıdaki tasarıma dayanarak, teorik olarak dışbükey olmayan ve pürüzsüz olmayan bir modelin optimal çözümü sorununu çözerken, önerdiğimiz Unrolling çerçevesinin küresel olarak yakınsak bir dizi oluşturabileceğini kanıtlayabiliriz ("küresel yakınsama" "Bu, dizinin küresel optimal çözüme değil, bir bütün olarak belirli bir noktaya yakınsadığı anlamına gelir). Eğer ele alınacak problem net bir ön düzenlemeye sahipse, dizinin verilen modelin kritik bir noktasına yakınsadığını ispatlayabiliriz. Ek olarak, önceki r'yi bilmesek bile, ürettiğimiz dizi küresel olarak sabit bir noktaya yakınsayabilir. İlk olarak burada önerilen Unrolling yöntemini kesin olmayan bir yinelemeli algoritma olarak ele alıyoruz ve standart optimizasyon stratejisi ile karşılaştırıyoruz. İniş yönünü hızlı bir şekilde tahmin etmek için ağı tanıtarak, yakınsama oranımızın (LBS) matematiksel türetmeye (FBS, FISTA, ADMM, vb.) Dayalı geleneksel yinelemeli formattan önemli ölçüde daha hızlı olduğunu bulduk. Sağ üstteki diyagram, hata düzeltmemizi (LBS) ve doğrudan Döndürmeyi (nLBS) kullanarak yinelemeli eğrinin karşılaştırmasını gösterir. Hata kontrolünü göz önünde bulundurmadan Rolling için ağı doğrudan kullanmanın ciddi salınımlar üreteceğini ve hatta tamamen yakınsak olmayan yinelemeli bir dizi elde edeceğini görebiliriz. Uyarlanabilir hata düzeltme stratejimizi kullanarak, dizinin yakınsaması önemli ölçüde iyileştirildi.

Daha sonra, belirli görsel problemleri çözmek için önerilen Unrolling çerçevemizi nasıl kullanacağımızı göstermek için bir örnek olarak kör görüntü bulanıklaştırma (ters evrişim) alıyoruz. Kör görüntü bulanıklaştırma problemi, bilinmeyen bulanıklık çekirdeğinin eşzamanlı tahminini ve bilinen bir gözlemden net görüntü gerektirdiğinden, bu sorunun tipik bir kötü koşullu ters problem olduğunu biliyoruz. Bu nedenle, geleneksel yöntemlerin genellikle karmaşık önseller tasarlaması ve belirli görüntü türlerinin kusurlarının giderilmesi için deneyime dayalı yinelemeli süreci yapay olarak değiştirmesi gerekir. Neyse ki, Unrolling çerçevemize dayanarak, bir "üretim-düzeltme" ağ yapısı öneriyoruz. Burada Generator, görüntü üretimi için (veri ve deneyimi yansıtan) artık bir ağ modülüdür ve Düzeltici, ters evrişim modeline dayalı olarak tasarlanmış uyarlamalı bir yinelemeli düzeltme modülüdür (alan bilgisini yansıtan). Bu iki tür modülü basamaklayarak ve işbirliğine dayalı öğrenme gerçekleştirerek, teorik yakınsamayı sağlarken çeşitli bulanık görüntü türlerini etkili bir şekilde geri yükleyebilen yeni bir yöntem sunuyoruz. Burada belirtilmesi gereken şey, önerdiğimiz "nesil-düzeltme" işbirlikçi öğrenme yapısının, temelde yatan görsel sorunları güçlü alan bilgisi ile çözmek için aslında "nesil-karşıtlık" ağından daha uygun olduğudur.

Yukarıdaki Döndürme stratejisini daha fazla görsel problemde kullanmaya çalıştık ve su altı iyileştirme, düşük ışıklı görüntü geliştirme, yansıma giderme, yağmur giderme ve diğer konularda çok iyi sonuçlar elde ettik.

Derin öğrenmenin geliştirilmesinde, araştırmacılar bir zamanlar uçtan uca öğrenme stratejilerinin geleneksel model odaklı algoritmaların tamamen yerini alabileceğini umdular. Ancak birçok çalışma, karmaşık sorunlarla karşılaştığımızda, alan bilgisini tamamen terk etmenin çok akıllıca olmayan bir strateji olduğunu kanıtladı. Bu genellikle problemdeki potansiyel olarak karmaşık regresyon ilişkisini öğrenmek için daha derin bir ağ yapısı ve daha fazla eğitim verisi kullanmamız gerektiği anlamına gelir. Bazı durumlarda, uygun bir ağ veya eğitim verisi bile bulamıyoruz. Bu nedenle, alan bilgisinin ve önceliklerin derin ağlara nasıl entegre edileceği, derin öğrenme alanında yeni bir araştırma odağı haline geldi.

Deep Unrolling bize bilgi ve verileri birleştirmenin etkili bir yolunu sunar. Orijinal modeli alan bilgisi ile oluşturabilir ve temel yineleme formatını verebiliriz. Bu temelde, öğrenilebilir modüller getirilerek, sorunun altında yatan yasalar ve veri dağılımı verilen eğitim verilerinden öğrenilebilir. Son olarak, bilgi ve verilerin etkili entegrasyonu, Unrolling ile gerçekleştirilir. Son çalışmamız, Unrolling yönteminin yakınsaması ve etkinliği üzerine teorik analiz sağlar.Buna dayanarak, uyarlanabilir hata düzeltmeye dayalı bir dizi Unrolling yöntemi tasarlanmış ve farklı temel görme problemlerine başarıyla uygulanmıştır.

Sonunda, "öğrenmeyi öğrenmenin" (yani Öğrenmeyi Öğrenme veya Meta Öğrenmenin) yapay zekanın gelecekteki gelişimi için önemli bir yön olduğuna işaret ettik. Ve Unrolling'in Meta Öğrenme algoritmalarını tasarlamak için önemli bir yöntem olacağına inanıyoruz.

Baş editör: Yuan Jirui, Editör: Cheng Yi

Sıralama: Qu Yingnan, Yang Ruyin, Gaoke, Gao Liming

--son--

Bu makale orijinal "Derin Öğrenme Ders Salonu" na aittir, yeniden yazdırmanız gerekirse, lütfen Emily_0167 ile iletişime geçin.

Yazar hakkında:

Liu Risheng, Dalian Teknoloji Üniversitesi Uluslararası Bilgi ve Yazılım Okulu'nda doçenttir. Dalian Teknoloji Üniversitesi'nden Lisans ve Doktora, Hong Kong Polytechnic Üniversitesi'nden doktora sonrası Araştırma yönü, özellikle dışbükey olmayan ve pürüzsüz olmayan optimizasyon modelleme ve derin modellere dayalı çözme olmak üzere görme problemleri için optimizasyon algoritmalarını öğrenmektir. Son yıllarda önemli akademik dergilerde (TPAMI, TIP, TNNLS, TMM, Machine Learning vb.) Ve konferanslarda (CVPR, NIPS, AAAI, ACM MM, ECCV, CIKM, ICDM, vb.) 70'den fazla makale yayınladı. İlgili çalışmaya 1.200'den fazla atıf yapıldı ve en yüksek tek makale 500'den fazla alıntı yapıldı. ICME (CCF-B kategorisi) 2015 ve 2014 En İyi Öğrenci Bildiri Ödüllerini art arda kazanan iki makale, ICME 2017 En İyi Bildiri Finalisti (İlk% 3) ve ICIP 2015 (CCF-C kategorisi) En İyi% 10 Bildiri Ödülü için finale kaldı , ICIMCS 2017 En İyi Makale Adaylığı Ödülü, IEEE Intelligent Computing Specialized Committee Highlight Paper Award (Publication Spotlight). Milli Eğitim Bakanlığı Doğa Bilimleri dalında 1 ikincilik ödülü (üçüncü sırada) ve Liaoning Eyaleti Doğa Bilimi'nde 1 ikincilik ödülünü (üçüncü sırada) kazandı. The Visual Computer Journal (CCF-C dergisi), IET Image Processing (CCF-C dergisi), Journal of Electronic Imaging editor (Yardımcı Editör), CVPR, ICCV, ECCV, NIPS, IJCAI, AAAI, ACCV, BMVC olarak görev yaptı , ICIP ve diğer konferans bilgisayar üyeleri veya gözden geçirenler ve IJCV, TPAMI, TIP, TNNLS, TKDE, TCSVT, TPDS ve diğer dergi hakemleri. Çin Bilgisayar Topluluğu Bilgisayarla Görme Komitesi Üyesi, Çin Bilgisayar Topluluğu Multimedya Komitesi Üyesi, Çin Görüntü ve Grafik Derneği Makine Görme Komitesi Üyesi, Çin Görüntü ve Grafik Topluluğu Multimedya Komitesi Üyesi ve Çin Bilgisayar Topluluğu YOCSEF Dalian üyesi.

Bu makale orijinal "Derin Öğrenme Ders Salonu" na aittir, yeniden yazdırmanız gerekirse lütfen Ru Yin ile iletişime geçin

Orijinal bağlantı: Derin Açma: derin ağ ile geleneksel model arasında bir köprü

Bu pratik olmayan evcil hayvan malzemelerinden kaç tane satın aldınız?
önceki
Skip-Gram bağlamının tahmin algoritmasını anlamak için bir makale
Sonraki
"Xiang" Yuben Binyıl Seramik Becerilerinin Kalıcılığı ve Yeniliği
Chen Erpu Sağlık Merkezi Aile Hekimi: Köylülerin sağlığının "bekçisi" olun
Çin'deki üniversite öğrencilerini kim destekliyor?
Dinamik bellek ağı: genel NLP'ye bir adım daha yakın
Taobao kategori öznitelik sistemi hakkında konuşmak: ürün aramanın ardındaki mantıksal yapı
Kaç tane otoriter kedi gördün?
Flink sürgülü pencere optimizasyonu
Kapsamlı pratik rehber: transfer öğrenimi ve derin öğrenmedeki uygulaması
LinkedIn işe alım arama ve öneri sisteminin arkasındaki yapay zeka
Acemi Kedi Yetiştirme: Kediler ne yiyemez? Dikkat edilmesi gereken başka ne var?
Özellikler nasıl filtrelenir? Rastgele Orman (RF) Kullan
Acemi köpek yetiştirme stratejisi, anlamadıysanız büyütmeyin
To Top