Bu makale, AI Araştırma Enstitüsü tarafından derlenen, orijinal başlığı olan teknik bir blogdur:
Gözden Geçirme: DeconvNet - Paylaşım Katmanı (Anlamsal Segmentasyon)
Yazar | SH Tsang
Tercüme | Stephen Ergouzi
Düzeltme | Sos Armut İnceleme | Johnson Lee'nin Maaş Artışı Sıralama | Daimi Balık Kralı
Orijinal bağlantı:
https://towardsdatascience.com/review-deconvnet-unpooling-layer-semantic-segmentation-55cf8a6e380e
Bu makalede, DeconvNet'i kısaca gözden geçirdik: Ters evrişim ağı (DeconvNet) bir ters evrişim ve bir paylaştırma katmanından oluşur.
Geleneksel tam evrişimli ağ FCN için, çıktı, kaba bölümleme çıktısına (etiket haritası) neden olabilen yüksek hızlı (32x, 16x ve 8x) yukarı örnekleme yoluyla elde edilir. DeconvNet'te nihai çıktı etiketi, aşamalı evrişim çözme ve havuzlama yoluyla elde edilir. Bu makale 2015 yılında ICCV'de yayınlandı. Bu blog yazısını yazdığımda zaten 1000'den fazla alıntı vardı (SH Tsang @ Medium).
Bu makale neleri kapsar
Yukarı paylaşım ve ters evrişim
Örnek segmentasyonu
İki aşamalı eğitim
Model sonuçları
Aşağıda, DeconvNet'in genel mimarisi verilmiştir:
DeconvNet mimarisi
Gördüğümüz gibi ağ, omurga çerçevesi olarak VGG'yi kullanıyor. İlk bölüm, evrişim ve havuzlama katmanları içeren, FCN gibi evrişimli bir ağdır. İkinci bölüm, bu makalenin yeni bir parçası olan ters evrişim ağıdır.
Havuzlama işlemi (solda), model konum bilgilerini hatırlar ve Paylaşımdan çıkarma sırasında konum bilgilerini kullanır (sağda)
Havuzlama gerçekleştirmek için, yukarıda gösterildiği gibi, maksimum havuzlamayı gerçekleştirirken her bir maksimum aktivasyon değerinin konumunu hatırlamamız gerekir. Daha sonra, yukarıda gösterildiği gibi, hafızaya alınan konum bilgileri havuzlama işlemi için kullanılır.
Evrişim, girdiyi daha küçük bir boyuta (solda) dönüştürmek, ters evrişim ise girdiyi daha büyük bir boyuta (sağda) dönüştürmektir.
Ters evrişim, yalnızca girdiyi daha büyük bir boyuta dönüştürmektir. (İlgileniyorsanız, ayrıntılar için lütfen FCN incelemeleri hakkındaki makalemi okuyun.)
Ters evrişime ve paylaşımdan ayrılmaya bir örnek
Yukarıdaki resim bir örnektir. (B), 14 × 14 ters evrişim katmanının çıktısıdır. (C), havuzlamadan sonraki çıktıdır ve bu sırada bu şekilde devam eder. (J) 'de bisikletin etiket haritasının son 224 × 224 ters evrişim katmanında yeniden oluşturulabileceğini görebiliyoruz, bu da öğrenme özellikleri için bu evrişim çekirdeklerinin sınıfa özgü şekil bilgilerini yakalayabildiğini göstermektedir.
Giriş resmi (sol), FCN-8s (orta), DeconvNet (sağ)
Yukarıda gösterilen diğer örnekler, DeconvNet'in FCN-8'den daha kesin şekiller verebileceğini göstermektedir.
Bölge Tekliflerini kullanmayan anlamsal bölümleme görevinin kötü bir örneği
Yukarıda gösterildiği gibi, temelde alıcı alandan daha büyük veya daha küçük olan nesneler, model tarafından parçalara ayrılabilir veya yanlış etiketlenebilir. Daha küçük pikselli nesneler genellikle göz ardı edilir ve arka plan olarak sınıflandırılır.
Anlamsal bölümleme, bir örnek bölümleme problemi olarak kabul edilebilir. İlk olarak, 2000 bölge önerisinin ilk 50'si (sınırlayıcı kutular) nesne algılama yöntemi EdgeBox tarafından tespit edilir. Daha sonra, her bölgeye DeconvNet uygulanır ve önerilen tüm bölgelerin çıktıları, orijinal görüntüye geri toplanır. Önerileri kullanarak, çeşitli boyutlardaki görüntü bölümleme problemleriyle etkin bir şekilde başa çıkabilirsiniz.
İlk aşama eğitimi
Hedef örneği kırpmak, hedefi kırpılmış sınırlayıcı kutuda ortalamak ve ardından eğitim gerçekleştirmek için yer gerçeği ek açıklamasını kullanın. Bu, nesnelerin konumu ve boyutundaki değişiklikleri azaltmaya yardımcı olur.
İkinci aşama eğitimi
Daha zorlayıcı örnekler kullanın. Bu örneklerin örtüşen yer gerçeği bölgelerinden üretilmesi / kırpılması önerilmektedir.
Diğer detaylar
Ağda kullanılan BN
Evrişimli katmanın parametrelerini başlatmak için VGG ağırlıklarını kullanın
Ters evrişim katmanının parametreleri, 0 ortalama ile bir Gauss dağılımına başlatılır.
Parti başına numune sayısı 64'tür
demek istediğim sonuç
FCN-8'ler: yalnızca% 64,4 IoU anlamına gelir.
DeconvNet:% 69,6
DeconvNet + CRF:% 70,5 (burada CRF, model çıktısından sonraki işlem adımıdır)
EDeconvNet:% 71,5 (EDeconvNet, DeconvNet ve FCN-8s modelinin entegrasyon sonucunu ifade eder)
EDeconvNet + CRF:% 72,5, en yüksek ortalama IoU sonucuna sahiptir.
Örnek segmentasyonunun avantajları
Yukarıdaki şekilden de görebileceğiniz gibi, örnek segmentasyonu, tüm örnekleri tek seferde segmentlere ayırmak yerine yavaş yavaş örneği örneğe göre segmentlere ayırmaya yardımcı olur.
DeconvNet'in avantajlarının yalnızca aşamalı ters evrişimden ve havuzlamadan değil, aynı zamanda örnek bölümleme ve iki aşamalı eğitimden de geldiğini belirtmek gerekir.
Bazı görsel sonuçlar
EConvNet + CRF'nin çıktı sonucu FCN'den daha kötü olsa bile, gerçek etkisi genellikle çok iyidir.
Referanslar
Anlamsal Bölümleme için Ters Evrişim Ağını Öğrenme
Diğer makalelerim
Bu makalenin ilgili bağlantılarını ve referanslarını görüntülemeye devam etmek ister misiniz?
[Bir makale sizi DeconvNet örnekleme katmanını (anlamsal bölümleme) anlamaya götürür] 'e tıklayın veya aşağıdaki adrese basın:
https://ai.yanxishe.com/page/TextTranslation/1530
AI Araştırma Enstitüsü bugün şunları tavsiye ediyor: Lei Feng Net Lei Feng Net Lei Feng Net
Li Feifei, koz kartı kursu, bilgisayarla görmenin derinleşme seyri, bilgisayar görüşü alanında sinir ağının uygulanması, görüntü sınıflandırma, konumlandırma, algılama ve diğer görsel tanıma görevlerinin yanı sıra arama, görüntü anlama, uygulama, haritalama, tıp ve sürücüsüz sürüş konularında ders veriyor. Uçaklar ve otonom araçlar alanında en son uygulamalar.
Videoyu ücretsiz izlemek için gruba katılın: https://ai.yanxishe.com/page/groupDetail/19