Bu makale, DeconvNet örnekleme katmanını (anlamsal segmentasyon) anlamanızı sağlar

Bu makale, AI Araştırma Enstitüsü tarafından derlenen, orijinal başlığı olan teknik bir blogdur:

Gözden Geçirme: DeconvNet - Paylaşım Katmanı (Anlamsal Segmentasyon)

Yazar | SH Tsang

Tercüme | Stephen Ergouzi

Düzeltme | Sos Armut İnceleme | Johnson Lee'nin Maaş Artışı Sıralama | Daimi Balık Kralı

Orijinal bağlantı:

https://towardsdatascience.com/review-deconvnet-unpooling-layer-semantic-segmentation-55cf8a6e380e

Bu makalede, DeconvNet'i kısaca gözden geçirdik: Ters evrişim ağı (DeconvNet) bir ters evrişim ve bir paylaştırma katmanından oluşur.

Geleneksel tam evrişimli ağ FCN için, çıktı, kaba bölümleme çıktısına (etiket haritası) neden olabilen yüksek hızlı (32x, 16x ve 8x) yukarı örnekleme yoluyla elde edilir. DeconvNet'te nihai çıktı etiketi, aşamalı evrişim çözme ve havuzlama yoluyla elde edilir. Bu makale 2015 yılında ICCV'de yayınlandı. Bu blog yazısını yazdığımda zaten 1000'den fazla alıntı vardı (SH Tsang @ Medium).

Bu makale neleri kapsar

  • Yukarı paylaşım ve ters evrişim

  • Örnek segmentasyonu

  • İki aşamalı eğitim

  • Model sonuçları

  • 1. Üst örnekleme ve ters evrişim

    Aşağıda, DeconvNet'in genel mimarisi verilmiştir:

    DeconvNet mimarisi

    Gördüğümüz gibi ağ, omurga çerçevesi olarak VGG'yi kullanıyor. İlk bölüm, evrişim ve havuzlama katmanları içeren, FCN gibi evrişimli bir ağdır. İkinci bölüm, bu makalenin yeni bir parçası olan ters evrişim ağıdır.

    Havuzlama işlemi (solda), model konum bilgilerini hatırlar ve Paylaşımdan çıkarma sırasında konum bilgilerini kullanır (sağda)

    Havuzlama gerçekleştirmek için, yukarıda gösterildiği gibi, maksimum havuzlamayı gerçekleştirirken her bir maksimum aktivasyon değerinin konumunu hatırlamamız gerekir. Daha sonra, yukarıda gösterildiği gibi, hafızaya alınan konum bilgileri havuzlama işlemi için kullanılır.

    Evrişim, girdiyi daha küçük bir boyuta (solda) dönüştürmek, ters evrişim ise girdiyi daha büyük bir boyuta (sağda) dönüştürmektir.

    Ters evrişim, yalnızca girdiyi daha büyük bir boyuta dönüştürmektir. (İlgileniyorsanız, ayrıntılar için lütfen FCN incelemeleri hakkındaki makalemi okuyun.)

    Ters evrişime ve paylaşımdan ayrılmaya bir örnek

    Yukarıdaki resim bir örnektir. (B), 14 × 14 ters evrişim katmanının çıktısıdır. (C), havuzlamadan sonraki çıktıdır ve bu sırada bu şekilde devam eder. (J) 'de bisikletin etiket haritasının son 224 × 224 ters evrişim katmanında yeniden oluşturulabileceğini görebiliyoruz, bu da öğrenme özellikleri için bu evrişim çekirdeklerinin sınıfa özgü şekil bilgilerini yakalayabildiğini göstermektedir.

    Giriş resmi (sol), FCN-8s (orta), DeconvNet (sağ)

    Yukarıda gösterilen diğer örnekler, DeconvNet'in FCN-8'den daha kesin şekiller verebileceğini göstermektedir.

    2. Örnek segmentasyonu

    Bölge Tekliflerini kullanmayan anlamsal bölümleme görevinin kötü bir örneği

    Yukarıda gösterildiği gibi, temelde alıcı alandan daha büyük veya daha küçük olan nesneler, model tarafından parçalara ayrılabilir veya yanlış etiketlenebilir. Daha küçük pikselli nesneler genellikle göz ardı edilir ve arka plan olarak sınıflandırılır.

    Anlamsal bölümleme, bir örnek bölümleme problemi olarak kabul edilebilir. İlk olarak, 2000 bölge önerisinin ilk 50'si (sınırlayıcı kutular) nesne algılama yöntemi EdgeBox tarafından tespit edilir. Daha sonra, her bölgeye DeconvNet uygulanır ve önerilen tüm bölgelerin çıktıları, orijinal görüntüye geri toplanır. Önerileri kullanarak, çeşitli boyutlardaki görüntü bölümleme problemleriyle etkin bir şekilde başa çıkabilirsiniz.

    3. İki aşamalı eğitim

    İlk aşama eğitimi

    Hedef örneği kırpmak, hedefi kırpılmış sınırlayıcı kutuda ortalamak ve ardından eğitim gerçekleştirmek için yer gerçeği ek açıklamasını kullanın. Bu, nesnelerin konumu ve boyutundaki değişiklikleri azaltmaya yardımcı olur.

    İkinci aşama eğitimi

    Daha zorlayıcı örnekler kullanın. Bu örneklerin örtüşen yer gerçeği bölgelerinden üretilmesi / kırpılması önerilmektedir.

    Diğer detaylar

    • Ağda kullanılan BN

    • Evrişimli katmanın parametrelerini başlatmak için VGG ağırlıklarını kullanın

    • Ters evrişim katmanının parametreleri, 0 ortalama ile bir Gauss dağılımına başlatılır.

    • Parti başına numune sayısı 64'tür

    4. Sonuçlar

    demek istediğim sonuç

    • FCN-8'ler: yalnızca% 64,4 IoU anlamına gelir.

    • DeconvNet:% 69,6

    • DeconvNet + CRF:% 70,5 (burada CRF, model çıktısından sonraki işlem adımıdır)

    • EDeconvNet:% 71,5 (EDeconvNet, DeconvNet ve FCN-8s modelinin entegrasyon sonucunu ifade eder)

    • EDeconvNet + CRF:% 72,5, en yüksek ortalama IoU sonucuna sahiptir.

    Örnek segmentasyonunun avantajları

    Yukarıdaki şekilden de görebileceğiniz gibi, örnek segmentasyonu, tüm örnekleri tek seferde segmentlere ayırmak yerine yavaş yavaş örneği örneğe göre segmentlere ayırmaya yardımcı olur.

    DeconvNet'in avantajlarının yalnızca aşamalı ters evrişimden ve havuzlamadan değil, aynı zamanda örnek bölümleme ve iki aşamalı eğitimden de geldiğini belirtmek gerekir.

    Bazı görsel sonuçlar

    EConvNet + CRF'nin çıktı sonucu FCN'den daha kötü olsa bile, gerçek etkisi genellikle çok iyidir.

    Referanslar

    Anlamsal Bölümleme için Ters Evrişim Ağını Öğrenme

    Diğer makalelerim

    Bu makalenin ilgili bağlantılarını ve referanslarını görüntülemeye devam etmek ister misiniz?

    [Bir makale sizi DeconvNet örnekleme katmanını (anlamsal bölümleme) anlamaya götürür] 'e tıklayın veya aşağıdaki adrese basın:

    https://ai.yanxishe.com/page/TextTranslation/1530

    AI Araştırma Enstitüsü bugün şunları tavsiye ediyor: Lei Feng Net Lei Feng Net Lei Feng Net

    Li Feifei, koz kartı kursu, bilgisayarla görmenin derinleşme seyri, bilgisayar görüşü alanında sinir ağının uygulanması, görüntü sınıflandırma, konumlandırma, algılama ve diğer görsel tanıma görevlerinin yanı sıra arama, görüntü anlama, uygulama, haritalama, tıp ve sürücüsüz sürüş konularında ders veriyor. Uçaklar ve otonom araçlar alanında en son uygulamalar.

    Videoyu ücretsiz izlemek için gruba katılın: https://ai.yanxishe.com/page/groupDetail/19

    2018 Apple'ın yeni MacBook Air incelemesi, ruh kemiği gibi bir yükseltme
    önceki
    LG V40 ThinQ konferans ısınma videosu: arkadaki üç kamera 3 Ekim'de piyasaya sürülecek
    Sonraki
    Çiçek izleme süresi | Çiçek izleme ve çay toplama, Bishan Sanhe sizi oynamaya davet ediyor
    Buick GL6 resmi haritası çıktı! Yeni araba bu yıl içinde / 1.3T motorla listelenecek
    Nubia X ayrıntılı değerlendirme: en kapsamlı tam ekran, hem ön hem de arka ekranlardır
    Avustralya, Huawei'nin dijital iletişim sistemi sağlamasını onayladı; Lyft IPO tanıtım gezisini başlattı; Ali "Erha" taciz karşıtı telefon mini programını başlatacak
    Yeniden tasarruf edin! İlimizdeki 118 hastanenin muayene sonuçları birbirini tanımaktadır, bu nedenle muayeneleri tekrar etmeye gerek yoktur ~ Detaylı tablo
    Çin-Japon ortak yapımı, "Servant Warriors: Rebellion of the Stars" Çin çizgi romanlarının lideri nasıl oldu?
    Kesintisiz ortak adın ardından OFF-WHITE sunucusu Virgil Abloh bu kez yeniden bir grup kurmaya başladı! ?
    BMW'nin yeni 5 serisi ve Jaguar XFL, satın almaya daha değer kim?
    Visual China, röportaj sitesi tarafından geçici olarak kapatıldı. Serin bir ritim mi istiyorsunuz?
    Harbin Bu çocuğun babasını kim tanıyor? Oğlunu anaokuluna bırakalı 11 gün oldu! Çocuk evini özlüyor ve ateşi var
    Beş film kralı podyumda ilk kez sahneye çıkıyor. Mtime.com moda çemberine girmek için "Great Wall" türevlerini kullanıyor mu?
    Honor Magic 2 yayınlandı: Kirin 980 + AI altı kamera + 40W hızlı şarj, 3799'dan mı başlıyor?
    To Top