g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

DeepLabv1 ve DeepLabv2 delikli evrişim (anlamsal bölümleme)

Bu makale, AI Araştırma Enstitüsü tarafından derlenen, orijinal başlığı olan teknik bir blogdur:

Gözden Geçirme: DeepLabv1 ve DeepLabv2 - Atrous Convolution (Anlamsal Segmentasyon)

Yazar | Sik-Ho Tsang

Tercüme | Stephen Ergouzi

Düzeltme | Sos Armut İnceleme | Johnson Lee'nin Maaş Artışı Sıralama | Daimi Balık Kralı

Orijinal bağlantı:

https://towardsdatascience.com/review-deeplabv1-deeplabv2-atrous-convolution-semantic-segmentation-b51c5fbde92d

Bu yazıda DeepLabv1 ve DeepLabv2 ağlarını gözden geçirdim çünkü ikisi de delikli Atrous Convolution ve tam bağlantılı Koşullu Rastgele Alan (CRF) kullanıyorlar.DeepLabv2'ye ek olarak Atous Spatial adlı ek bir teknik var. Piramit Havuzlama (ASPP), DeepLabv2 ve DeepLabv1 arasındaki temel fark budur. (Elbette başka farklılıklar da vardır, örneğin: DeepLabv2 deneyler için ResNet ve VGGNet kullanır, ancak DeepLabv1 yalnızca VGGNet kullanır.)

DeepLab modeli

Yukarıdaki resim DeepLab model mimarisidir. İlk olarak, giriş görüntüsü ağdaki ani evrişim ve ASPP'den geçirilir. Ardından, ağın çıktı grafiği çift doğrusal olarak enterpolasyonlu hale getirilir ve sonuç, tam bağlı CRF aracılığıyla ince ayar yapılır ve nihai çıktı elde edilir.

DeepLabv1 ve DeepLabv22015 ICLR ve 2018 TPAMI'de yayınlandı.Bu hikayeyi yazarken sırasıyla 400 ve 2000'den alıntı yaptım.

Bu makalenin içeriği:

Delikli evrişim

Uzamsal piramit havuzu

Tamamen bağlı koşullu rastgele alan

Deneysel sonuçlar

1. şiddetli evrişim

"Atrous" kelimesi, delik anlamına gelen Fransızca "àtrous" kelimesinden gelir. Bu nedenle, Atrous dönüşümü "delik evrişimi" olarak da adlandırılır. Bazı kağıtlara "genişletilmiş evrişim" de denir. Genellikle dalgacık dönüşümü için kullanılır ve şimdi derin öğrenme için evrişimde kullanılmaktadır.

Aşağıdakiler acımasız evrişimin ifadesidir:

Delikli 1 boyutlu evrişim (r > 1: atrous evrişim, r = 1: standart evrişim)

R = 1 olduğunda, genellikle kullandığımız standart evrişimdir.
R ne zaman > 1'de, delikli bir evrişimdir ve r, evrişim işlemi sırasında giriş örneklerinin adım boyutudur.

Aşağıdaki şekil bunu göstermektedir

Standart evrişim deliği evrişim (altta)

Acımasız evrişim fikri basittir. Şeklin üst kısmında standart evrişim var.

Şeklin altında bir delik evrişimi var. Hız = 2 olduğunda, giriş sinyalinin dönüşümlü olarak örneklendiğini görebiliriz. İlk olarak pad = 2, sol ve sağ tarafa 2 sıfır koyduğumuz anlamına gelir. Ardından, oran = 2 durumunda, her 2 girişte bir evrişim için giriş sinyalini örneklemeliyiz. Bu nedenle, çıktıda, çıktı özelliği haritasını daha büyük yapan 5 çıktıya sahip olacağız. FCN makalesinde hatırlarsak, bir dizi evrişim ve havuzlama çıktı özelliği haritasını çok küçük hale getirecektir, bu nedenle son 32 kez yukarı örnekleme gereklidir ki bu biraz fazla örneklemedir.

Ek olarak, ani evrişim, evrişim çekirdek filtresinin görüş alanını daha büyük alıcı alan bilgilerini içerecek şekilde genişletmemize izin verir. Aynı zamanda, alıcı alanın boyutunu kontrol etmek ve hassas konumlandırma (küçük görüş alanı) ile ön ve arka bilgiler (geniş görüş alanı) aracılığıyla ayrıntıları onarmak arasında en iyi dengeyi bulmak için etkili bir mekanizma sağlar.

DeepLab'de, VGG-16 veya ResNet-101 kullanılır ve aşırı sinyal ekstraksiyonunu önlemek için son havuzlama (havuz5) veya evrişim konv5_1 adımı sırasıyla 1'e ayarlanır. Ve sonraki tüm evrişim katmanlarını değiştirmek için delik evrişimi oran = 2 ile kullanın. Bu, çıktıyı çok daha büyük hale getirir. Gerekli boyutu çıktı almak için yalnızca 8 kez yukarı örnekleme yapmamız gerekir. Ve çift doğrusal enterpolasyon, 8 kat yukarı örnekleme için oldukça iyi performansa sahiptir.

2. Delikli mekansal piramit havuzu (ASPP)

Delikli mekansal piramit havuzu (ASPP)

ASPP, aslında SPPNet'te açıklanan uzaysal piramit havuzunun bir versiyonudur. ASPP'de, giriş özellik haritasında farklı oranlarda paralel delik konvolüsyonları uygulanır ve birleştirilir. Aynı türdeki nesneler görüntüde farklı oranlara sahip olabileceğinden, ASPP, doğruluğu artırabilen nesnelerin farklı oranlarını dikkate almaya yardımcı olur.

3. Tam bağlantılı koşullu rastgele alan (CRF)

Tam bağlı CRF, çift doğrusal enterpolasyondan sonra ağ çıkışına uygulanır.

Tam bağlı CRF

x, piksellerin etiket atamasıdır. P (xi) i pikselindeki etiket atama olasılığıdır. Bu nedenle, ilk terim i, logaritmik bir olasılıktır. İkinci terim olan ij için bu bir filtredir. Xi! = Xj, = 1 olduğunda. Xi = xj olduğunda, = 0. Parantez içinde, iki çekirdeğin ağırlıklı toplamıdır. İlk çekirdek, piksel değeri farkına ve iki taraflı bir filtre olan piksel konum farkına bağlıdır. Çift taraflı filtre, kenarları koruma özelliğine sahiptir. İkinci çekirdek yalnızca bir Gauss filtresi olan piksel konum farkına bağlıdır. Bu ve w çapraz doğrulama ile bulunur. Yineleme sayısı 10'dur.

Üst: puan grafiği (softmax işlevinden önce giriş), alt grafik: güven grafiği (softmax işlevinin çıktısı)

10 kat CRF ile, uçağın çevresindeki farklı renkteki küçük alanlar pürüzsüz hale gelir.

Ancak CRF, DeepLabv1 ve DeepLabv2'yi uçtan uca bir öğrenme çerçevesi haline getiren bir işlem sonrası süreçtir. Ve DeepLabv3 ve DeepLabv3 + 'da kullanılmaz.

4. Sonuçlar

4.1 Deneysel doğrulama

DeepLab-LargeFOV (sol: yalnızca tek bir atrous dönüşüm), DeepLab-ASPP (sağ, ASPP)

ResNet-101'in her bir model bileşenini PASCAL VOC 2012 doğrulama setinde kullanmanın sonuçları

ResNet-101'in basit kullanımı:% 68.72
MSC: Çok ölçekli giriş
COCO: COCO veri kümesinden önceden eğitilmiş bir model
Ağu: Giriş görüntüsünü rastgele ölçeklendirerek (0,5'ten 1,5'e) veri geliştirme
LargeFOV: Delik evrişimi kullanarak DeepLab modeli yukarı örnekleme
ASPP: Paralel delik evrişimi kullanan DeepLab modeli
CRF: Son işleme için tamamen bağlı koşullu rastgele alan

4.2 En gelişmiş yöntemlerle karşılaştırma

PASCAL VOC 2012 test seti (en solda) PASCAL-Context (soldan ikinci) PASCAL-Person-Part (sağdan ikinci) Şehir Manzarası (en sağda)

Yukarıda da belirtildiği gibi

4.3 Nitel sonuçlar

Sonuç: PASCAL-Bağlam verileri

Sonuç: Şehir manzarası verileri

Ancak DeepLab'de, bisikletlerin ve sandalyelerin bisikletler ve sandalye ayakları gibi çok sayıda küçük parçadan oluştuğu bazı başarısızlık örnekleri de vardır:

Başarısız örnek

Gelecekte DeepLabv3 ve DeepLabv3 + hakkında bir blog yazısı yazmayı umuyorum.

Referanslar

Derin Evrişimli Ağlar ve Tamamen Bağlı CRF'ler ile Anlamsal Görüntü Segmentasyonu

DeepLab: Derin Evrişimli Ağlar, Yoğun Evrişim ve Tam Bağlı CRF'ler ile Anlamsal Görüntü Segmentasyonu

İlgili makalelerim

Bu makalenin ilgili bağlantılarını ve referanslarını görüntülemeye devam etmek ister misiniz? Lei Feng Ağı Lei Feng Ağı Lei Feng Ağı

Erişmek için [DeepLabv1 ve DeepLabv2-Hole Convolution (Semantik Segmentasyon)] öğesine tıklayın veya aşağıdaki adrese basılı tutun:

https://ai.yanxishe.com/page/TextTranslation/1531

Python Çince kitaplarından oluşan geniş bir koleksiyon

100 Python Çince e-kitap, 6 kaynak kodu, girişten keşişe kadar Python, tek elden hizmet.

Python temelleri, gelişmiş, tarayıcılar, algoritma uygulaması, derin öğrenme, TensorFlow, NLP vb. İçerir.

Dostça bir hatırlatma: Dosya boyutu 2.89GB, lütfen veri indirmeyi dikkatli kullanın, önce kaydedebilirsiniz ~~!

Almak için bağlantıya tıklayın: https://ai.yanxishe.com/page/resourceDetail/676

Rapor Dijital Yorumlama Turing Ödülü 52 yıl

"Pacific Rim: Rising Thunder" bu rolde rol alan Jing Tian, sizi şaşırttı mı?

: Ağır haberler! Xiao An çizmek üzere

: Dongfengin ilk küçük SUV'si olan AX4 samimi mi?

: İki klasiğin kombinasyonu ne kadar güçlü? Bu iki Air VaporMax Plus'ın renk uyumu çok popüler!

: CEIS2017 | Genç yönetmen, filmlere saygısızlık eden parayla "mastürbasyon" yapmayın

: Jacky Cheung şarkıcı Jordan ve Eason Chan Kobe ise, dört kralın diğer üçü kim?

: Mi Play gerçek makinesi açıklandı: su damlası ekranı + arka parmak izi + gradyan rengi + 10G aylık trafik

: Piyasaya sürülmesinden bir aydan kısa bir süre sonra, yeni iPhone'daki bu sorunlar dayanılmaz

: CCF-GAIR 2018 Küresel Yapay Zeka ve Robotlar Zirvesi'nin ilk gününün gündemi açıklandı: Tüm yapay zeka çalışanlarına saygı gösterilecek 5 hikaye

: En güçlü botların önümüzdeki yıl çıkması bekleniyor! BİR BATHING APE x adidas DAME Önce görmek için 4 ortak casus fotoğraflar!

: "Kalbimin Peşinde Rüya" beğendi! Angela Chang: Beni uçmaya götürecek çift görünmez kanadım var

: "Mikro Yetenek" başı çekiyor, Laike Media orijinal IP içeriğiyle web dramalarının kuşatmasını nasıl aşıyor?

: Yeni nesil Buick Regal GS şasi daha akıllı kullanım deneyimi yaşıyor

kıvrım

g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

DeepLabv1 ve DeepLabv2 delikli evrişim (anlamsal bölümleme)

1. şiddetli evrişim

2. Delikli mekansal piramit havuzu (ASPP)

3. Tam bağlantılı koşullu rastgele alan (CRF)

4. Sonuçlar

İlgili bilgi

Xiaomi Play, Guinness Rekorlar Kitabına başarıyla meydan okudu. Sınırsız trafikle gelen Xiaomi Play'e bir göz atalım.

AI + Eğitim: Öğrencilerin Bin Yüzünü Çözme

Lu Hanın reytingleri, Zhou Huajianın özel efektleri, ünlülerin CP'si, Yılbaşı partisi hesabını satın alıyor musunuz?

Bugün evliliğini ilan eden Xie Yilin, aslında düşük anahtarlı bir hayat galibi!

Kendi verisine sahip bir cep telefonu olan Xiaomi play resmi olarak piyasaya sürüldü, bir cep telefonu satın aldı ve yeni bir model oluşturmak için veri yolladı

"Saray Kilidi ve Boncuk Perdesi" nden "Kadınların Krallığı" na, "Fengying" işbirliğinin tarihi, Zhao Liying'in büyüme tarihidir

Onur teknolojisinin ustası olan Honor V20 çizimleri, dokuz teknolojinin eşlik ettiği ortaya çıktı

Zhu Ya Diploma "Sound on the Scene" de ne kazandı? Sesi insanları hamile bırakabilir!

Ekim ayında yeni telefonları çözmenize yardımcı olduk ve en çok beklenen şeyin ...

Guangxi'deki Weizhou Adası'nda mahsur kalan 700'den fazla turist bu sabah güvenli bir şekilde karaya çıktı ve adaya bindi