Evrişimli sinir ağları (CNN'ler) oluşturmak için kullanılan çeşitli modüller nispeten sabit bir geometrik yapıya sahip olduğundan, bu temelde CNNs algoritması ile geometrik dönüşümlerin modellenmesini sınırlar. Lei Feng.com, "Deformable Convolutional Networks" makalesinde, Microsoft Research Asia'dan araştırmacıların, CNNs algoritmasının geometrik dönüşümleri modelleme yeteneğini geliştirmek için Deformable Convolution ve Deformable RoI havuzu olmak üzere iki yeni modül önerdiğini öğrendi.
Yukarıdaki resim 3 x 3 boyutunda bir Deforme edilebilir evrişim yapısını göstermektedir.
Deforme Edilebilir evrişim ve Deformable ROI havuzlaması fikirleri şunlardır:
Ek ofset sağlanması durumunda, modüldeki uzamsal örnekleme konumunu artırın (bkz. Şekil 2);
Ek denetim olmadan hedef görevden ofseti öğrenin (bkz. Şekil 3).
Yukarıdaki şekil, 3 x 3 boyutlu bir Deforme Edilebilir ROI havuzlama yapısını göstermektedir
Bu iki modülün mevcut evrişimli sinir ağlarında (CNN'ler) karşılık gelen modüllerin yerini kolayca alabileceğini ve ayrıca standart geri yayılım algoritmaları aracılığıyla uçtan uca (Uçtan Uca) olabileceğinden bahsetmeye değer. ) Deforme edilebilir evrişimli ağlar üretmek için eğitim.
Yukarıdaki şekil (a), geleneksel evrişim işleminde iki katmanlı sabit alıcı alanı gösterir ve (b) deforme olabilen evrişim işleminde iki katmanlı uyarlamalı alıcı alanı gösterir. İki resim (a) ve (b) aynı yapıyı izler. Yukarıdan aşağıya, bunlar: 1. En üstteki resim iki aktivasyon birimini gösterir. Farklı şekil ve boyutlardaki nesnelerin içinde bulunurlar ve girdileri 3x3 boyutlu bir filtre için; 2. Ortadaki resim, önceki özellik haritasında iki 3x3 boyutlu filtrenin örnekleme konumlarını göstermektedir ve hala vurgulanmış iki aktif birim vardır; 3. , Alttaki resim, önceki özellik haritasında iki seviyeli 3x3 filtrenin örnekleme pozisyonlarını gösterir.Resmin önceki katmanındaki vurgulara karşılık gelen iki grup örnekleme konumu vurgulanır. birim.
Leifeng.com'a göre, Microsoft Research Asia'daki araştırmacılar, çok sayıda deney yoluyla nesne algılama ve anlamsal bölümlemenin iki karmaşık vizyon görevi için yeni yöntemin etkinliğini doğruladılar ve ilgili deneysel kodlar da yayınlanacak.
Leifeng.com tarafından derlenen Deformable Convolutional Networks aracılığıyla