Çeşitli evrişimli yapıların ilkelerini ve artılarını ve eksilerini anlamak için bir makale

Wang Xiaoxin Medium'dan derlendi

Qubit Üretildi | Genel Hesap QbitAI

Tipik bir derin öğrenme ağı olan evrişimli sinir ağları, görüntü işleme ve bilgisayar görüşü gibi birçok alanda iyi sonuçlar elde etmiştir.

Paul-Louis Pröve, Medium hakkındaki bu makale aracılığıyla hızlı bir şekilde farklı evrişim yapılarını (Evrişim) ve bunların avantajlarını tanıttı. Basitlik adına, bu makale sadece iki boyutlu evrişim yapısını tartışmaktadır.

kıvrım

İlk olarak, alt evrişimli katmanın yapısal parametrelerini tanımlayın.

Evrişim çekirdeği 3, adım 1 ve sınır genişlemeli iki boyutlu evrişim yapısı

Evrişim çekirdek boyutu (Kernel Size) : Evrişim işleminin alıcı alanını tanımlar. İki boyutlu evrişimde genellikle 3'e ayarlanır, yani evrişim çekirdeğinin boyutu 3 × 3'tür.

Adım : Evrişim çekirdeği görüntüden geçtiğinde adım boyutunu tanımlar. Varsayılan değer genellikle 1 olarak ayarlanır, ancak adım 2'ye ayarlandıktan sonra görüntü altörneklemesi de yapılabilir. Bu yöntem maksimum havuzlamaya benzer.

Dolgu malzemesi : Ağ katmanının örnek sınırı nasıl işlediğini tanımlar. Evrişim çekirdeği 1'den büyük olduğunda ve sınır genişletmesi yapılmadığında, çıktı boyutu buna göre azaltılacaktır; evrişim çekirdeği standart bir şekilde sınır genişletmesi olduğunda, çıktı verilerinin uzamsal boyutu girdiye eşit olacaktır.

Giriş ve çıkış kanalları (Kanallar) : Evrişimli katman oluşturulurken, giriş kanalı I tanımlanmalıdır ve çıkış kanalı O buna göre belirlenir. Bu şekilde, her ağ katmanının parametre miktarı I × O × K olarak hesaplanabilir, burada K, evrişim çekirdeğinin parametre sayısıdır. Örneğin, belirli bir ağ katmanının boyutu 3 × 3 olan 64 evrişim çekirdeği vardır ve karşılık gelen K değeri 3 × 3 = 9'dur.

Delik kıvrımı

Genişlemiş evrişimler olarak da bilinen atik evrişimler, " Genişleme oranı "" yeni parametre; bu parametre, evrişim çekirdeği verileri işlerken değerler arasındaki aralığı tanımlar.

Evrişim çekirdeği 3 olan, genişleme hızı 2 olan ve sınır genişlemesi olmayan iki boyutlu bir evrişim

Genişleme oranı 2 olan 3x3 evrişimli çekirdek, alıcı alan 5 × 5 evrişimli çekirdek ile aynıdır ve yalnızca 9 parametre gerektirir. Her iki satırı veya sütunu silen 5 × 5 evrişimli çekirdek olarak düşünebilirsiniz.

Aynı hesaplama koşulları altında, delik evrişimi daha geniş bir alıcı alan sağlar. Delik evrişimi genellikle gerçek zamanlı görüntü bölümlemede kullanılır. Ağ katmanı daha geniş bir alıcı alana ihtiyaç duyduğunda, ancak hesaplama kaynakları sınırlı olduğunda ve evrişim çekirdeğinin sayısı veya boyutu artırılamadığında, delik evrişimi düşünülebilir.

Yer değiştirmiş evrişim

Transpoze Evrişimler, ters evrişim veya kesirli kademeli evrişimler olarak da bilinir.

Ters evrişim terimi, ters evrişim kavramına uymadığı için uygunsuzdur. Derin öğrenmede ters evrişim vardır, ancak yaygın olarak kullanılmamaktadır. Aslında ters evrişim, evrişim işleminin ters sürecidir. Bu süreci bu şekilde anlayabilirsiniz.Tek bir evrişimli katmana bir görüntü girin ve evrişimli katmanın çıktısını alıp orijinal görüntüyü veren bir kara kutuya geçirin. O zaman bu kara kutunun, evrişim işleminin matematiksel ters işlemi olan bir ters evrişim işlemini tamamladığı söylenebilir.

Yer değiştirmiş evrişim, gerçek ters evrişime biraz benzer çünkü ikisi aynı uzamsal çözünürlüğü üretir. Bununla birlikte, bu iki tür evrişimin giriş verileri üzerinde gerçekleştirdiği gerçek matematiksel işlemler farklıdır. Yer değiştirmiş evrişim katmanı yalnızca geleneksel evrişim işlemlerini gerçekleştirir, ancak uzaysal çözünürlüğünü geri yükler.

Evrişim çekirdeği 3, adım 2 ve kenarlıksız genişleme ile iki boyutlu bir evrişim yapısı

Örneğin, evrişim katmanına 5 × 5 boyutlu bir görüntü girilirse, adım 2, evrişim çekirdeği 3 × 3'tür ve sınır genişlemesi yoktur. Daha sonra evrişimli katman 2 × 2'lik bir görüntü çıkaracaktır.

Ters sürecini gerçekleştirmek için, her giriş pikseline göre karşılık gelen 9 değer üretebilen karşılık gelen matematiksel ters işlemler gereklidir. Ardından, adımı 2'ye ayarlayın, çıktı görüntüsünü çaprazlayın, bu ters evrişim işlemidir.

3 × 3'lük bir evrişim çekirdeği, 2'lik bir adım ve kenarlıksız genişleme ile iki boyutlu aktarılmış evrişim

Yer değiştirmiş evrişim ile ters evrişim arasındaki tek ortak nokta, her iki çıktının da 5 × 5 görüntü olmasıdır, ancak aktarılmış evrişim hala geleneksel evrişim işlemlerini gerçekleştirir. Genişlemeyi sağlamak için girdinin bir şekilde doldurulması gerekir.

En azından sayısal olarak, yer değiştirmiş evrişimin ters evrişim işlemine ulaşamayacağını anlayabilirsiniz.

Yer değiştirmiş evrişim yalnızca önceki uzaysal çözünürlüğü yeniden oluşturmak içindir ve evrişim işlemi gerçekleştirilir. Bu, evrişimin matematiksel ters süreci değildir, ancak bir kodlayıcı-kod çözücü yapısında kullanıldığında yine de çok etkilidir. Bu şekilde, aktarılmış evrişim, iki ayrı işlem yerine görüntü kaba taneleme ve evrişim işlemlerini aynı anda gerçekleştirebilir.

Ayrılabilir evrişim

Ayrılabilir evrişimde, evrişim çekirdek işlemi birden çok adıma bölünebilir. Evrişim işlemi, çıktı görüntüsünün y, giriş görüntüsünün x ve evrişim çekirdeğinin k olduğu y = evrişim (x, k) ile temsil edilir. Sonra, k'nin aşağıdaki formülle hesaplanabileceğini varsayalım: k = k1.dot (k2). Bu, ayrılabilir bir evrişim işlemi sağlar, çünkü k, iki boyutlu bir evrişim işlemi gerçekleştirmek için kullanılmaz, ancak aynı etkiyi elde etmek için k1 ve k2 tarafından iki tek boyutlu kıvrım uygulanır.

X ve Y yönlerinde Sobel filtresi

Sobel operatörü genellikle görüntü işlemede kullanılır, işte bir örnek. Aynı filtreyi elde etmek için vektör toplamını transpoze vektörle çarpabilirsiniz. Bu işlemi tamamlamak için iki boyutlu evrişimde 9 parametre yerine sadece 6 parametreye ihtiyaç vardır.

Bu örnek, uzamsal olarak ayrılabilir evrişim denen şeyi göstermektedir Bu yöntem derin öğrenmede değil, sadece bu yapıyı anlamanıza yardımcı olmak için kullanılır.

Sinir ağlarında genellikle kullanırız Derin ayrılabilir evrişim yapısı (Derinlemesine ayrılabilir evrişim).

Bu yöntem, kanal ayrımını korurken derin bir evrişim yapısını bağlayarak uzaysal evrişimi gerçekleştirebilir. Sonra, herkesin bir örnekle daha iyi anlamasına izin verin.

16 giriş kanalı ve 32 çıkış kanalı olan 3x3 evrişimli bir katman olduğunu varsayalım. Spesifik olarak, 3x3 boyutunda 32 evrişim çekirdeği her veriyi 16 kanalda dolaşır ve böylece 16x32 = 512 özellik haritası oluşturur. Daha sonra, her bir giriş kanalına karşılık gelen özellik haritasının üst üste getirilmesi ve ardından birleştirilmesiyle bir özellik haritası elde edilir. Son olarak, gerekli 32 çıkış kanalı mevcuttur.

Bu örnek için, derinlikle ayrılabilir evrişim uygulanmış ve 16 kanalın verilerini dolaşmak için 3x3 boyutlu bir evrişim çekirdeği kullanılmış ve 16 özellik haritası elde edilmiştir. Füzyon işleminden önce, 32 adet 1x1 evrişim çekirdeği, ilave füzyon gerçekleştirmek için 16 özellik haritasını geçmek için kullanılır. Bu işlem 16 × 3 × 3 + 16 × 32 × 1 × 1 = 656 parametresini kullanır ve bu, yukarıdaki 16 × 32 × 3 × 3 = 4608 parametrelerinden çok daha azdır.

Bu örnek, yukarıdaki derinlik çarpanının 1'e ayarlandığı, aynı zamanda bu tür ağ katmanının şu anda ortak bir parametresi olan, derinlemesine ayrılabilir evrişimin spesifik işlemidir.

Bu, uzamsal bilgiyi ve derinlik bilgisini ayırmak için yapılır. Xception modelinin etkisinden bu yöntemin daha etkili olduğu görülmektedir. Parametrelerin etkin kullanımı nedeniyle, derinlik ayrılabilir evrişim mobil cihazlarda da kullanılabilir.

İlgili Okuma

orijinal:

https://medium.com/towards-data-science/types-of-convolutions-in-deep-learning-717013397f4d

Daha fazla evrişim animasyonu:

https://github.com/vdumoulin/conv_arithmetic

Bitiş

Herkes PlayerUnknown's Battlegrounds'un bereketli büyük şehrine atlamak ister, ancak hayatta kalabilenler bu becerileri bilir
önceki
Dalian Yifang söylentileri yalanlamadı mı? Sampaoli Jardim kadar iyi değil, Schuster kimi kızdırdı?
Sonraki
Warriors 2 büyük deliği savunuyor.Sorun oldukça ciddi. Neyse ki, Cole çoktan çözmeye başladı!
Guiyang Geely'nin yeni enerji üretim hattı devreye alınarak yeni enerji araçlarının yaygınlaştırılmasında başı çekiyor
Dünya Kupası güç listesinden daha zehirli bir liste! RNG, IG paniğinin ilk partisini alt üst etti
Yapay zeka ne yapabilir? İşte 8 beklenmedik AI uygulaması
Guoan'ın dört kapısı cesur ve Schmidt mutluluk ve sıkıntılar yarattı! Dalian'da kiralamaya ne dersiniz?
15'te 3, 2'de 10, 0'da 10, roketin ölümcül krizi ortaya çıktı ve kabus yeniden ortaya çıkıyor!
Brilliance China V6, "istihbarata" güvenerek Jinyun Dağı'nda dalgalanıyor
En karlı mobil oyunların sıralaması yayınlandı ve Zafer Kralı yalnızca beşinci sırada! İlki küçük bir ülkeden!
Büyük kazanan yok! Carrasco özür diledi + pasaport karşılığında 1,2 milyon tazminat ödedi, kulüp bunu en çok düşünmeli
Didi Otonom Araçlarının Uber'den kiraladığı uzmanlar GM tarafından kaçırıldı
Rockets'ın dört mutlu sezonu, arka arkaya 8 galibiyet, Harden Paul her ikisi de rekor kırdı, 15 + 9 Titan geri döndü!
Tesla'nın not indirimi ve hisse senedi fiyatları düşüyor, elektrikli araçların geleceği nerede?
To Top