Üç, VGGNet
Ağ yapısı aşağıdaki gibidir:
VGGNet ve AlexNet arasındaki temel fark, evrişim çekirdeğinin boyutu, evrişim adımlarının sayısı ve ağın derinliğidir.
VGGNet, küçük evrişim çekirdeğini insanların görüş alanına getirir. AlexNet'teki ilk evrişim katmanı tarafından kullanılan çekirdek boyutu 11 × 11'dir
11 × 11, adım 4, 5 × 5 C3 ve C5 katmanlarında kullanılır
5 × 5 evrişim çekirdeği; VGGNet'te görünen evrişim çekirdeklerin çoğu 3 × 3 boyutundadır
3 × 3, adım 1'dir.
Sezgisel olarak, büyük bir evrişim çekirdeğinin daha iyi olduğunu düşünebiliriz çünkü daha geniş bir alanda bilgi çıkarabilir, ancak gerçekte, büyük bir evrişim çekirdeği birden çok küçük evrişim çekirdeği ile değiştirilebilir. Örneğin, 5 × 5
5 × 5 evrişimli çekirdek iki seri 3 × 3 kullanabilir
3 × 3 evrişimli çekirdek yerine, 7 × 7
7 × 7 evrişimli çekirdek üç seri 3 × 3 kullanabilir
Bunun yerine 3 × 3 evrişimli çekirdek. Bu alternatifin iki avantajı vardır:
VGGNet yapısının C'de 1 × 1'in de kullanıldığını belirtmekte fayda var.
1 × 1 evrişim çekirdeği. Bununla birlikte, burada bu evrişim çekirdeğinin kullanımı, boyutsallık artışını ve boyutsallık azaltmayı simüle etmek için Başlangıç gibi kanalları entegre etmek için kullanılmaz.Kanalların sayısı burada değiştirilmemiştir, dolayısıyla doğrusal olmayanlığın daha ileri bir girişi olarak anlaşılabilir.
VGGNet'in ortaya çıkışı, CNN potansiyelinin sonsuz olduğunu ve ağ ne kadar derin olursa, sınıflandırma problemlerinde o kadar iyi performans gösterdiğini bilmemize izin verdi. Bak, 3 × 3
3x3 evrişim çekirdeği en makul olanıdır.
Dört, GoogLeNet
GoogLeNet'in temel fikri, tüm tam bağlantıları ve hatta evrişimli yerel bağlantıları seyrek bağlantılarla değiştirmektir. Bu şekilde, ağ yapısının seyrekliği korunabilir ve yoğun matris hesaplamasının verimli yöntemi kullanılabilir. Çok sayıda çalışma, seyrek matrislerin hesaplama performansını iyileştirmek için daha yoğun alt matrisler halinde kümelenebileceğini göstermiştir ve Inception ortaya çıkmıştır. Başlangıç yapısı aşağıdaki gibidir:
Buradaki seyreklik, evrişim işlemi sırasında çekirdeğin boyutunun resmin boyutundan çok daha küçük olduğu ve bir özellik haritasının yalnızca birkaç giriş birimine bağlı olduğu anlamına gelir; ve yoğun matris hesaplaması, Başlangıç modülündeki dört dalın görülebileceği anlamına gelir. İş nispeten seyrek bir bölümdür, ancak eklemeden sonra büyük, yoğun bir matris haline gelir. Bu temel modül 3 farklı evrişim çekirdeği kullanır, bu nedenle çıkarılan özellikler, özellik çeşitliliğini artıran hem makroskobik hem de mikroskobik özelliklere sahip 3 farklı ölçek olmalıdır. Havuzlama katmanı, daha ilkel girdi bilgilerini tutar. Modülün çıkışında, çıkarılan çeşitli özellikler, çok ölçekli özellikler elde etmek için kanal boyutuna eklenir.
GoogleNet, yukarıdaki modülleri biriktirir ve tüm GoogleNet ağ yapısı aşağıdaki gibidir:
Ek olarak, aşağıda gösterildiği gibi Inception'ın yükseltilmiş bir sürümü vardır: