Makineler öğrenmez: Bilgisayar Görme Serisi (2) VGGNet ve GoogLeNet

Makine www.jqbxx.com'u öğrenmiyor: Derin toplu makine öğrenimi, derin öğrenme algoritmaları ve teknik mücadele

Üç, VGGNet

Ağ yapısı aşağıdaki gibidir:

VGGNet ve AlexNet arasındaki temel fark, evrişim çekirdeğinin boyutu, evrişim adımlarının sayısı ve ağın derinliğidir.

VGGNet, küçük evrişim çekirdeğini insanların görüş alanına getirir. AlexNet'teki ilk evrişim katmanı tarafından kullanılan çekirdek boyutu 11 × 11'dir

11 × 11, adım 4, 5 × 5 C3 ve C5 katmanlarında kullanılır

5 × 5 evrişim çekirdeği; VGGNet'te görünen evrişim çekirdeklerin çoğu 3 × 3 boyutundadır

3 × 3, adım 1'dir.

Sezgisel olarak, büyük bir evrişim çekirdeğinin daha iyi olduğunu düşünebiliriz çünkü daha geniş bir alanda bilgi çıkarabilir, ancak gerçekte, büyük bir evrişim çekirdeği birden çok küçük evrişim çekirdeği ile değiştirilebilir. Örneğin, 5 × 5

5 × 5 evrişimli çekirdek iki seri 3 × 3 kullanabilir

3 × 3 evrişimli çekirdek yerine, 7 × 7

7 × 7 evrişimli çekirdek üç seri 3 × 3 kullanabilir

Bunun yerine 3 × 3 evrişimli çekirdek. Bu alternatifin iki avantajı vardır:

  • Parametrelerin sayısını azaltın: Serideki iki küçük evrişim çekirdeği 3 × 3 × 2 = 18'e ihtiyaç duyar
  • 3 × 3 × 2 = 18 parametre, bir 5 × 5
  • 5 × 5 evrişimli çekirdek 25 parametreye sahiptir; serideki üç küçük evrişim çekirdeği 3 × 3 × 3 = 27'ye ihtiyaç duyar
  • 3 × 3 × 3 = 27 parametre, bir 7 × 7
  • 7 × 7 evrişim çekirdeğinin 49 parametresi vardır. Parametrelerin sayısı büyük ölçüde azaltılır.
  • Daha fazla doğrusal olmama durumu ortaya çıktı: Seri olarak bağlanmış kaç tane küçük evrişim çekirdeği aktivasyon sürecine karşılık gelirken, büyük bir evrişim çekirdeğinin sadece bir aktivasyon süreci vardır. Daha fazla doğrusal olmayan dönüşümlerin tanıtılması, modelin ifade yeteneğinin daha güçlü olacağı ve daha yüksek boyutlu dağılımlara uyabileceği anlamına gelir.
  • VGGNet yapısının C'de 1 × 1'in de kullanıldığını belirtmekte fayda var.

    1 × 1 evrişim çekirdeği. Bununla birlikte, burada bu evrişim çekirdeğinin kullanımı, boyutsallık artışını ve boyutsallık azaltmayı simüle etmek için Başlangıç gibi kanalları entegre etmek için kullanılmaz.Kanalların sayısı burada değiştirilmemiştir, dolayısıyla doğrusal olmayanlığın daha ileri bir girişi olarak anlaşılabilir.

    VGGNet'in ortaya çıkışı, CNN potansiyelinin sonsuz olduğunu ve ağ ne kadar derin olursa, sınıflandırma problemlerinde o kadar iyi performans gösterdiğini bilmemize izin verdi. Bak, 3 × 3

    3x3 evrişim çekirdeği en makul olanıdır.

    Dört, GoogLeNet

    GoogLeNet'in temel fikri, tüm tam bağlantıları ve hatta evrişimli yerel bağlantıları seyrek bağlantılarla değiştirmektir. Bu şekilde, ağ yapısının seyrekliği korunabilir ve yoğun matris hesaplamasının verimli yöntemi kullanılabilir. Çok sayıda çalışma, seyrek matrislerin hesaplama performansını iyileştirmek için daha yoğun alt matrisler halinde kümelenebileceğini göstermiştir ve Inception ortaya çıkmıştır. Başlangıç yapısı aşağıdaki gibidir:

    Buradaki seyreklik, evrişim işlemi sırasında çekirdeğin boyutunun resmin boyutundan çok daha küçük olduğu ve bir özellik haritasının yalnızca birkaç giriş birimine bağlı olduğu anlamına gelir; ve yoğun matris hesaplaması, Başlangıç modülündeki dört dalın görülebileceği anlamına gelir. İş nispeten seyrek bir bölümdür, ancak eklemeden sonra büyük, yoğun bir matris haline gelir. Bu temel modül 3 farklı evrişim çekirdeği kullanır, bu nedenle çıkarılan özellikler, özellik çeşitliliğini artıran hem makroskobik hem de mikroskobik özelliklere sahip 3 farklı ölçek olmalıdır. Havuzlama katmanı, daha ilkel girdi bilgilerini tutar. Modülün çıkışında, çıkarılan çeşitli özellikler, çok ölçekli özellikler elde etmek için kanal boyutuna eklenir.

    GoogleNet, yukarıdaki modülleri biriktirir ve tüm GoogleNet ağ yapısı aşağıdaki gibidir:

    Ek olarak, aşağıda gösterildiği gibi Inception'ın yükseltilmiş bir sürümü vardır:

    • Başlangıç v2 ve v3

    • Başlangıç-v4 Başlangıç-ResNet-v2

    Fiyat insanlara çok yakın! Kingston HyperX Stinger profesyonel oyun kulaklığı kutudan çıkar çıkmaz deneyim
    önceki
    Makine öğrenmiyor: Bilgisayar Görme Serisi (3) ResNet ve DenseNet
    Sonraki
    Üst düzey modellerle dolu, sevenler için seçim! V-MODA Bluetooth kulaklık ekranı
    Hissi ve değeri birinci sınıftır! Red Fire Bull Ghost Hand'in prizma mekanik klavyesi üzerine derin araştırma
    Makineler öğrenmez: Bilgisayar Görme Serisi (1) LeNet-5 ve AlexNet
    AMD zayıf değil, 2700 yuan 870K + RX460 oyun platformu ekranı
    Xiaomi yeni yılın ilk büyük etkinliğini duyurdu! Redmi yeni bağımsız bir marka oldu 48 milyon amiral gemisi burada
    Tek başına oyun oynamak daha iyidir, i36100 + GTX1050 konfigürasyon ekranı
    Makine şunları öğrenmiyor: LSTM / RNN'deki Dikkat mekanizmasını anlama
    Bugünün stadyum botlarının takdiri: George, PG2.5 giyiyor ve irfanını vuruyor
    Okuma: Milli antrenman takımının yapısı profesyonel lige tamamen güvenmiyor
    Makine öğrenmiyor: derin öğrenme sinir modülü ağı ve çıkarım öğrenme
    Makine öğrenmiyor: Varlık tanıma ve ilişki çıkarmada derin öğrenme uygulamasının analizi
    Her yerde ışıklar var, MSInın anakart hayali iyi bir ışık fabrikası olmak gibi görünüyor
    To Top