Xin Zhiyuan Rehberi Son zamanlarda, Nankai Üniversitesi, Oxford Üniversitesi ve Kaliforniya Merced Üniversitesi'nden araştırmacılar, hedef tespit görevleri için ortaklaşa yeni bir Res2Net modülü önerdiler.Yeni modül, hesaplama yükünü artırmadan diğer mevcut mükemmel modüllerle kolayca entegre edilebilir. Bu koşullar altında, ImageNet ve CIFAR-100 gibi veri kümelerindeki test performansı ResNet'i geçti.
2015'te He Yuming dahil dört Çinli tarafından önerildi ResNet Birinci Dünya Savaşı'nda ünlü olmak, sinir ağlarının eğitimini son derece hızlı bir şekilde hızlandırabilir.
Son zamanlarda Nankai Üniversitesi, Oxford Üniversitesi ve California Merced Üniversitesi'nden araştırmacılar ortaklaşa öneride bulundu Res2Net , Diğer mevcut mükemmel modüllerle kolayca entegre edilebilir: Hesaplama yükünü artırmadan, ImageNet, CIFAR-100 ve diğer veri setlerindeki test performansı ResNet'i aşıyor .
Temsili bilgisayar görme görevleri, yani hedef tespiti, sınıf aktivasyon haritalaması ve belirgin hedef tespiti üzerine daha fazla ablasyon araştırması ve deneysel sonuçlar, Res2Net'in önceki tekniğin temel yöntemine göre üstünlüğünü daha da doğrular.
Görme görevleri için çok ölçekli temsil, nesne algılama, anlamsal bölümleme ve belirgin nesne algılama görevleri için büyük önem taşır. Yeni CNN modülü Res2Net aracılığıyla, CNN omurgasına dayalı önceki mükemmel modellerden (ResNet, ResNeXt ve DLA gibi) daha iyi performans elde edebilir.
Özellikleri birden çok ölçekte temsil etmek, birçok görme görevi için çok önemlidir. Evrişimli sinir ağı (CNN) omurgasındaki en son gelişmeler, daha güçlü çok ölçekli temsil yetenekleri göstermeye devam ediyor, böylece geniş bir uygulama yelpazesinde tutarlı performans iyileştirmeleri elde ediyor. Ancak, mevcut yöntemlerin çoğu, çok ölçekli özellikleri katman bazında temsil eder.
Bu makalede, araştırmacılar tek bir artık blok içinde hiyerarşik artık sınıf bağlantıları inşa ediyor ve CNN için granüler seviyede çok ölçekli özellikleri temsil eden Res2Net adlı yeni bir bina modülü öneriyorlar. Ve her ağ katmanındaki alıcı alanların aralığını artırın.
Yukarıdaki şekilde, sol taraf CNN ağ mimarisinin temel yapısı ve sağ taraf bu makalede yeni önerilen Res2Net modülüdür. Yeni modül daha güçlü çok ölçekli özellik çıkarma yeteneklerine sahiptir, ancak hesaplama yükü sol mimariye benzer. Özellikle, yeni modül, filtre grubunu daha küçük bir 3x3 filtre ile değiştirir ve farklı filtre gruplarını hiyerarşik bir kalıntı stilde bağlayabilir. Modül içindeki bağlantı formu artık ağa (ResNet) benzer, bu nedenle Res2Net olarak adlandırılır.
Bu yazıda önerilen Res2Net modülü, ResNet, ResNeXt ve DLA gibi en gelişmiş omurga CNN modellerine entegre edilebilir. Araştırmacılar, Res2Net modülünü tüm bu modeller üzerinde değerlendirdiler ve yaygın olarak kullanılan veri setlerinde (CIFAR-100 ve ImageNet gibi) temel modele göre tutarlı performans iyileştirmeleri gösterdiler.
Bireysel Res2Net modülünün genel ağ yapısı için özel gereksinimleri olmadığından, Res2Net modülünün çok ölçekli temsil yeteneği de CNN hiyerarşik özellik toplama modelinden bağımsızdır, bu nedenle Res2Net modülü diğer mevcut mükemmel CNN modellerine kolayca entegre edilebilir içinde. ResNet, ResNeXt ve DLA vb. Entegre model Res2Net, Res2NeXt ve Res2Net-DLA olarak adlandırılabilir.
ImageNet veri seti test sonuçları
ImageNet veri setinin farklı ölçeklerinde Res2Net-50 test hata oranı sonuçları. W parametresi filtre genişliğidir ve s ölçektir
CIFAR-100 veri seti test sonuçları
Sonuç ve gelecekteki yön
Res2Net basit bir yapıya ve mükemmel bir performansa sahiptir.CNN'nin çok ölçekli temsil yeteneklerini daha ince bir seviyede daha da keşfedebilir. Res2Net yeni bir boyut, yani "Ölçek" ortaya koymaktadır. Mevcut derinlik, genişlik ve taban boyutlarına ek olarak, "ölçek" önemli ve daha etkili bir faktördür.
Res2Net modülü, mevcut en yeni modüllerle kolayca entegre edilebilir. CIFAR100 ve ImageNet kıyaslama testlerinin görüntü sınıflandırma sonuçları, Res2Net modülünü kullanan ağın ResNet, ResNeXt, DLA vb. Dahil rakiplerle rekabette her zaman daha iyi performans gösterdiğini göstermektedir.
Res2Net'in performans üstünlüğü, sınıf etkinleştirme haritalama, nesne algılama ve dikkat çekici nesne algılama dahil olmak üzere birçok temsili bilgisayar görüşü görevinde gösterilmiştir. Çok ölçekli temsil, gelecekte daha geniş bir uygulama yelpazesinin açılması için gereklidir.
Bu makalenin kaynak kodu, makale kabul edildikten sonra kamuya açıklanacaktır.
Kağıt bağlantısı:
https://arxiv.org/pdf/1904.01169.pd