CNN güncellendi! Performans iyileştirme, bilgi işlem gücü yarıya indi ve tak ve çalıştır

Au Fei Tapınağı'ndan Anne Bian Ce

Qubit Üretildi | Genel Hesap QbitAI

Geleneksel evrişim işlemi geçmişte kalacak.

Facebook ve Singapur Ulusal Üniversitesi ortaklaşa yeni nesil alternatifler önerdi: OctConv (Octave Convolution), efekt şaşırtıcı ve kullanımı çok uygun.

OctConv, Convolutional Neural Network'ün (CNN) "kompresörü" gibidir. Geleneksel evrişimin yerini almak için kullanmak, bilgi işlem kaynaklarının tüketimini azaltırken etkiyi artırabilir.

Örneğin, geleneksel evrişimin yerini alan klasik bir görüntü tanıma algoritması için, ImageNet'teki tanıma doğruluğu% 1,2 oranında iyileştirilebilir ve aynı zamanda hesaplama gücünün yalnızca% 82'si ve depolama alanının% 91'i gereklidir.

Doğruluk için bu kadar yüksek bir gereksinim yoksa ve orijinal düzey karşılanırsa, yalnızca yarım Kayan noktalı hesaplama gücü yeterlidir.

Böyle bir gelişme elde etmek istiyorum, sinir ağının alt üst olmasından korkuyorum, değil mi?

Hiç gerek yok, OctConv Tak ve oyna , Orijinal ağ mimarisini değiştirmeye gerek yoktur, hiperparametreleri ayarlamaya gerek yoktur, bu nedenle eve gitmek kolaydır.

GAN'ın ana yaratıcısı Ian Goodfellow'u ve yapay zekayı büyük inek yapan da bu yeni nesil evrişimdir Bekleyemem , Sadece tavsiyeyi iletmekle kalmıyor, aynı zamanda ilerlemeye dikkat etmeye devam edeceğini ifade ediyor ve ardından herkese açık kaynak olduğunu söylemek için tweet atıyor.

OctConv, birçok netizen tarafından da tanındı. Goodfellow'un tweet'leri yalnızca 5 saat içinde 700 beğeni aldı ve netizenler "Mükemmel iş!"

Peki, OctConv nasıl bir peri ağıdır?

Hesaplama gücü , doğruluk oranı

İlk önce ne kadar etkili olduğuna bir bakalım.

Örneğin, klasik görüntü tanıma algoritması: ResNet-50, yeni evrişim işlemi ne gibi değişiklikler getirecek?

Yukarıdaki şekildeki pembe kesik çizgi, OctConv'un ResNet-50 üzerindeki farklı parametre yapılandırmalarının etkisidir. Soldan ikinci pembe nokta daha dengeli bir konfigürasyonu gösterir: orijinal versiyondan biraz daha yüksek doğruluk (en sağdaki siyah nokta), ancak gerekli kayan nokta hesaplama gücü orijinal versiyonun yalnızca yarısıdır.

ResNet-26 ve DenseNet kadar küçük, ResNet-200 kadar büyük, OctConv'un lütfu altında diğer kesikli hatlarla temsil edilen çeşitli görüntü tanıma ağlarının tümü, performans artışını ve hesaplama gücü talebindeki azalmayı yansıtır.

OctConv'un parametresini ayarlamak, performans iyileştirmesi ve hesaplama gücü tasarrufu arasında bir denge sağlayabilir.

OctConv, bilgi işlem gücü gereksinimlerini azaltırken, sinir ağı çıkarımı için gereken süreyi de kısaltabilir. Örneğin, ResNet-50'nin çıkarım süresi, parametresi arttıkça kademeli olarak kısalacaktır. Doğruluk değişmeden tutularak çıkarım süresi, orijinalin% 62'si olan 74 milisaniyeye düşürülebilir.

Araştırmacılar, büyük, orta ve küçük modeller için OctConv'un görüntü sınıflandırma yeteneklerini nasıl etkileyeceğini test ettiler.

Büyük ölçekli sinir ağı ResNet-152, OctConv'u yalnızca 22.2GFLOP hesaplama gücüyle kullandıktan sonra, İlk-1 sınıflandırma doğruluk oranı% 82.9'a ulaşabilir.

OctConv'un uygulama kapsamı görüntü tanıma ile sınırlı değildir.

İster 2D ister 3D CNN olsun, bu iyileştirme sağlanabilir. Makale, ImageNet üzerinde ResNet, ResNeXt, DenseNet, MobileNet, SE-Net vb. Gibi 2D CNN'nin görüntü sınıflandırma yeteneklerini test etmekle kalmadı, aynı zamanda OctConv'a geçtikten sonra C2D, I3D ve diğer video davranışı tanıma algoritmalarının performans değişikliklerini de test etti.

Evrişimi sıkıştırılmış görüntü gibi sıkıştırın

OctConv tarafından tasarruf edilen bilgi işlem gücü nereden geldi?

Sıradan evrişim işlemleri için, tüm giriş ve çıkış özellik haritaları aynı uzamsal çözünürlüğe sahiptir.

Aslında bir resim iki kısma ayrılabilir: kaba yapı (düşük frekanslı kısım) ve kenar detayı (yüksek frekans) Örneğin, bir penguen fotoğrafı iki bileşeni ayırabilir:

Penguenin tüy rengi benzer, arka plan rengi yavaş değişen kısmı düşük frekanslı bilgi olup, bilgi miktarı azdır; iki kürk renginin birleştiği kısımda ise penguenin vücut kenarının rengi büyük ölçüde değişmekte olup, yüksek frekans bilgisine aittir ve daha fazla bilgiye sahiptir.

Bu durumda, fazlalık alanı azaltmak için düşük frekanslı kısmı daha az bilgi ile tamamen sıkıştırabiliriz.

Benzer şekilde, evrişimli katmanın çıktı özellik haritası, çekilen fotoğrafla aynıdır, farklı frekans bilgilerinin bir karışımı olarak da değerlendirilebilir ve benzer işlemler gerçekleştirilir.

Araştırmacılar, resimlerin frekans ayrımı ve sıkıştırılmasından ilham alıyor. Oktav Evrişim Buradaki fikir, evrişimli ağ üzerinde benzer işlemleri gerçekleştirmek, düşük frekans bölümünü sıkıştırmak, yüksek ve düşük frekans parçalarının verilerini ayrı ayrı işlemek ve ikisi arasında bilgi alışverişi yapmak, böylece evrişim işleminin depolama ve hesaplama tüketimini azaltmaktır.

Yeni özellik sunumuna uyum sağlamak için makale, geleneksel evrişimi teşvik ediyor ve öneriyor OctConv . Oktav anlamına gelir Oktav , Müzikte oktavı düşürmek, frekansı yarıya indirmek demektir.

OctConv'daki düşük frekanslı parça tensörünün boyutu 0,5h × 0,5w'dir ve uzunluk ve genişlik, yüksek frekanslı parçanın tam olarak yarısıdır h × w, böylece saklama alanı ve tensörün hesaplama miktarından tasarruf edilir.

OctConv düşük frekanslı bilgileri sıkıştırsa da, aynı zamanda orijinal piksel alanındaki alıcı alanı etkin bir şekilde genişletir ve bu da tanıma performansını artırabilir.

Uygulama süreci

Yaygın evrişim yöntemi için, W k × k evrişim çekirdeğini temsil eder, X ve Y sırasıyla giriş ve çıkış tensörlerini temsil eder ve X ve Y arasındaki eşleme ilişkisi:

(p, q) X tensöründeki konum koordinatıdır, (i, j) alınan komşuların aralığını temsil eder.

OctConv'un amacı, tensörün düşük frekanslı ve yüksek frekanslı kısımlarını ayrı ayrı işlemek ve yüksek frekanslı ve düşük frekanslı bileşen özellik temsilleri arasında etkili iletişim sağlamaktır.

Evrişim çekirdeğini iki bileşene ayırıyoruz:

W =

Aynı zamanda yüksek ve alçak frekanslar arasında etkili iletişim gerçekleşir. Bu nedenle, çıktı tensörü de iki bileşene bölünecektir:

Y =

YH = YH H + YL H, YL = YL L + YH L

YA B, A'dan B'ye özellik eşlemesinden sonra güncellenmiş sonucu temsil eder. YH H ve YL L, frekanslar içindeki bilgi güncellemeleridir ve YL H ve YH L, frekanslar arasındaki bilgi güncellemeleridir.

Bu nedenle, YH sadece kendi bilgi işleme sürecini değil, aynı zamanda düşük frekanstan yüksek frekansa eşlemeyi de içerir.

Bu terimleri hesaplamak için, evrişim çekirdeğinin her bileşenini iki kısma ayırıyoruz: frekans içi ve frekans arası:

WH = WH H + WL H, WL = WL L + WH L

Tensör parametreleri daha görsel bir şekilde ifade edilebilir:

OctConv'un evrişim çekirdeği

Bu form biraz benzer Tam kare formül a ^ 2 + b ^ 2 + ab + ba , İki kare terim WH H, WL L, frekans içi tensördür ve iki çapraz terim, frekanslar arası tensördür WL H, WH L

OctConv'un evrişim çekirdeğinin "geçiş" süreci olan kırmızı ok, yüksek ve düşük frekanslar arasındaki bilgi alışverişini gösterir.

Çıkış tensörünün hesaplama yöntemi, önceki sıradan evrişim yöntemiyle aynıdır:

OctConv'da, oranı, yukarıda bahsedilen ayarlanabilir parametre olan ayarlanabilir bir parametredir. Tüm ağın iç katmanında, ilk katmanda in = out = , in = 0, out = ve son katmanda in = ve out = 0 olsun.

OctConv'un bir başka çok kullanışlı özelliği, düşük frekanslı özellik eşlemesinin geniş bir alıcı alana sahip olmasıdır. Sıradan evrişime kıyasla, alıcı alanı etkin bir şekilde 2 kat genişletir. Bu, her bir OctConv katmanının belirli bir mesafeden daha fazla bağlamsal bilgi yakalamasına yardımcı olacak ve tanıma performansını artırabilir.

Çin Bir

Bu makale, Facebook ve Singapur Ulusal Üniversitesi tarafından ortaklaşa tamamlandı.

Bunların arasında Yunpeng Chen, Haoqi Fang, Bing Xu, Zhicheng Yan, Yannis Kalantidis, Marcus Rohrbach ve diğerleri Facebook AI laboratuvarından.

Biri Çince adı Yunpeng Chen olan Yunpeng Chen, 2015 yılında Huazhong Bilim ve Teknoloji Üniversitesi'nden lisans derecesi ile mezun oldu ve geçen yıl Facebook'ta staj yapmaya başladı.

Chen Yunpeng şu anda Singapur Ulusal Üniversitesi'nde doktorası için okuyor. Yan Shuicheng ile Feng Jiashi İkisi de bu makalenin yazarıdır. Chen Yunpeng, bu yıl mezun olduktan sonra Facebook'ta araştırmacı olacak.

Önceki bir çalışma olarak Chen Yunpeng, CVPR, NeurIPS, ECCV ve IJCAI ve diğer önemli konferanslardan görsel kesişim alanında derin öğrenmeye odaklanan 4 makale aldı.

Yan Shuicheng, Singapur Ulusal Üniversitesi'nde kadrolu bir profesördür. Yan Shuicheng şu anda Yapay Zeka Enstitüsü'nün dekanı ve baş bilim adamı olan 360'ın başkan yardımcısıdır.

Ağırlıklı olarak bilgisayarla görme, makine öğrenimi ve multimedya analizi alanlarını araştırıyor, 500'e yakın akademik makale yayınladı ve 25.000'den fazla atıf aldı.Üç kez dünya çapında yüksek atıf alan bir bilim adamı seçildi. Şu anda, Yan Shuicheng birçok onur ve nimete sahip ve IEEE Üyesi, IAPR Üyesi ve ACM Üstün Bilim Adamı olarak adlandırıldı.

Feng Jiashi şu anda Singapur Ulusal Üniversitesi Elektronik ve Bilgisayar Mühendisliği Bölümü'nde yardımcı doçent ve Makine Öğrenimi ve Görme Laboratuvarı'nın başkanıdır.

Feng Jiashi, Çin Bilim ve Teknoloji Üniversitesi'nden mezun olduktan sonra Singapur Ulusal Üniversitesi'nde doktora eğitimi aldı ve ardından doktora sonrası araştırmalar için UC Berkeley Yapay Zeka Laboratuvarı'na gitti. Araştırma yönleri, görüntü tanıma, derin öğrenme ve büyük veri için sağlam makine öğrenimidir.

Portal

Kağıt adresi:

https://export.arxiv.org/abs/1904.05049

Bazı netizenler bu araştırmayı basitçe yeniden üretti:

https://github.com/terrychenism/OctaveConv

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzünde "işe alım" kelimesiyle yanıt verin.

Qubit QbitAI · Toutiao İmzalama Yazarı

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

LOL erkek modeli geciktirdi mi? IG oyuncusu Jackey, görünüşüyle en iyi yerli moda dergilerinin kapağında mı?
önceki
2018'de, Hong Kong ve Malezya, anakara oyuncuları erkekler ve kadınlar yarılarının ilk üçe hakim oldu! Yeni çağ geldi
Sonraki
Süper Lig tarihinde bir başka gösteri, AFC Şampiyonlar Ligi takımları yılın ikinci yarısında neredeyse dibe düşme eşiğinde.
Erişte hazırlayın! IG ekibi JKL, uluslararası üne sahip moda dergilerinde yer aldı ve LPL'deki ilk kişi oldu!
Kötü köpek sevimli köpek olur, yoldan geçen kız eş olur: Japon açık kaynak GAN eklentisi, nereye işaret etmek istersiniz?
Üç büyük küme düşme favorisi, Süper Lig küme düşme durumunu bozmak için tam bir zafer kazandı ve iki takımın şampiyonluk umutları resmen paramparça oldu.
Bu oyun sadece oyuncunun karaciğerini patlatmakla kalmaz, aynı zamanda oyuncunun IQ'sunu da test eder.Yanlış bir adım atarsanız sıfırdan başlamanız gerekir mi?
VS Code'un "Chromium" sürümü burada: güvenli, açık kaynak ve gizliliğinizi koruyun
23 ay sonra, Süper "00 sonrası" oyuncular nihayet başka bir büyük atılım yaptı
Oyunlar hayatları değiştirir! Oyunun karakterlerinden ilham alan oyuncular, hayatta büyük bir karşı saldırı gerçekleştirmek için çok çalışıyor!
2017 China Runner Büyük Veri Raporu, düşündüğünüzden tamamen farklı!
IBM'in yapay zeka tıbbi tedavisi çıkmaza girdi: Bengio bile tıbbi sorunları çözmek için NLP'yi kullanma konusunda iyimser değil
5 yıl içinde serseri olmaktan çıkıp en sıcak oyunun yaratıcısına dönüştü! Şimdi yeni işler geliştirilecek!
Boston Dynamics ekranı on yıl boyunca karşılaştırıyor, netizenler: Gelecekte sonlandırıcı olacak mı?
To Top