Mask-RCNN'nin Ötesinde: Bu, Google'ın yapay zekasıdır, kendi yazdığım bir hedef tespit modeli

İçbükey tapınaktan kestane dişi

Qubit Üretildi | Genel Hesap QbitAI

Bu, AI tarafından doğan küçük bir AI'dır.

Google Brain Quoc Le Takım, ara ( NAS ) Ve birini buldum Nesne algılama modeli . Şöyle görünüyor:

onun Doğruluk ile hız Yaşlıları geride bıraktım Maske-RCNN ; Ayrıca diğer iki endüstri eliti olan FPN ve SSD'yi geride bıraktı.

Model denir NAS-FPN . Büyük patron Quoc Le, tamamen hayal gücünün ötesinde göründüğünü ve çok avangard olduğunu söyledi:

Bir gün iyi haber yayınlandı, 600 kalp hasat edildi

AI'nın beyinleri insanlardan gerçekten farklı. Aksine, geleneksel hedef tespit yöntemi FPN (Özellikli Piramit Ağı) şöyle görünür:

Google Brain, ağ mimarisi aramasına rağmen ( NAS ) Yeni değil ama kullanıyorlar Arama alanı Sıradışı.

Nasıl öğrenilir?

NAS-FPN'nin ortaya çıkmasından önce, gezegendeki en güçlü hedef tespit modeli ve mimarisi insanlar tarafından manuel olarak tasarlandı.

Bu, Mask-RCNN'nin sonucudur

NAS, otomatik bir parametre ayarlama yöntemidir.Eğitim hiperparametreleri değil, ağ mimarisi hiperparametreleridir: örneğin, ağda kaç katman vardır, her katmanda hangi operatörler vardır ve evrişimli katmandaki filtrelerin boyutu.

Pek çok farklı mimaride olabilir, hızlı En iyi performans gösteren birini bulun.

Bu nedenle, hedef tespitinin ortak mimarisi FPN (Özellik piramit ağı) ve NAS Birleştirin ve en güçlü yapay zekayı bulun.

Ancak sorun, arama alanının çok büyük olması ve özelliklerin birçok farklı ölçeğe yayılmasıdır.

Bu nedenle ekip, RetinaNet çerçevesine dayalı yeni bir arama alanı tasarladı:

Burada, bir FPN birçok "birleştirme biriminden ( Hücreleri Birleştirme ) "oluşmaktadır.

Girmek Farklı ölçek / çözünürlük Özellik katmanı, RetinaNet temsili ile birleştirilir.

Nasıl birleştirilir? Bu, dört adımdan sonra bir RNN kontrolörü tarafından belirlenir:

Biri , Girişten bir özellik katmanı seçin;

iki , Girişten başka bir özellik katmanı seçin;

Üç , Çıkış özelliği çözünürlüğünü seçin;

Dört , Bir ikili işlem seçin ve iki özellik katmanını birleştirin (önceki adımda seçilen çözünürlüğü kullanarak).

Dördüncü adım için iki seçenek vardır, biri toplam (toplam) ve diğeri Küresel Havuzlamadır. Her ikisi de herhangi bir ek eğitim parametresi olmayan basit ve verimli hesaplamalardır.

Bir Hücre bu şekilde birleştirilir, ancak bu yalnızca bir ara sonuçtur. Hemen şimdi giriş listesine ekleyin ve diğer özellik katmanlarıyla düzenleyin.

Ardından, çözünürlüğü değiştirmeden iki özellik katmanını yeniden seçebilir ve yukarıdaki 1, 2 ve 4. adımları tekrarlayabilirsiniz.

(Ekip, aynı çözünürlüğe sahip iki özellik katmanı seçmekten kaçınmak istiyorsanız, adım boyutu 8 kullanmamanız gerektiğini söyledi. 2 ve 4 daha uygun adım boyutlarıdır . )

Bu şekilde yeni Hücreler oluşturmaya devam edin.

Aramayı bıraktığınızda Sonda oluşturulan 5 hücre, "seçilen FPN" nin ilk çıkışını oluşturacak .

Öyleyse soru şu ki, arama ne zaman durabilir?

Hepsini aramanıza gerek yok, istediğiniz zaman çıkabilirsiniz. Her neyse, çözünürlük sabittir ve FPN isteğe bağlı olarak genişletilebilir.

Takım seti Erken Çıkış (Erken çıkış) mekanizması, hızı ve doğruluğu tartmak için kullanılır.

NAS-FPN'nin son sürümü, yapay zekanın 8.000 adım çalıştırmasının ardından son 5 Hücrenin oluşturduğu ağdır. Özet:

Orijinal FPN'den başlayarak (aşağıdaki Şekil a), gittiği yol kabaca şu şekildedir:

Ne kadar uzun süre çalışırsanız, ortaya çıkan ağ o kadar kıvrımlı olur.

Model nasıl?

NAS-FPN çeşitli çerçevelere güvenebilir: MobileNet, ResNet, AmoebaNet ...

Takım seçti AmoebaNet iskelet.

Ardından, yüksek çözünürlüklü büyük görüntü algılama efektini bu güçlü öncekilerle karşılaştırmak için COCO test geliştirme veri setini kullanın.

Yarışmanın sonuçları açıklandı:

NAS-FPN anladı 48.3 AP noktaları, Mask-RCNN'yi aşıyor , Ve zaman daha kısadır (sağdaki ikinci sütun zamandır).

Diğer bir oyun, MobileNet2 iskeleti üzerinde çalışan, NAS-FPN'nin hafif bir versiyonu olan hareket algılama (320x320):

YOLOv3'ü hala yakalayamamasına rağmen, önceki güçlü SSD hafif sürümünü geride bıraktı.

YOLOv3 geçmiş başarılar sergisi

Ancak, Mask-RCNN'yi yenmek, kutlanmaya değer bir başarıdır.

Bir şey daha

NAS çok güçlü olduğu için pek çok şeyi aramalıydı, değil mi?

Google Brain'in başka bir üyesi olan David Ha listelendi 7 çeşit :

1) CNN'ye dayalı görüntü sınıflandırıcı, 2) RNN, 3) Aktivasyon fonksiyonu, 4) SGD iyileştirici, 5) Veri büyütme, 6) Trafo, 7) Hedef Tespiti.

Ve doğrudan ruha bir soru yöneltti: bundan sonra ne aranacak?

En iyi cevabı meslektaşı aldı: NAS .

NAS

Tez Portalı:

https://arxiv.org/pdf/1904.07392.pdf

- Son - Saygılarımızla Qubits'i işe alıyoruz, editörler / muhabirler işe alıyoruz ve çalışma yerimiz Pekin, Zhongguancun'da. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzünde "işe alım" kelimesiyle yanıt verin. Qubit QbitAI · Toutiao İmzalama Yazarı ' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri izleme
İşe gitmek güzel bir şeye dönüşüyor
önceki
Tibet'e nasıl gideceğinizi bilmiyor musunuz? Tibet'e giden bu dört ana seyahat rotası sizi tatmin ediyor
Sonraki
Greater Körfez Bölgesi'ndeki "Kuluçka" İnovasyon Adası
HKUST iFlytek,% 53'ü devlet sübvansiyonu olan 2018'de günde 1.48 milyon yuan kazanan yıllık raporunu yayınladı
Ali Dabei Hattı boyunca yürüyün ve en sessiz gölü hissedin
Yeni nesil benzinli-elektrikli hibrit Odyssey (ODYSSEY) keskin ve hibrit, Şangay Otomobil Fuarı'nda çarpıcı bir görünüm sağlıyor.
Otonom Sichuan ve Tibet-Ranwu tarafından paylaşılması gereken bir yer
Kirliliği kontrol etmek için çiçekler, bitkiler ve ağaçlar
GitHub Wanxing'in Çin makine öğrenimi kaynakları: yol haritaları, videolar, öğrenme önerileri hepsi burada
Yeni önlemler, Sichuan-Tibet hattında çektiğiniz acıyı unutmanıza izin verin
Tibet'e ilk kez seyahat ettiğinizde bilmek isteyeceğiniz tüm sorular bu!
2019 cep telefonu markası kullanıcı portreleri yayınlandı.Erkek Xiaomi kadın OV gerçek mi?
PonyAI, insansız yolcu araçlarının tarihi "nehri geçen midilli" olan sürücüsüz yüke doğru yürüyor
Tibet'e giriş ve çıkış için çok ilginç bir güzergah planı tasarladık
To Top