Google MobileNet: mobil ve gömülü cihaz vizyon uygulama modeli, etki ana akım modelleri geride bırakıyor

Xinzhiyuan Derlemesi

Özet

Giriş

AlexNet, ILSVRC 2012'de Deep Convolutional Neural Networks ile ImageNet Challenge'ı kazandığından bu yana, Evrişimli Sinir Ağları (CNN) bilgisayarla görme uygulamalarında yaygın olarak kullanılmaktadır. Bu uygulamadaki genel eğilim, daha yüksek doğruluk elde etmek için daha derin ve daha karmaşık ağlar kullanmaktır. Bununla birlikte, modelin boyutu ve hızı dikkate alındığında, doğruluktaki artış, modeli daha verimli hale getirmeyebilir. Robotlar, sürücüsüz arabalar ve artırılmış gerçeklik gibi birçok gerçek dünya uygulamasında, sınırlı bilgi işlem gücüne sahip platformlarda tanıma görevlerinin gerçek zamanlı olarak gerçekleştirilmesi gerekir.

Bu yazıda, mobil ve gömülü cihaz görüntü uygulamalarının tasarım gereksinimlerine kolayca uyarlanabilen çok küçük, düşük gecikmeli bir model oluşturmak için verimli bir ağ mimarisi ve iki hiperparametreden oluşan bir set öneriyoruz.

Şekil 1: MobileNet modeli, verimli cihaz içi zeka elde etmek için çeşitli tanıma görevlerine uygulanabilir.

Deney

Bu bölümde öncelikle derinlemesine evrişimin etkisini araştırıyoruz ve katman sayısını azaltmak yerine ağ genişliğini azaltarak bir sıkıştırma modeli seçiyoruz. Ardından, çekme ağını iki hiperparametreye göre tartıyoruz: genişlik çarpanı ve çözünürlük çarpanı ve sonuçları bazı popüler modellerle karşılaştırıyoruz. Araştırmamız, MobileNet'in birçok farklı göreve uygulanabileceğini kanıtlıyor.

Model seçimi

İlk olarak, MobileNet'in derinlemesine ayrılabilir evrişimini ve tamamen evrişimli modelini karşılaştırdık.Tablo 4'te gösterildiği gibi, derinlemesine ayrılabilir evrişimin tam evrişimi ile karşılaştırıldığında, ImageNet'in ImageNet'teki doğruluğu yalnızca% 1 azalır, ancak Çoklu eklentileri ve parametreleri büyük ölçüde kaydedin. Tablo 5, hesaplamaların ve parametrelerin sayısı benzer olduğunda, daha sığ modelin küçük modele göre% 3 daha düşük doğruluğa sahip olduğunu göstermektedir.

Görev 1: Ayrıntılı tanıma

MobilNet'i, ayrıntılı tanıma için Stanford Dogs veri kümesinde eğitiyoruz. Sonuçlar Tablo 10'da gösterilmektedir ve MobileNet, hesaplama miktarını ve model boyutunu büyük ölçüde azaltırken sonuçlara ulaşmıştır.

Görev 2: Büyük ölçekli coğrafi konum

PlaNet'i aynı veriler üzerinde yeniden eğitmek için MobileNet mimarisini kullanıyoruz. Tablo 11'de gösterildiği gibi, PlaNet ile karşılaştırıldığında MobileNet versiyonu çok daha küçük bir ölçeğe ve daha düşük performansa sahiptir, ancak aynı zamanda Im2GPS'den daha iyidir.

Görev 3: Yüz özniteliklerinin çıkarılması

MobileNet için başka bir kullanım durumu, bilinmeyen veya karmaşık eğitim prosedürleri ile büyük sistemleri sıkıştırmaktır. Yüz nitelik sınıflandırması görevinde, MobileNet ile derin ağların bilgi aktarım teknolojisi olan distilasyon arasındaki sinerjiyi kanıtladık. 75 milyon hiperparametre ve 1,6 milyar Çoklu Ekleme ile büyük bir yüz öznitelik sınıflandırıcısını basitleştirmeye çalıştık. Sınıflandırıcı, YFCC100M'ye benzer çok öznitelikli bir veri kümesi üzerinde eğitilmiştir.

Bir yüz öznitelik sınıflandırıcısını çıkarmak için MobileNet mimarisini kullanıyoruz. Distilasyon, sınıflandırıcıyı manuel olarak etiketlemek yerine eğiterek daha büyük bir modelin çıktısını simüle eder, böylece büyük (muhtemelen sonsuz) etiketlenmemiş veri kümelerinden eğitilebilir. Damıtmanın ölçeklenebilirliğini ve MobileNet'in basitleştirilmiş parametreleştirmesini birleştiren terminal sistemi, Tablo 12'de gösterildiği gibi yalnızca düzenlileştirmeyi gerektirmez, aynı zamanda daha iyi performans da sergiler.

Görev 4: Nesne algılama

MobileNet, modern nesne algılama sistemlerinde etkili bir temel ağ olarak da kullanılabilir. 2016 COCO Challenge'da kazandığımız son çalışmaya dayanarak, COCO verileri üzerine eğitilmiş MobileNet tarafından nesne tespitinin sonuçlarını karşılaştırdık. Tablo 13, MobileNet, VGG ve Inception V2'nin Faster-RCNN ve SSD çerçevesinde karşılaştırılmasını listeler. Deneyde SSD, 300 giriş çözünürlüğünde (SSD 300) 300 ve 600 giriş çözünürlüğüne sahip Faster-RCNN (FasterRCNN 300, Faster-RCNN 600) ile karşılaştırıldı. İki çerçeve altında, MobileNet diğer iki ağ ile aynı sonuçları elde eder ve hesaplama karmaşıklığı ve model boyutu nispeten daha küçüktür.

Görev 5: Yüz Gömme

FaceNet modeli, mevcut son teknoloji yüz tanıma modelidir ve üçlü kaybına dayalı olarak yüz Gömme oluşturur. FaceNet modelini mobil cihazlarda oluşturmak için, eğitim verilerinde Facenet ve MobileNet çıktısının varyansını en aza indirerek eğitmek için damıtma kullanıyoruz. Tablo 14, çok küçük MobileNet modelinin sonuçlarını listeler.

sonuç olarak

Xinzhiyuan İşe Alım

Pozisyon: Hesap Yöneticisi

Yıllık maaş pozisyonu: 120.000-250.000 (Maaş + ikramiye)

İş yeri: Pekin-Haidian Bölgesi

Departman: Müşteri Departmanı

Rapor: Hesap Direktörü

Çalışma hayatı: 3 yıl

Dil: İngilizce + Mandarin

Eğitim gereksinimleri: tam zamanlı lisans eğitimi

iş tanımı:

  • Müşteri ihtiyaçlarını ve şirket marka konumlandırmasını doğru bir şekilde kavrayın, işbirliği planlarını planlayın ve yazın;

  • Aktif düşünme, yaratıcı, güçlü metin kontrol yeteneği, PPT kullanımında uzman, iyi görsel değerlendirme ve performans yeteneği, mükemmel PS yeteneği en iyisidir;

  • Hevesli ve neşeli, kişiler arası iletişimde iyi, iyi iletişim ve işbirliği becerileri ve ekip ruhu;

  • Mükemmel aktivite hazırlama ve uygulama yeteneği, baskıya ve uyarlanabilirliğe karşı güçlü direnç, yüksek yoğunluklu çalışmaya uyum;

  • 4A, bir halkla ilişkiler şirketinde çalışma deneyimi tercih edilir

  • Özellikle yapay zeka başta olmak üzere yüksek teknolojiye yoğun ilgi duyanlar için bonus puan.

  • İş sorumlulukları:

    Planın uygulanmasını sağlamak için amir tarafından atanan projenin ilerlemesine katılın, yönetin ve takip edin. İlgili politika ve sistemlerin uygulanmasında üst seviyeye formüle edin, katılın veya yardımcı olun. Şirkete düzenli olarak doğru pazar bilgileri ve müşteri bilgileri sağlayın, müşteri ihtiyaçlarını analiz edin, belirlenen şirketin kilit müşterileriyle ilişkilerini sürdürün ve yeni işler geliştirmek için aktif olarak fırsatlar arayın. Müşteri veritabanını oluşturun ve yönetin, ilgili bilgileri izleyin ve analiz edin.

    Başvuru e-postası: jobs@aiera.com.cn

    HR WeChat: 13552313024

    Xinzhiyuan, yüksek ideallere sahip insanları görüşmeye davet ediyor, daha fazla işe alım pozisyonu için lütfen tıklayın Xinzhiyuan İşe Alım Görünüm.

    Perakende sektörü hiçbir zaman büyük veri ve teknolojiden yoksun olmadı, eksik olan şey yeni perspektifler düşünmede bir devrimdir
    önceki
    Avustralya'nın altın rezervlerinin nerede olduğu konusunda şüphe var Yabancı basın, Çin'in kaç altın rezervi olduğunu ateşli bir şekilde tahmin ediyor?
    Sonraki
    Dünyanın en iyi on internet ünlü yeri yayınlandı ve bir numara ...?
    Artık giderek daha az manuel şanzımanlı araba olduğuna göre, neden çoğu insan hala manuel şanzıman lisansı alıyor?
    "Doğada gişe rekorları kıran" Çin, klasik bilgisayarları geride bırakan iki büyük buluş olan dünyanın ilk optik kuantum bilgisayarını inşa etti
    Sekiz büyük petrol ülkesi ABD dolarını gösterdi ve petro renminbi yeni bir koz haline gelebilir.Petro dolar daha hızlı düşecek mi?
    120.000 arabanın bir yılda ne kadara mal olacağını hesaplayın? Sahibi: Unutma, arabayı satmaya hazırlan
    "Beijing Katlanır" Hao Jingfang: Yapay Zeka diğer tarafta, biz buradayız
    Polis kendi "zehirlenmeyi önleyici toprak kokusu RAP" ı yarattı ve dinledikten sonra insanlar "zehirlendi" ...
    Renminbi yükseldi, yabancı medya: Renminbi'nin küresel önemi yükselmeye mahkum Rogers: lütfen daha fazlasını yapın
    Bana asla uyuşturucuya maruz kalmayacağına söz ver
    Sonbaharda aşık olunacak en iyi yerlerin envanterini okuduktan sonra gitmek istiyorum ...
    IFLYTEK Hu Yu: Dalgalanma etkisi akıllı dinamikleri tamamlar ve beyin-bilgisayar füzyonu bir Siyam bebeği gibi hisseder (Beijing Üniversitesi AI Sınıf No.10)
    Tüm sıcak stiller! Sekiz 100.000-200.000 sınıf Ulusal VI SUV önerilir, bu da tuğlaları hareket ettirmeyi daha güçlü hale getirir
    To Top