`` Industry Hotspot '' SenseTime resmi olarak açık kaynaklı mmdetection ve mmcv

12 Ekim'de, SenseTime resmi olarak açık kaynaklı mmdetection (https://github.com/open-mmlab/mmdetection) ve mmcv (https://github.com/open-mmlab/mmcv) iki proje.

Mm algılama algılama kitaplığının, COCO yarışmasında (Algılama 2018 kazanan) SenseTime kod tabanı yeniden yapılandırmasına dayandığı bildirildi. Bu açık kaynak kitaplığı, herkese açık olarak yayınlanan çeşitli temel görsel algılama modülleri sağlar.Bu modüllerin kombinasyonu sayesinde, her birini hızlı bir şekilde oluşturabilirsiniz. İyi bilinen bir algılama çerçevesi. Açık kaynak kütüphanesi ve Hong Kong Çin Üniversitesi'nin yazarlarından Chen Kai'ye göre, bu sürüm RPN, Fast R-CNN, Faster R-CNN, Mask R-CNN'yi uyguladı ve yakın gelecekte RetinaNet ve Cascade R-CNN'i yayınlamayı planlıyor.

mmcv, temel olarak iki bölüme ayrılmış temel bir kitaplıktır, bir bölüm IO / Image / Video ile ilgili bazı işlemler gibi derin öğrenme çerçevesiyle ilgisi olmayan bazı araç işlevleridir, diğer bölüm PyTorch için yazılmış bir dizi eğitim aracıdır ve bu büyük ölçüde yapılabilir Tüm sürecin özelleştirilmesini kolaylaştırırken, kullanıcıların yazması gereken kod miktarını azaltın.

Kütüphane açık kaynaklı olduktan sonra, Zhihu'dan biri sorular sordu:

SenseTime'ın açık kaynaklı mm algılama algılama kitaplığı nasıl değerlendirilir? Mm-algılama, FAIR'in Detectron'ına kıyasla nasıldır?

Chen Kai de hemen cevap verdi ve mmdetection ve Detectron'un esas olarak aşağıdaki üç farka sahip olduğunu söyledi:

  • performans biraz daha yüksek

  • Eğitim hızı biraz daha hızlı

  • Daha az video belleği gerekir

  • Ayrıca, performans açısından, resmi PyTorch model hayvanat bahçesindeki ResNet yapısı ile Detectron tarafından kullanılan ResNet (omurga stil parametresi mmdetection olarak belirtilebilir) arasındaki küçük fark nedeniyle model yakınsama hızının farklı olduğunu açıkladı. Her iki yapıyla da deneyler yaptılar. Detectron ile aynı ön eğitim modelinin kullanılması durumunda, performans Detectron'unkinden biraz daha yüksektir.Eğitim için PyTorch'un resmi modelini kullanırken, 1x lr programın performansı Detectron'unkinden biraz daha düşüktür, ancak 2x durumunda daha yüksek.

    Hız açısından, Mask R-CNN'nin farkı nispeten büyüktür ve diğer çerçevelerin farkı küçüktür. Aynı ayarla, Detectron yineleme başına 0,89 saniyeye ihtiyaç duyarken, mm algılaması yalnızca 0,69 saniyeye ihtiyaç duyar. Hızlı R-CNN, Detectron'dan biraz daha yavaş olan bir istisnadır. Ek olarak, sunucuda Detectron çalıştırmaları resmi rapordan yaklaşık% 20 daha yavaş olacak ve FB'nin Big Basin sunucusunun onlardan daha iyi performans gösterebileceğini belirtti.

    Video belleği açısından, bu algılama kitaplığının belirgin avantajları vardır ve bu yaklaşık% 30 daha küçük olacaktır. Ancak bunun çerçeveyle bir ilgisi olduğunu ve tamamen kod tabanı optimizasyonunun sonucu olmadığını söyledi. Onları şaşırtan bir sonuç, mevcut kod tabanı sürümünün ResNet-50'nin Mask R-CNN'sini çalıştırması ve her bir kartın (12 G) 4 görüntü tutabilmesi ve bellek tüketiminin COCO oyunundakinden çok daha az olmasıdır.

    İş teklifleri

    Eğitim Bilgileri

    Ayrıca ziyaret etmek için URL'ye de tıklayabilirsiniz

    Geri sayımı azaltmak için yeni enerji araçları alırken bu 5 modeli kaçırmayın
    önceki
    Android Kernel'in UAF Güvenlik Açığı Sömürünü Keşfetme
    Sonraki
    Wanbaojun 560 neden iyi satıyor? Bir zamanlar tüketicileri sihirli arabaya çeken konfigürasyonlar nelerdir?
    Kapsül Ağına Dayalı Parmak Damar Tanıma Araştırması
    "The Legend of the Demon Cat" yayınlanmasının ilk gününde övgüler aldı ve izleyiciler "kafa derisinde karıncalanma noktasına kadar şok oldu"
    Hui Ang "sordu", "formül" parlak, C-seviyesi pazar, kimlerle dans edecek
    Guangdong Perakende Zinciri Derneği İcra Kurulu Başkanı: Teknoloji çok hızlı güncelleniyor ve tüketiciler perakende işletmelerin en büyük rakipleri
    Pascals Bet: Telefonunuzda sunucu düzeyinde bir 3D aksiyon RPG'si olun
    Dört IKEA ve IKEA ortak girişimi orta büyüklükteki aracın parlak bir geleceği var
    OpanAI, Dota AI oyununun ayrıntılarını duyurdu, kendi kendine eşleştirme, insanları geride bırakıyor
    Zotye SR9 gerçekten sivil bir Porsche mi?
    Çin'in akıllı üretim geliştirme yıllık raporu 2020 akıllı üretim pazarı 220 milyarı aşacak
    Wu Junru Chen Kexin, Chengdu'da "karşılıklı" olarak, kuzeydeki en "şaşırtıcı" komedi "Demon Bell" gülüyor
    Aksiyon: OPPO R17 Pro'nun lensi altında hiç uyumayan Las Vegas şehri
    To Top