12 Ekim'de, SenseTime resmi olarak açık kaynaklı mmdetection (https://github.com/open-mmlab/mmdetection) ve mmcv (https://github.com/open-mmlab/mmcv) iki proje.
Mm algılama algılama kitaplığının, COCO yarışmasında (Algılama 2018 kazanan) SenseTime kod tabanı yeniden yapılandırmasına dayandığı bildirildi. Bu açık kaynak kitaplığı, herkese açık olarak yayınlanan çeşitli temel görsel algılama modülleri sağlar.Bu modüllerin kombinasyonu sayesinde, her birini hızlı bir şekilde oluşturabilirsiniz. İyi bilinen bir algılama çerçevesi. Açık kaynak kütüphanesi ve Hong Kong Çin Üniversitesi'nin yazarlarından Chen Kai'ye göre, bu sürüm RPN, Fast R-CNN, Faster R-CNN, Mask R-CNN'yi uyguladı ve yakın gelecekte RetinaNet ve Cascade R-CNN'i yayınlamayı planlıyor.
mmcv, temel olarak iki bölüme ayrılmış temel bir kitaplıktır, bir bölüm IO / Image / Video ile ilgili bazı işlemler gibi derin öğrenme çerçevesiyle ilgisi olmayan bazı araç işlevleridir, diğer bölüm PyTorch için yazılmış bir dizi eğitim aracıdır ve bu büyük ölçüde yapılabilir Tüm sürecin özelleştirilmesini kolaylaştırırken, kullanıcıların yazması gereken kod miktarını azaltın.
Kütüphane açık kaynaklı olduktan sonra, Zhihu'dan biri sorular sordu:
SenseTime'ın açık kaynaklı mm algılama algılama kitaplığı nasıl değerlendirilir? Mm-algılama, FAIR'in Detectron'ına kıyasla nasıldır?
Chen Kai de hemen cevap verdi ve mmdetection ve Detectron'un esas olarak aşağıdaki üç farka sahip olduğunu söyledi:
performans biraz daha yüksek
Eğitim hızı biraz daha hızlı
Daha az video belleği gerekir
Ayrıca, performans açısından, resmi PyTorch model hayvanat bahçesindeki ResNet yapısı ile Detectron tarafından kullanılan ResNet (omurga stil parametresi mmdetection olarak belirtilebilir) arasındaki küçük fark nedeniyle model yakınsama hızının farklı olduğunu açıkladı. Her iki yapıyla da deneyler yaptılar. Detectron ile aynı ön eğitim modelinin kullanılması durumunda, performans Detectron'unkinden biraz daha yüksektir.Eğitim için PyTorch'un resmi modelini kullanırken, 1x lr programın performansı Detectron'unkinden biraz daha düşüktür, ancak 2x durumunda daha yüksek.
Hız açısından, Mask R-CNN'nin farkı nispeten büyüktür ve diğer çerçevelerin farkı küçüktür. Aynı ayarla, Detectron yineleme başına 0,89 saniyeye ihtiyaç duyarken, mm algılaması yalnızca 0,69 saniyeye ihtiyaç duyar. Hızlı R-CNN, Detectron'dan biraz daha yavaş olan bir istisnadır. Ek olarak, sunucuda Detectron çalıştırmaları resmi rapordan yaklaşık% 20 daha yavaş olacak ve FB'nin Big Basin sunucusunun onlardan daha iyi performans gösterebileceğini belirtti.
Video belleği açısından, bu algılama kitaplığının belirgin avantajları vardır ve bu yaklaşık% 30 daha küçük olacaktır. Ancak bunun çerçeveyle bir ilgisi olduğunu ve tamamen kod tabanı optimizasyonunun sonucu olmadığını söyledi. Onları şaşırtan bir sonuç, mevcut kod tabanı sürümünün ResNet-50'nin Mask R-CNN'sini çalıştırması ve her bir kartın (12 G) 4 görüntü tutabilmesi ve bellek tüketiminin COCO oyunundakinden çok daha az olmasıdır.
İş teklifleri
Eğitim Bilgileri
Ayrıca ziyaret etmek için URL'ye de tıklayabilirsiniz