Kaynak: AI Youdao
Bu makale hakkında 2000 kelime , Okumanız tavsiye edilir 5 dakika
Bu makale, sizin için 52 derin öğrenme algılama modelini özetlemektedir.Etiket: Computer Vision
Hedef tespiti, bilgisayar vizyonunun önemli bir dalıdır.Son yıllarda sinir ağı teorik araştırmalarının derinleşmesi ve donanım GPU hesaplama gücündeki önemli artış ile küresel yapay zeka araştırmalarında sıcak bir nokta haline geldi ve iniş projeleri de başladı.
2013'ten 2020'ye, en eski R-CNN ve OverFeat'ten sonraki SSD'ye, YOLO v3'e ve geçen yılın M2Det'ine kadar, sonsuz bir akışta yeni modeller ortaya çıkıyor ve performansları gittikçe daha iyi hale geliyor! Bu makale, 52 hedef tespit modelini ve bunların performans karşılaştırmalarını, literatür makalelerinin tam bir listesi dahil tam olarak özetleyecektir.
Önce doğrudan konuya gidin ve şu 52 hedef tespit modelini listeleyin (toplama önerilir):
Hedef tespiti için süper eksiksiz teknik rotanın bu özeti GitHub'daki iyi bilinen bir projeden geliyor. Yazar, Güney Kore Seoul Ulusal Üniversitesi Elektrik ve Bilgisayar Mühendisliği mezunu Lee Hooseong. 7.3 bin yıldız aldı.
Proje adresi:
https://github.com/hoya012/deep_learning_object_detection
Bu teknik rotanın zaman çizelgesi 2013'ten 2020'nin başına kadardır. Yukarıdaki şekil, bu dönemdeki tüm temsili hedef tespit modellerini özetlemektedir. Şekilde kırmızıyla işaretlenmiş parçalar, hakim olunması gereken görece önemli modellerdir.
Red Stone'un bu projeyi geçen yılın başlarında herkese tavsiye ettiğini ve yazarın onu güncellediğini belirtmekte fayda var. Şubat 2020 itibarıyla yazarın ana güncellemeleri aşağıdaki gibidir:
Aşağıda ayrıntılı giriş!
Farklı donanımlar nedeniyle (CPU, GPU, RAM vb.) FPS'yi karşılaştırmak genellikle yeterince doğru değildir. Daha uygun bir karşılaştırma yöntemi, tüm modellerin performansını aynı donanım konfigürasyonu altında ölçmektir. Yukarıdaki tüm modellerin performans karşılaştırma sonuçları aşağıdaki gibidir:
Yukarıdaki tablodan farklı modellerin VOC07, VOC12 ve COCO veri setlerindeki performansını net bir şekilde görebilirsiniz; aynı zamanda model kağıtlarının yayın kaynakları da listelenmiştir.
İşte kısa bir giriş için bazı önemli kırmızı modeller.
Yıl 2014
R-CNN
Doğru nesne algılama ve anlamsal bölümleme için zengin özellik hiyerarşileri |
kağıt:
https://arxiv.org/pdf/1311.2524.pdf
Resmi kod Caffe:
https://github.com/rbgirshick/rcnn
OverFeat
OverFeat: Evrişimli Ağları Kullanarak Tümleşik Tanıma, Yerelleştirme ve Algılama |
kağıt:
https://arxiv.org/pdf/1312.6229.pdf
Resmi kod Torch:
https://github.com/sermanet/OverFeat
2015
Hızlı R-CNN
Hızlı R-CNN |
kağıt:
https://arxiv.org/pdf/1504.08083.pdf
Resmi kod caffe:
https://github.com/rbgirshick/fast-rcnn
Daha hızlı R-CNN
Daha Hızlı R-CNN: Bölge Teklif Ağları ile Gerçek Zamanlı Nesne Algılamaya Doğru |
kağıt:
https://papers.nips.cc/paper/5638-faster-r-cnn-towards-real-time-object-detection-with-region-proposal-networks.pdf
Resmi kod caffe:
https://github.com/rbgirshick/py-faster-rcnn
Resmi olmayan kod tensorflow:
https://github.com/endernewton/tf-faster-rcnn
Resmi olmayan kod pytorch:
https://github.com/jwyang/faster-rcnn.pytorch
2016
OHEM
Çevrimiçi Sert Örnek Madencilikle Bölge Tabanlı Nesne Dedektörlerinin Eğitimi |
kağıt:
https://arxiv.org/pdf/1604.03540.pdf
Resmi kod caffe:
https://github.com/abhi2610/ohem
YOLO v1
Yalnızca Bir Kez Bakarsınız: Birleşik, Gerçek Zamanlı Nesne Algılama |
kağıt:
https://arxiv.org/pdf/1506.02640.pdf
Resmi kod c:
https://pjreddie.com/darknet/yolo/
SSD
SSD: Tek Atış Çoklu Kutu Dedektörü |
kağıt:
https://arxiv.org/pdf/1512.02325.pdf
Resmi kod caffe:
https://github.com/weiliu89/caffe/tree/ssd
Resmi olmayan kod tensorflow:
https://github.com/balancap/SSD-Tensorflow
Resmi olmayan kod pytorch:
https://github.com/amdegroot/ssd.pytorch
R-FCN
R-FCN: Bölge Tabanlı Tam Evrişimli Ağlar Üzerinden Nesne Algılama |
kağıt:
https://arxiv.org/pdf/1605.06409.pdf
Resmi kod caffe:
https://github.com/daijifeng001/R-FCN
Resmi olmayan kod caffe:
https://github.com/YuwenXiong/py-R-FCN
2017
YOLO v2
YOLO9000: Daha İyi, Daha Hızlı, Daha Güçlü |
kağıt:
https://arxiv.org/pdf/1612.08242.pdf
Resmi kod c:
https://pjreddie.com/darknet/yolo/
Resmi olmayan kod caffe:
https://github.com/quhezheng/caffe_yolo_v2
Resmi olmayan kod tensorflow:
https://github.com/nilboy/tensorflow-yolo
Resmi olmayan kod tensorflow:
https://github.com/sualab/object-detection-yolov2
Resmi olmayan kod pytorch:
https://github.com/longcw/yolo2-pytorch
FPN
Nesne Algılama için Özellik Piramit Ağları |
kağıt:
Resmi olmayan kod caffe:
https://github.com/unsky/FPN
RetinaNet
Yoğun Nesne Algılama için Odak Kaybı |
kağıt:
https://arxiv.org/pdf/1708.02002.pdf
Resmi kod kerasları:
https://github.com/fizyr/keras-retinanet
Resmi olmayan kod pytorch:
https://github.com/kuangliu/pytorch-retinanet
Resmi olmayan kod mxnet:
https://github.com/unsky/RetinaNet
Resmi olmayan kod tensorflow:
https://github.com/tensorflow/tpu/tree/master/models/official/retinanet
Maske R-CNN
Maske R-CNN |
kağıt:
Resmi kod caffe2:
https://github.com/facebookresearch/Detectron
Resmi olmayan kod tensorflow:
https://github.com/matterport/Mask_RCNN
Resmi olmayan kod tensorflow:
https://github.com/CharlesShang/FastMaskRCNN
Resmi olmayan kod pytorch:
https://github.com/multimodallearning/pytorch-mask-rcnn
2018 yıl
YOLO v3
YOLOv3: Artımlı Bir İyileştirme |
kağıt:
https://pjreddie.com/media/files/papers/YOLOv3.pdf
Resmi kod c:
https://pjreddie.com/darknet/yolo/
Resmi olmayan kod pytorch:
https://github.com/ayooshkathuria/pytorch-yolo-v3
Resmi olmayan kod pytorch:
https://github.com/eriklindernoren/PyTorch-YOLOv3
Resmi olmayan kod keras:
https://github.com/qqwweee/keras-yolo3
Resmi olmayan kod tensorflow:
https://github.com/mystic123/tensorflow-yolo-v3
RefineDet
Nesne Algılama için Tek Atışlı İyileştirme Sinir Ağı |
kağıt:
Resmi kod caffe:
https://github.com/sfzhang15/RefineDet
Resmi olmayan kod zincirleyicisi:
https://github.com/fukatani/RefineDet_chainer
Resmi olmayan kod pytorch:
https://github.com/lzx1413/PytorchSSD
2019 yıl
M2Det
M2Det: Çok Seviyeli Özellikli Piramit Ağına Dayalı Tek Atışlı Nesne Dedektörü |
kağıt:
https://arxiv.org/pdf/1811.04533.pdf
Resmi kod pytorch:
https://github.com/qijiezhao/M2Det
2020 yıl
Spiking-YOLO
Spiking-YOLO: Gerçek Zamanlı Nesne Algılama için Sinir Ağlarını Artırma |
kağıt:
https://arxiv.org/pdf/1903.06530.pdf
Yazar aynı zamanda yukarıdaki modellerde yaygın olarak kullanılan genel veri setlerini de listeler: VOC, ILSVRC, COCO, aşağıdaki tabloda gösterildiği gibi:
Hedef tespiti için kullanılan veri seti ile ilgili makaleler aşağıdaki gibidir:
Yukarıdakiler 52 derin öğrenme algılama modelinin bir özetidir. Projenin kağıtlar ve kaynak kodu da dahil olmak üzere son yıllardaki hedef tespit modellerini çok iyi özetlediği söylenebilir. Yardımcı olmayı umuyorum!
Editör: Yu Tengkai
Redaksiyon: Lin Yilin
-Bitiş-
Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.