52 derin öğrenme hedef tespit modelinin bir özeti, tüm belgeler ve kaynak kodu ile birlikte

Kaynak: AI Youdao

Bu makale hakkında 2000 kelime , Okumanız tavsiye edilir 5 dakika

Bu makale, sizin için 52 derin öğrenme algılama modelini özetlemektedir.

Etiket: Computer Vision

Hedef tespiti, bilgisayar vizyonunun önemli bir dalıdır.Son yıllarda sinir ağı teorik araştırmalarının derinleşmesi ve donanım GPU hesaplama gücündeki önemli artış ile küresel yapay zeka araştırmalarında sıcak bir nokta haline geldi ve iniş projeleri de başladı.

2013'ten 2020'ye, en eski R-CNN ve OverFeat'ten sonraki SSD'ye, YOLO v3'e ve geçen yılın M2Det'ine kadar, sonsuz bir akışta yeni modeller ortaya çıkıyor ve performansları gittikçe daha iyi hale geliyor! Bu makale, 52 hedef tespit modelini ve bunların performans karşılaştırmalarını, literatür makalelerinin tam bir listesi dahil tam olarak özetleyecektir.

Önce doğrudan konuya gidin ve şu 52 hedef tespit modelini listeleyin (toplama önerilir):

Hedef tespiti için süper eksiksiz teknik rotanın bu özeti GitHub'daki iyi bilinen bir projeden geliyor. Yazar, Güney Kore Seoul Ulusal Üniversitesi Elektrik ve Bilgisayar Mühendisliği mezunu Lee Hooseong. 7.3 bin yıldız aldı.

Proje adresi:

https://github.com/hoya012/deep_learning_object_detection

Bu teknik rotanın zaman çizelgesi 2013'ten 2020'nin başına kadardır. Yukarıdaki şekil, bu dönemdeki tüm temsili hedef tespit modellerini özetlemektedir. Şekilde kırmızıyla işaretlenmiş parçalar, hakim olunması gereken görece önemli modellerdir.

Günlüğü güncelle

Red Stone'un bu projeyi geçen yılın başlarında herkese tavsiye ettiğini ve yazarın onu güncellediğini belirtmekte fayda var. Şubat 2020 itibarıyla yazarın ana güncellemeleri aşağıdaki gibidir:

  • 2019.2: 3 bildiriyi güncelleyin
  • 2019.3: Grafiği ve kod bağlantısını güncelleyin
  • 2019.4: ICLR 2019 ve CVPR 2019 belgelerini güncelleyin
  • 2019.5: CVPR 2019 belgesini güncelleyin
  • 2019.6: CVPR 2019 belgelerini ve veri kümesi belgelerini güncelleyin
  • 2019.7: BMVC 2019 belgelerini ve bazı ICCV 2019 belgelerini güncelleyin
  • 2019.9: NeurIPS 2019 belgesini ve ICCV 2019 belgesini güncelleyin
  • 2019.11: Bazı AAAI 2020 kağıtlarını ve diğer kağıtları güncelleyin
  • 2020.1: ICLR 2020 belgelerini ve diğer belgeleri güncelleyin

Aşağıda ayrıntılı giriş!

Model performans karşılaştırma tablosu

Farklı donanımlar nedeniyle (CPU, GPU, RAM vb.) FPS'yi karşılaştırmak genellikle yeterince doğru değildir. Daha uygun bir karşılaştırma yöntemi, tüm modellerin performansını aynı donanım konfigürasyonu altında ölçmektir. Yukarıdaki tüm modellerin performans karşılaştırma sonuçları aşağıdaki gibidir:

Yukarıdaki tablodan farklı modellerin VOC07, VOC12 ve COCO veri setlerindeki performansını net bir şekilde görebilirsiniz; aynı zamanda model kağıtlarının yayın kaynakları da listelenmiştir.

İşte kısa bir giriş için bazı önemli kırmızı modeller.

Model kağıtları

Yıl 2014

R-CNN

Doğru nesne algılama ve anlamsal bölümleme için zengin özellik hiyerarşileri |

kağıt:

https://arxiv.org/pdf/1311.2524.pdf

Resmi kod Caffe:

https://github.com/rbgirshick/rcnn

OverFeat

OverFeat: Evrişimli Ağları Kullanarak Tümleşik Tanıma, Yerelleştirme ve Algılama |

kağıt:

https://arxiv.org/pdf/1312.6229.pdf

Resmi kod Torch:

https://github.com/sermanet/OverFeat

2015

Hızlı R-CNN

Hızlı R-CNN |

kağıt:

https://arxiv.org/pdf/1504.08083.pdf

Resmi kod caffe:

https://github.com/rbgirshick/fast-rcnn

Daha hızlı R-CNN

Daha Hızlı R-CNN: Bölge Teklif Ağları ile Gerçek Zamanlı Nesne Algılamaya Doğru |

kağıt:

https://papers.nips.cc/paper/5638-faster-r-cnn-towards-real-time-object-detection-with-region-proposal-networks.pdf

Resmi kod caffe:

https://github.com/rbgirshick/py-faster-rcnn

Resmi olmayan kod tensorflow:

https://github.com/endernewton/tf-faster-rcnn

Resmi olmayan kod pytorch:

https://github.com/jwyang/faster-rcnn.pytorch

2016

OHEM

Çevrimiçi Sert Örnek Madencilikle Bölge Tabanlı Nesne Dedektörlerinin Eğitimi |

kağıt:

https://arxiv.org/pdf/1604.03540.pdf

Resmi kod caffe:

https://github.com/abhi2610/ohem

YOLO v1

Yalnızca Bir Kez Bakarsınız: Birleşik, Gerçek Zamanlı Nesne Algılama |

kağıt:

https://arxiv.org/pdf/1506.02640.pdf

Resmi kod c:

https://pjreddie.com/darknet/yolo/

SSD

SSD: Tek Atış Çoklu Kutu Dedektörü |

kağıt:

https://arxiv.org/pdf/1512.02325.pdf

Resmi kod caffe:

https://github.com/weiliu89/caffe/tree/ssd

Resmi olmayan kod tensorflow:

https://github.com/balancap/SSD-Tensorflow

Resmi olmayan kod pytorch:

https://github.com/amdegroot/ssd.pytorch

R-FCN

R-FCN: Bölge Tabanlı Tam Evrişimli Ağlar Üzerinden Nesne Algılama |

kağıt:

https://arxiv.org/pdf/1605.06409.pdf

Resmi kod caffe:

https://github.com/daijifeng001/R-FCN

Resmi olmayan kod caffe:

https://github.com/YuwenXiong/py-R-FCN

2017

YOLO v2

YOLO9000: Daha İyi, Daha Hızlı, Daha Güçlü |

kağıt:

https://arxiv.org/pdf/1612.08242.pdf

Resmi kod c:

https://pjreddie.com/darknet/yolo/

Resmi olmayan kod caffe:

https://github.com/quhezheng/caffe_yolo_v2

Resmi olmayan kod tensorflow:

https://github.com/nilboy/tensorflow-yolo

Resmi olmayan kod tensorflow:

https://github.com/sualab/object-detection-yolov2

Resmi olmayan kod pytorch:

https://github.com/longcw/yolo2-pytorch

FPN

Nesne Algılama için Özellik Piramit Ağları |

kağıt:

Resmi olmayan kod caffe:

https://github.com/unsky/FPN

RetinaNet

Yoğun Nesne Algılama için Odak Kaybı |

kağıt:

https://arxiv.org/pdf/1708.02002.pdf

Resmi kod kerasları:

https://github.com/fizyr/keras-retinanet

Resmi olmayan kod pytorch:

https://github.com/kuangliu/pytorch-retinanet

Resmi olmayan kod mxnet:

https://github.com/unsky/RetinaNet

Resmi olmayan kod tensorflow:

https://github.com/tensorflow/tpu/tree/master/models/official/retinanet

Maske R-CNN

Maske R-CNN |

kağıt:

Resmi kod caffe2:

https://github.com/facebookresearch/Detectron

Resmi olmayan kod tensorflow:

https://github.com/matterport/Mask_RCNN

Resmi olmayan kod tensorflow:

https://github.com/CharlesShang/FastMaskRCNN

Resmi olmayan kod pytorch:

https://github.com/multimodallearning/pytorch-mask-rcnn

2018 yıl

YOLO v3

YOLOv3: Artımlı Bir İyileştirme |

kağıt:

https://pjreddie.com/media/files/papers/YOLOv3.pdf

Resmi kod c:

https://pjreddie.com/darknet/yolo/

Resmi olmayan kod pytorch:

https://github.com/ayooshkathuria/pytorch-yolo-v3

Resmi olmayan kod pytorch:

https://github.com/eriklindernoren/PyTorch-YOLOv3

Resmi olmayan kod keras:

https://github.com/qqwweee/keras-yolo3

Resmi olmayan kod tensorflow:

https://github.com/mystic123/tensorflow-yolo-v3

RefineDet

Nesne Algılama için Tek Atışlı İyileştirme Sinir Ağı |

kağıt:

Resmi kod caffe:

https://github.com/sfzhang15/RefineDet

Resmi olmayan kod zincirleyicisi:

https://github.com/fukatani/RefineDet_chainer

Resmi olmayan kod pytorch:

https://github.com/lzx1413/PytorchSSD

2019 yıl

M2Det

M2Det: Çok Seviyeli Özellikli Piramit Ağına Dayalı Tek Atışlı Nesne Dedektörü |

kağıt:

https://arxiv.org/pdf/1811.04533.pdf

Resmi kod pytorch:

https://github.com/qijiezhao/M2Det

2020 yıl

Spiking-YOLO

Spiking-YOLO: Gerçek Zamanlı Nesne Algılama için Sinir Ağlarını Artırma |

kağıt:

https://arxiv.org/pdf/1903.06530.pdf

Veri seti belgeleri

Yazar aynı zamanda yukarıdaki modellerde yaygın olarak kullanılan genel veri setlerini de listeler: VOC, ILSVRC, COCO, aşağıdaki tabloda gösterildiği gibi:

Hedef tespiti için kullanılan veri seti ile ilgili makaleler aşağıdaki gibidir:

Yukarıdakiler 52 derin öğrenme algılama modelinin bir özetidir. Projenin kağıtlar ve kaynak kodu da dahil olmak üzere son yıllardaki hedef tespit modellerini çok iyi özetlediği söylenebilir. Yardımcı olmayı umuyorum!

Editör: Yu Tengkai

Redaksiyon: Lin Yilin

-Bitiş-

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.

Yüz tanıma güvenliği üçlü zorluklarla karşı karşıya
önceki
Çinli bir robot şirketinin Amerika Birleşik Devletleri'nde halka açılmasının zorluğu
Sonraki
Bir model 12 çeşit AI dolandırıcılığını yendi ve çeşitli GAN'lar ve Deepfake'ler öldürüldü
Derin öğrenme temelleri-aktivasyon işlevleri ve bunlar ne zaman kullanılmalı? (Kod ile)
Süper büyük sinir ağını öğrenen CPU, hash'e güvenerek V100 GPU'yu geçiyor mu?
100 GB veriyi 0,052 saniyede açmak? Bu Python açık kaynak kitaplığı veri analizi yapar
Kılavuz: Dengesiz sınıflandırma için maliyete duyarlı karar ağacı (kod bağlantısı ile)
Salgın altında, bu dijital ekonomi yolları tehlikede
"Birkaç vuruşta öğrenme" 2020 En İyi Konferans Bildirileri ve Kuralları
OpenKG ikinci partiyi yayınladı ve yeni taç bilgi grafiğinin yaklaşık on açık veri kümesini güncelledi
Tecrit koğuşundaki devriye robotu burada! Tsinghua halkı geriliyor
Kambriyen sprint AI çipi bilim ve teknoloji kurulunun ilk paylaşımı: Çin Bilimler Akademisi'nin kuluçka dönemi, 4 yılda 17,5 milyar değerleme
Bilmeniz Gereken Salgın Engelleme Silahları-İnternet Tıp
"Savaş" salgını "sırasında yüz yüze bir röportaj devam ediyor ve dünyayı Wuhan'a yaklaştırıyor
To Top