g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

52 derin öğrenme hedef tespit modelinin bir özeti, tüm belgeler ve kaynak kodu ile birlikte

Kaynak: AI Youdao

Bu makale hakkında 2000 kelime , Okumanız tavsiye edilir 5 dakika

Bu makale, sizin için 52 derin öğrenme algılama modelini özetlemektedir.

Etiket: Computer Vision

Hedef tespiti, bilgisayar vizyonunun önemli bir dalıdır.Son yıllarda sinir ağı teorik araştırmalarının derinleşmesi ve donanım GPU hesaplama gücündeki önemli artış ile küresel yapay zeka araştırmalarında sıcak bir nokta haline geldi ve iniş projeleri de başladı.

2013'ten 2020'ye, en eski R-CNN ve OverFeat'ten sonraki SSD'ye, YOLO v3'e ve geçen yılın M2Det'ine kadar, sonsuz bir akışta yeni modeller ortaya çıkıyor ve performansları gittikçe daha iyi hale geliyor! Bu makale, 52 hedef tespit modelini ve bunların performans karşılaştırmalarını, literatür makalelerinin tam bir listesi dahil tam olarak özetleyecektir.

Önce doğrudan konuya gidin ve şu 52 hedef tespit modelini listeleyin (toplama önerilir):

Hedef tespiti için süper eksiksiz teknik rotanın bu özeti GitHub'daki iyi bilinen bir projeden geliyor. Yazar, Güney Kore Seoul Ulusal Üniversitesi Elektrik ve Bilgisayar Mühendisliği mezunu Lee Hooseong. 7.3 bin yıldız aldı.

Proje adresi:

https://github.com/hoya012/deep_learning_object_detection

Bu teknik rotanın zaman çizelgesi 2013'ten 2020'nin başına kadardır. Yukarıdaki şekil, bu dönemdeki tüm temsili hedef tespit modellerini özetlemektedir. Şekilde kırmızıyla işaretlenmiş parçalar, hakim olunması gereken görece önemli modellerdir.

Günlüğü güncelle

Red Stone'un bu projeyi geçen yılın başlarında herkese tavsiye ettiğini ve yazarın onu güncellediğini belirtmekte fayda var. Şubat 2020 itibarıyla yazarın ana güncellemeleri aşağıdaki gibidir:

2019.2: 3 bildiriyi güncelleyin
2019.3: Grafiği ve kod bağlantısını güncelleyin
2019.4: ICLR 2019 ve CVPR 2019 belgelerini güncelleyin
2019.5: CVPR 2019 belgesini güncelleyin
2019.6: CVPR 2019 belgelerini ve veri kümesi belgelerini güncelleyin
2019.7: BMVC 2019 belgelerini ve bazı ICCV 2019 belgelerini güncelleyin
2019.9: NeurIPS 2019 belgesini ve ICCV 2019 belgesini güncelleyin
2019.11: Bazı AAAI 2020 kağıtlarını ve diğer kağıtları güncelleyin
2020.1: ICLR 2020 belgelerini ve diğer belgeleri güncelleyin

Aşağıda ayrıntılı giriş!

Model performans karşılaştırma tablosu

Farklı donanımlar nedeniyle (CPU, GPU, RAM vb.) FPS'yi karşılaştırmak genellikle yeterince doğru değildir. Daha uygun bir karşılaştırma yöntemi, tüm modellerin performansını aynı donanım konfigürasyonu altında ölçmektir. Yukarıdaki tüm modellerin performans karşılaştırma sonuçları aşağıdaki gibidir:

Yukarıdaki tablodan farklı modellerin VOC07, VOC12 ve COCO veri setlerindeki performansını net bir şekilde görebilirsiniz; aynı zamanda model kağıtlarının yayın kaynakları da listelenmiştir.

İşte kısa bir giriş için bazı önemli kırmızı modeller.

Model kağıtları

Yıl 2014

R-CNN

Doğru nesne algılama ve anlamsal bölümleme için zengin özellik hiyerarşileri |

kağıt:

https://arxiv.org/pdf/1311.2524.pdf

Resmi kod Caffe:

https://github.com/rbgirshick/rcnn

OverFeat

OverFeat: Evrişimli Ağları Kullanarak Tümleşik Tanıma, Yerelleştirme ve Algılama |

kağıt:

https://arxiv.org/pdf/1312.6229.pdf

Resmi kod Torch:

https://github.com/sermanet/OverFeat

2015

Hızlı R-CNN

Hızlı R-CNN |

kağıt:

https://arxiv.org/pdf/1504.08083.pdf

Resmi kod caffe:

https://github.com/rbgirshick/fast-rcnn

Daha hızlı R-CNN

Daha Hızlı R-CNN: Bölge Teklif Ağları ile Gerçek Zamanlı Nesne Algılamaya Doğru |

kağıt:

https://papers.nips.cc/paper/5638-faster-r-cnn-towards-real-time-object-detection-with-region-proposal-networks.pdf

Resmi kod caffe:

https://github.com/rbgirshick/py-faster-rcnn

Resmi olmayan kod tensorflow:

https://github.com/endernewton/tf-faster-rcnn

Resmi olmayan kod pytorch:

https://github.com/jwyang/faster-rcnn.pytorch

2016

OHEM

Çevrimiçi Sert Örnek Madencilikle Bölge Tabanlı Nesne Dedektörlerinin Eğitimi |

kağıt:

https://arxiv.org/pdf/1604.03540.pdf

Resmi kod caffe:

https://github.com/abhi2610/ohem

YOLO v1

Yalnızca Bir Kez Bakarsınız: Birleşik, Gerçek Zamanlı Nesne Algılama |

kağıt:

https://arxiv.org/pdf/1506.02640.pdf

Resmi kod c:

https://pjreddie.com/darknet/yolo/

SSD

SSD: Tek Atış Çoklu Kutu Dedektörü |

kağıt:

https://arxiv.org/pdf/1512.02325.pdf

Resmi kod caffe:

https://github.com/weiliu89/caffe/tree/ssd

Resmi olmayan kod tensorflow:

https://github.com/balancap/SSD-Tensorflow

Resmi olmayan kod pytorch:

https://github.com/amdegroot/ssd.pytorch

R-FCN

R-FCN: Bölge Tabanlı Tam Evrişimli Ağlar Üzerinden Nesne Algılama |

kağıt:

https://arxiv.org/pdf/1605.06409.pdf

Resmi kod caffe:

https://github.com/daijifeng001/R-FCN

Resmi olmayan kod caffe:

https://github.com/YuwenXiong/py-R-FCN

2017

YOLO v2

YOLO9000: Daha İyi, Daha Hızlı, Daha Güçlü |

kağıt:

https://arxiv.org/pdf/1612.08242.pdf

Resmi kod c:

https://pjreddie.com/darknet/yolo/

Resmi olmayan kod caffe:

https://github.com/quhezheng/caffe_yolo_v2

Resmi olmayan kod tensorflow:

https://github.com/nilboy/tensorflow-yolo

Resmi olmayan kod tensorflow:

https://github.com/sualab/object-detection-yolov2

Resmi olmayan kod pytorch:

https://github.com/longcw/yolo2-pytorch

FPN

Nesne Algılama için Özellik Piramit Ağları |

kağıt:

Resmi olmayan kod caffe:

https://github.com/unsky/FPN

RetinaNet

Yoğun Nesne Algılama için Odak Kaybı |

kağıt:

https://arxiv.org/pdf/1708.02002.pdf

Resmi kod kerasları:

https://github.com/fizyr/keras-retinanet

Resmi olmayan kod pytorch:

https://github.com/kuangliu/pytorch-retinanet

Resmi olmayan kod mxnet:

https://github.com/unsky/RetinaNet

Resmi olmayan kod tensorflow:

https://github.com/tensorflow/tpu/tree/master/models/official/retinanet

Maske R-CNN

Maske R-CNN |

kağıt:

Resmi kod caffe2:

https://github.com/facebookresearch/Detectron

Resmi olmayan kod tensorflow:

https://github.com/matterport/Mask_RCNN

Resmi olmayan kod tensorflow:

https://github.com/CharlesShang/FastMaskRCNN

Resmi olmayan kod pytorch:

https://github.com/multimodallearning/pytorch-mask-rcnn

2018 yıl

YOLO v3

YOLOv3: Artımlı Bir İyileştirme |

kağıt:

https://pjreddie.com/media/files/papers/YOLOv3.pdf

Resmi kod c:

https://pjreddie.com/darknet/yolo/

Resmi olmayan kod pytorch:

https://github.com/ayooshkathuria/pytorch-yolo-v3

Resmi olmayan kod pytorch:

https://github.com/eriklindernoren/PyTorch-YOLOv3

Resmi olmayan kod keras:

https://github.com/qqwweee/keras-yolo3

Resmi olmayan kod tensorflow:

https://github.com/mystic123/tensorflow-yolo-v3

RefineDet

Nesne Algılama için Tek Atışlı İyileştirme Sinir Ağı |

kağıt:

Resmi kod caffe:

https://github.com/sfzhang15/RefineDet

Resmi olmayan kod zincirleyicisi:

https://github.com/fukatani/RefineDet_chainer

Resmi olmayan kod pytorch:

https://github.com/lzx1413/PytorchSSD

2019 yıl

M2Det

M2Det: Çok Seviyeli Özellikli Piramit Ağına Dayalı Tek Atışlı Nesne Dedektörü |

kağıt:

https://arxiv.org/pdf/1811.04533.pdf

Resmi kod pytorch:

https://github.com/qijiezhao/M2Det

2020 yıl

Spiking-YOLO

Spiking-YOLO: Gerçek Zamanlı Nesne Algılama için Sinir Ağlarını Artırma |

kağıt:

https://arxiv.org/pdf/1903.06530.pdf

Veri seti belgeleri

Yazar aynı zamanda yukarıdaki modellerde yaygın olarak kullanılan genel veri setlerini de listeler: VOC, ILSVRC, COCO, aşağıdaki tabloda gösterildiği gibi:

Hedef tespiti için kullanılan veri seti ile ilgili makaleler aşağıdaki gibidir:

Yukarıdakiler 52 derin öğrenme algılama modelinin bir özetidir. Projenin kağıtlar ve kaynak kodu da dahil olmak üzere son yıllardaki hedef tespit modellerini çok iyi özetlediği söylenebilir. Yardımcı olmayı umuyorum!

Editör: Yu Tengkai

Redaksiyon: Lin Yilin

-Bitiş-

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.

Yüz tanıma güvenliği üçlü zorluklarla karşı karşıya

Çinli bir robot şirketinin Amerika Birleşik Devletleri'nde halka açılmasının zorluğu