27 Ekim - 2 Kasım tarihleri arasında, ICCV 2019 Çalıştayı, Yuncong Teknoloji Araştırma Enstitüsü ve Çin Bilimler Akademisi Bilgi Mühendisliği Enstitüsü Ge Shiming araştırma ekibi tarafından düzenlenen Vision Drone: A Challenge (VisDrone 2019) ile 27 Ekim - 2 Kasım tarihleri arasında "Ortak Araştırma Ekibi"), Task3 "Tek Nesne İzleme Yarışması (Tek Nesne İzleme, SOT)" şampiyonasını kazandı.
VisDrone2019 Mücadelesi
ICCV 2019 Uluslararası Bilgisayarlı Görü Konferansı, IEEE'nin ev sahipliğinde olup, Bilgisayar Görme Örüntü Tanıma Konferansı (CVPR) ve Avrupa Bilgisayarlı Görü Konferansı (ECCV) ile birlikte bilgisayarla görme yönünde en iyi üç konferans olarak adlandırılır ve CCF Sınıf A konferansına aittir.
VisDrone 2019 (Drone Target Detection) Challenge, insansız hava araçlarıyla elde edilen görsel verilerden nesne algılama ve izleme için kullanılacak.Çin Bilimler Akademisi, Tsinghua Üniversitesi ve Maryland dahil olmak üzere yurtiçi ve yurtdışından tanınmış üniversiteleri, bilimsel araştırma kurumlarını ve şirketleri cezbetmiştir. Üniversite, Urbana-Champaign'deki Illinois Üniversitesi, Yuncong Technology ve Samsung Research Institute dahil olmak üzere yaklaşık yüz ekip katıldı.
Bu meydan okuma dört görev içerir: Ortak araştırma ekibi "Görev 3: Tek Hedef İzleme Mücadelesi" ne katıldı.
VisDrone 2019 veri seti, Tianjin Üniversitesi Makine Öğrenimi ve Veri Madenciliği Laboratuvarının AISKYEYE ekibi tarafından toplandı.Tüm karşılaştırma veri setleri, toplam 261908 kare ve 10209 hareketsiz görüntü dahil olmak üzere 288 video klibi dahil olmak üzere dronlar tarafından yakalandı.
Bu çerçeveler, yayalar, arabalar, bisikletler ve üç tekerlekli bisikletler gibi 2,6 milyondan fazla yaygın olarak kullanılan hedef için manuel olarak etiketlenmiş çerçevelerden oluşur. Katılan ekiplerin verileri daha etkin kullanmasına olanak sağlamak için veri kümesi ayrıca sahne görünürlüğü, nesne kategorisi ve kapanma gibi önemli özellikler de sağlar.
Dolayısıyla bu yarışmada pek çok zorluk var. "Görev 3: Tek Hedef İzleme Zorluğu" nda, ortak araştırma ekibi yalnızca eğitim seti, doğrulama seti ve test seti gibi büyük miktarda veriyle uğraşmakla kalmaz, aynı zamanda verilerdeki düşük çözünürlük, uzun vadeli tıkanma ve kamera hareket bulanıklığı gibi zorlukların da üstesinden gelir.
Görev 3: Tek hedef izleme zorluğu
Tedavi planı
Tekrarlanan eğitim ve testlerden sonra, ortak araştırma ekibi nihayet gelişmiş bir doğru hedef durum tahmin algoritması önerdi: ED-ATOM. Yöntem iki modül içerir: hedef tahmini ve nesne sınıflandırması.
Bunların arasında, hedef tahmin modülü, ön eğitim için IOU tahmin ağı, ResNet-18 ağı ve ImageNet gibi veri setlerini kullanır.Aynı zamanda, orijinal verileri işlemek için düşük ışıklı görüntü geliştirme algoritmalarını kullanır. Modelin çevrimdışı ince ayarını yaptıktan sonra, izleme durumuna dayalı çevrimiçi arama stratejisi geliştirilir. Harika.
Nesne sınıflandırma modülü, sınıflandırma modelinin genelleştirilmesini kolaylaştırmak için çevrimiçi veri genişletme gerçekleştirmek için veri geliştirme yöntemlerini kullanır. Aynı zamanda, izleme durumuna dayalı etkili bir arama stratejisi sağlamlığı artırır.
Sonunda, IE (görüntü geliştirme), ED (gelişmiş verilerle eğitilmiş IOU tahmin ağı), DA (çevrimiçi veri geliştirme) ve LT (uzun vadeli izleme) yöntemlerini birleştiren ED-ATOM algoritması en iyi sonuçları elde etti.
ED-ATOM algoritması, karanlık parça izleme eğitimini uygulamak için düşük ışıkta görüntü iyileştirme yöntemini kullanır ve farklı test yöntemleri aracılığıyla en iyi çözümü belirler;
Hedef görünüm değiştiğinde çevirme, çevirme, yakınlaştırma, yakınlaşma, döndürme ve bulanıklaştırma gibi geliştirme yöntemleri aracılığıyla izleme uyarlanabilirliğini geliştirmek için veri genişletme şemasını kullanın;
Ciddi görüş dışı ve tamamen tıkanmış izleme durumları karşısında, uzun vadeli izleme şemalarının kullanılması, alanları uyarlamalı olarak arayabilir ve izleme sağlamlığını artırabilir.
ED-ATOM algoritması sayesinde, hedefi kilitleme ve eylemleri tahmin etmenin etkilerini elde etmek için düşük çözünürlüklü, uzun süreli kapanma, kamera hareketi / hareket bulanıklığı vb. Altında etkili görselleştirme sağlanabilir.
Skoru takip et
Yuncong Technology'nin yapay zeka alanında akıllı bir hizmet şirketi olarak 1000'den fazla Ar-Ge personeli ile Guangzhou, Chongqing, Şangay, Suzhou, Chengdu ve diğer yerlerde Ar-Ge merkezleri kurduğu ve temel teknoloji ürünü Ar-Ge yetenekleri sağladığı anlaşılmaktadır. Aynı zamanda, en son teknoloji araştırma ve geliştirme yeteneklerinde ustalaşmak için üniversiteler ve araştırma enstitüleriyle ortak laboratuvarlar kurmuştur.
Lei Feng.com AI geliştiricisi Lei Feng.com Lei Feng.com