Yüksek kare hızında insan pozu algılaması nasıl gerçekleştirilir?
Bu, bu yıl ECCV hakkında "Pose Proposal Networks" başlıklı bir makaledir. Yazarı, Konica Minolta, Japonya'dan Taiki SEKII'dir. Geçen yılın CVPR'si ile birlikte YOLO ve CMU'lar Açık Poz , yüksek kare hızlı videoda çok kişili poz algılamayı gerçekleştirebilen yeni bir yöntem yarattı.
NIPS 2017'nin AE (İlişkili yerleştirme), ICCV 2017'nin RMPE (Bölgesel çok kişili poz tahmini) ve CVPR 2017'nin PAF (parça yakınlık alanlarını kullanarak gerçek zamanlı çok kişili 2D poz tahmini) gibi diğer yöntemler, yüksek kareler elde edemez. Özellikle 100'den fazla kareye sahip videolar için poz algılama.
Google PersonLab'den daha yüksek kare hızında çalışabilen COCO veri kümesi için de geçerlidir.
Spesifik verilere bakıldığında, baş, omuz, dirsek ve genel üst vücut tanımada diğer yöntemleri geride bırakıyor ve toplam puan yanlış değil.
Ek olarak, bu yöntem, geleneksel duruş algılamanın çok hataya açık olduğu "duruşta" da önlenebilir.
Örneğin, gökyüzünden paraşütle atlamanın garip duruşu:
Aşırı kalabalık sahneler:
Ayrıca, üst üste binen iki kişinin görüntüsü.
Yoga matında sağda duran kadın ile önündeki kişinin tamamen ayrıldığını ve aşağıda yanlış kol ve bacaklarla ilgili şaka yapılmayacağını unutmayın.
Bu, çok kişili poz algılama için ResNet-18'e dayalı PPN sürecidir:
a) giriş görüntüsü;
b) girdi görüntüsünden kısmi sınırlayıcı kutuları algılamak;
c) uzuvların tespiti;
d) Resimdeki her bir kişiyi ayırt edin.
Bu makalenin yöntemi, önce görüntüyü daha küçük ızgaralara bölmek, her ızgara görüntüsü için tek bir nesne algılama örneği gerçekleştirmek için daha küçük ağı kullanmak ve ardından nesne algılama için bölge önerme çerçevesi yoluyla poz algılamayı yeniden tanımlamaktır.
Daha sonra, uzuvları doğrudan tespit etmek için tek çekim bir CNN kullanılır ve yeni bir olasılıksal açgözlü ayrıştırma adımı aracılığıyla poz önerileri oluşturulur.
Bölge önerisi bölümü, boyutu algılanan kişinin gövdesiyle orantılı olan ve yalnızca genel anahtar nokta açıklamaları kullanılarak denetlenebilen Sınırlayıcı Kutu Algılamaları olarak tanımlanır.
Tüm mimari, nispeten düşük çözünürlüklü özellik haritalarına sahip tek bir tam CNN'den oluşur ve poz algılama performansı için tasarlanmış bir kayıp işlevi kullanılarak doğrudan uçtan uca optimize edilir, bu mimariye denir Poz Teklif Ağı (PPN) . PPN, YOLO'nun avantajlarını ödünç alır.
kağıt:
Afiş:
Koda gelince, henüz elimde değil.
- Bitiş -
samimi işe alım
Qubit, Pekin, Zhongguancun'da çalışmak üzere editörler/muhabirler alıyor. Yetenekli ve hevesli öğrencilerimizin aramıza katılmasını dört gözle bekliyoruz! İlgili ayrıntılar için lütfen QbitAI genel hesap (QbitAI) diyalog arayüzündeki "işe alım" kelimesine yanıt verin.
kübit QbitAI · Toutiao imzalı yazar
'' Yapay zeka teknolojisi ve ürünlerindeki yeni gelişmeleri takip edin