En son haberler, Ali Dharma Akademisi'nde yeni araştırma ilerlemesi var, bu sefer Otonom sürüş 3D nesne algılama alanı .
Dharma Akademisi'nden araştırmacılar, evrensel, yüksek performanslı bir dedektör önerdiler. Algılama hızı, KITTI'nin havadan görünüm (BEV) veri setinde 25FPS'ye ulaştı, otonom sürüş alanındaki en önemli test setlerinden biri, en üst sırada yer alıyor ve bir anda ikinci sırada yer alıyor. Çözüme kıyasla yarıdan fazla azalmıştır ve doğruluğu diğer tek aşamalı dedektörlerden çok daha üstündür. İlk kez 3 boyutlu nesne algılama doğruluğuna ve hızına ulaşıldığı söylenebilir.
Dharma Enstitüsü'nün araştırma ekibi şunları söyledi: "Dedektör, otonom sürüş sisteminin temel bileşenlerinden biridir, ancak bu alanda yenilik ve ilerleme eksikliği olmuştur. Bu sefer, otomatik sürüş sistemini iyileştirmeye yardımcı olacak 3B inceleme yoğun okuma ve hız iyileştirmesi elde ettik. Emniyet."
Deneysel sonuçlara bakılırsa, açıkça iyi ilerleme kaydetmişlerdir ve çalışmayı tamamlayan asıl kişi (bir iş) aynı zamanda Dharma Akademisi'nden bir stajyerdir.
Aynı zamanda, araştırma meslektaşları tarafından da kabul edildi ve bilgisayarla görme alanındaki en büyük konferans CVPR 2020'ye dahil edildi. Bunu nasıl yaptılar? Ali Dharma Akademisi tarafından sağlanan yorumu tek tek incelemek için kullanıyoruz.
Hepimizin bildiği gibi, sıradan 2D görüntü tanıma uygulamalarının aksine, otomatik sürüş sistemlerinin doğruluk ve hız için daha yüksek gereksinimleri vardır.Sadece çevreleyen ortamdaki nesneleri hızlı bir şekilde tanımlamakla kalmaz, aynı zamanda nesnenin üç boyutlu uzaydaki konumunu doğru bir şekilde bulması gerekir.
Yalnızca sensörlere ve algoritma modellerine güvenmek, genellikle görsel tanımanın doğruluğunu ve hızını dengeleyemez. Bu nedenle, dedektör, otonom sürüş sisteminin güvenliğini artırmak için önemli bir faktör haline gelir.
Yıllar süren araştırmalardan sonra, endüstrideki mevcut ana akım tek aşamalı dedektör algılama hızında çok iyidir, ancak algılama doğruluğu tatmin edici değildir.
Bodhidharma Enstitüsü'nün araştırmasının başlangıç noktası budur: her ikisine de sahip olmanın bir yolunu bulmak.
Ortaya koydukları fikir, iki aşamalı dedektördeki özelliklerin ince taneli karakterizasyonu fikrini tek aşamalı algılamaya aktarmaktır.
Modellerinde, dağıtım için kullanılan dedektör, çıkarım ağı, bir omurga ağı ve algılama kafalarından oluşur.
Omurga ağı, yüksek anlamsallıkla voksel özelliklerini çıkarmak için 3B seyrek ağ ile uygulanır. Algılama başlığı, voksel özelliklerini bir kuş bakışı görünümünde sıkıştırır ve 3B nesne çerçevesini tahmin etmek için üzerinde 2B tam evrişimli ağ çalıştırır.
Tek aşamalı dedektördeki voksel özelliklerini nokta seviyesi özelliklerine dönüştürmek ve belirli denetim sinyallerini uygulamak için eğitimde yardımcı bir ağ kullanırlar.
Uygulamada, evrişim özelliğindeki sıfır olmayan sinyali orijinal nokta bulutu uzayına eşlediler ve ardından evrişim özelliğinin nokta düzeyinde temsilini elde etmek için her noktada enterpolasyon yaptılar. Evrişim özelliği ayrıca algılama doğruluğunu iyileştirmek için yapı algılama yeteneğine sahiptir.
Model çıkarımı yaparken, yardımcı ağ, tek aşamalı dedektörün algılama verimliliğini sağlamak için hesaplamaya katılmaz (ayrılmaz).
Ek olarak, bir mühendislik iyileştirmesi de önerdiler: Tek aşamalı algılayıcıdaki "çerçeve güven uyuşmazlığı" sorununu çözmek için kullanılan Parçaya Duyarlı Çözgü (PSWarp).
Temel fikir, hizalanmış bir özellik haritası oluşturmak için, ilgili yerel hassas özellik haritasını oluşturulan örnekleme ızgarasıyla örneklemek için bir örnekleyici kullanmaktır. Nihayetinde güveni yansıtabilecek özellik haritası, K hizalı özellik haritalarının ortalamasıdır.
Ali Dharma Akademisi'nden araştırmacılar, yöntemin KITTI veri seti üzerindeki etkinliğini değerlendirdi. Aşağıdaki şekilde (PR Eğrisi), düz çizgi iki aşamalı yöntemdir ve kesikli çizgi tek aşamalı yöntemdir.
Bodhidharma Akademisi tarafından önerilen tek aşamalı yöntemin (siyah), iki aşamalı yöntemin elde edebileceği doğruluğu sağlayabileceği görülebilir.
Aşağıdaki resim, KITTI kuş bakışı (BEV) ve 3D test setindeki sonuçlarını göstermektedir.
Önerdikleri yöntemin ek hesaplama miktarını artırmadan 25FPS'lik bir algılama hızına ulaşabildiği ve aynı zamanda doğruluğu da koruyabildiği görülebilir. Spesifik tespit sonuçları aşağıdaki gibidir:
"Nokta Bulutundan Yapıya Duyarlı Tek Aşamalı 3D Nesne Algılama" başlıklı araştırma makalesi, Ali Dharma Enstitüsü ve Hong Kong Politeknik Üniversitesi'nden toplam 5 araştırmacıyı içeriyordu.
İlk yazar Chenhang He Ali Dharma Koleji'nde araştırma stajyeridir, Hong Kong Politeknik Üniversitesi'nde doktora yapmakta ve 2022'de mezun olması beklenmektedir.
Akıl hocası, Dharma Koleji'nde kıdemli araştırmacı, Hong Kong Politeknik Üniversitesi Bilgisayar Bölümü Başkanı Profesör ve IEEE Üyesi Zhang Lei'dir ve aynı zamanda bu çalışmanın ilgili yazarıdır.
Bir diğer ilk yazar Hui Zeng, Ali Dharma Akademisi'nde araştırma stajyeri ve aynı zamanda bu yıl mezun olması beklenen Zhang Lei'nin doktora öğrencisi.
Diğer yazarlar, Dharma Akademisi kıdemli araştırmacısı, IEEE Üyesi Hua Xiansheng ve Dharma Akademisi'nin kıdemli algoritma uzmanı Huang Jianqiang'dır.
- Bitiş -
Qubit QbitAI · Toutiao İmzalı
Bize dikkat edin ve en son teknolojideki en son gelişmeleri alın