Ali Dharma Akademisi'nin stajyerinin ilk çalışması: ilk kez 3D nesne algılamanın hem doğruluğunu hem de hızını elde etmek için

Aufei Tapınağı'ndan Kuru Ming Qubit Raporu | Genel Hesap QbitAI

En son haberler, Ali Dharma Akademisi'nde yeni araştırma ilerlemesi var, bu sefer Otonom sürüş 3D nesne algılama alanı .

Dharma Akademisi'nden araştırmacılar, evrensel, yüksek performanslı bir dedektör önerdi. Algılama hızı, otonom sürüş alanında yetkili veri seti KITTI BEV'de (kuş bakışı) 25FPS'ye ulaştı ve tek seferde listenin en üstünde yer aldı. Yarısından fazlası ve doğruluk diğer tek aşamalı dedektörlerden çok daha iyidir. İlk kez 3 boyutlu nesne algılama doğruluğuna ve hızına ulaşıldığı söylenebilir.

Dharma Enstitüsü'nün araştırma ekibi şunları söyledi: "Dedektör, otonom sürüş sisteminin temel bileşenlerinden biridir, ancak bu alanda yenilikler ve atılımlar eksiktir. Bu sefer, otomatik sürüş sistemini iyileştirmeye yardımcı olacak 3D algılama doğruluğu ve hız iyileştirmesi elde ettik. Emniyet."

Deneysel sonuçlara bakılırsa, açıkça iyi bir ilerleme kaydetmişlerdir ve araştırmayı tamamlayan asıl kişi (ilk çalışma) aynı zamanda Dharma Akademisi'nde bir stajyerdir.

Aynı zamanda, araştırma meslektaşları tarafından da kabul edildi ve bilgisayarla görme alanındaki en büyük konferans CVPR 2020'ye dahil edildi. Bunu nasıl yaptılar? Ali Dharma Akademisi tarafından sağlanan yorumu tek tek incelemek için kullanıyoruz.

Hem doğruluk hem de hız nasıl elde edilir?

Hepimizin bildiği gibi, sıradan 2D görüntü tanıma uygulamalarının aksine, otomatik sürüş sistemlerinin doğruluk ve hız için daha yüksek gereksinimleri vardır.Sadece çevreleyen ortamdaki nesneleri hızlı bir şekilde tanımlamakla kalmaz, aynı zamanda nesnenin üç boyutlu uzaydaki konumunu doğru bir şekilde bulması gerekir.

Yalnızca sensörlere ve algoritma modellerine güvenmek, genellikle görsel tanımanın doğruluğunu ve hızını dengeleyemez. Bu nedenle, dedektör, otonom sürüş sisteminin güvenliğini artırmak için önemli bir faktör haline gelir.

Yıllar süren araştırmalardan sonra, endüstrideki mevcut ana akım tek aşamalı dedektör algılama hızında çok iyidir, ancak algılama doğruluğu tatmin edici değildir.

Bodhidharma Enstitüsü'nün araştırmasının başlangıç noktası budur: her ikisine de sahip olmanın bir yolunu bulmak.

Ortaya koydukları fikir, iki aşamalı dedektördeki özelliklerin ince taneli karakterizasyonu fikrini tek aşamalı algılamaya aktarmaktır.

Modellerinde, dağıtım için kullanılan dedektör, çıkarım ağı, bir omurga ağı ve algılama kafalarından oluşur.

Omurga ağı, yüksek anlamsallıkla voksel özelliklerini çıkarmak için 3B seyrek ağ ile uygulanır. Algılama başlığı, voksel özelliklerini bir kuş bakışı görünümünde sıkıştırır ve 3B nesne çerçevesini tahmin etmek için üzerinde 2B tam evrişimli ağ çalıştırır.

Tek aşamalı dedektördeki voksel özelliklerini nokta seviyesi özelliklerine dönüştürmek ve belirli denetim sinyallerini uygulamak için eğitimde yardımcı bir ağ kullanırlar.

Uygulamada, evrişim özelliğindeki sıfır olmayan sinyali orijinal nokta bulutu uzayına eşlediler ve ardından evrişim özelliğinin nokta düzeyinde temsilini elde etmek için her noktada enterpolasyon yaptılar. Evrişim özelliği ayrıca algılama doğruluğunu iyileştirmek için yapı algılama yeteneğine sahiptir.

Model çıkarımı yaparken, yardımcı ağ, tek aşamalı dedektörün algılama verimliliğini sağlamak için hesaplamaya katılmaz (ayrılmaz).

Ek olarak, bir mühendislik iyileştirmesi de önerdiler: Tek aşamalı algılayıcıdaki "çerçeve güven uyuşmazlığı" sorununu çözmek için kullanılan Parçaya Duyarlı Çözgü (PSWarp).

Temel fikir, hizalanmış bir özellik haritası oluşturmak için, ilgili yerel hassas özellik haritasını oluşturulan örnekleme ızgarasıyla örneklemek için bir örnekleyici kullanmaktır. Nihayetinde güveni yansıtabilecek özellik haritası, K hizalı özellik haritalarının ortalamasıdır.

Tek aşamalı yöntem, iki aşamalı yöntemin doğruluğunu sağlayabilir

Ali Dharma Akademisi'nden araştırmacılar, yöntemin KITTI veri seti üzerindeki etkinliğini değerlendirdi. Aşağıdaki şekilde (PR Eğrisi), düz çizgi iki aşamalı yöntemdir ve kesikli çizgi tek aşamalı yöntemdir.

Bodhidharma Akademisi tarafından önerilen tek aşamalı yöntemin (siyah), iki aşamalı yöntemin elde edebileceği doğruluğu sağlayabileceği görülebilir.

Aşağıdaki resim, KITTI kuş bakışı (BEV) ve 3D test setindeki sonuçlarını göstermektedir.

Önerdikleri yöntemin ek hesaplama miktarını artırmadan 25FPS'lik bir algılama hızına ulaşabildiği ve aynı zamanda doğruluğu da koruyabildiği görülebilir. Spesifik tespit sonuçları aşağıdaki gibidir:

İkisi birlikte çalışıyor, ikisi de Dharma Akademisi'nde araştırma stajyerleri.

"Nokta Bulutundan Yapıya Duyarlı Tek Aşamalı 3D Nesne Algılama" başlıklı araştırma makalesi, Ali Dharma Enstitüsü ve Hong Kong Politeknik Üniversitesi'nden toplam 5 araştırmacıyı içeriyordu.

İlk yazar Chenhang He Ali Dharma Koleji'nde araştırma stajyeridir, Hong Kong Politeknik Üniversitesi'nde doktora yapmakta ve 2022'de mezun olması beklenmektedir.

Akıl hocası, Dharma Koleji'nde kıdemli araştırmacı, Hong Kong Politeknik Üniversitesi Bilgisayar Bölümü Başkanı Profesör ve IEEE Üyesi Zhang Lei'dir ve aynı zamanda bu çalışmanın ilgili yazarıdır.

Bir diğer ilk yazar Hui Zeng, Ali Dharma Akademisi'nde araştırma stajyeri ve aynı zamanda bu yıl mezun olması beklenen Zhang Lei'nin doktora öğrencisi.

Diğer yazarlar, Dharma Akademisi kıdemli araştırmacısı, IEEE Üyesi Hua Xiansheng ve Dharma Akademisi'nin kıdemli algoritma uzmanı Huang Jianqiang'dır.

- Bitiş -

Qubit QbitAI · Toutiao İmzalı

Bize dikkat edin ve en son teknolojideki en son gelişmeleri alın

Salgın, Baidu'nun yüz tanıma devrimini hızlandırıyor: maske takmak da doğru bir şekilde tanıyabilir
önceki
Başarısız olan ilk insansız kamyon şirketi: sahte yapay zeka ve gerçek emek, 150 milyonu finanse ediyor
Sonraki
Sesli ağız robotu Pompidou Merkezi'nde konuşlu, netizenler: Sanırım ilk bakışta çarpık
"Yalvarırım, makaleyi yazmayı bitirdikten sonra gönderemez misin" ICML hakemleri beklenmedik bir şekilde şikayet ettiler
Salgın, Baidu'nun yüz tanıma dönüşümünü hızlandırıyor: Maske takmak doğru bir şekilde tanımlayabilir ve hızlı bir şekilde çevrimiçi olabilir.
Tsinghua'nın kendi geliştirdiği derin öğrenme çerçevesi "Planlama" açık kaynaktır! Çoklu görev performansı PyTorch'u aşıyor
Yılda dört stratejik yükseltme, Baidu ne tür bir bulut yapmak isteyecek?
SenseTime'ın halka arz planını ertelediği söyleniyor: Yeni finansman için 1 milyar dolar aramak için özel sermayeye geçin
Ali Dharma Enstitüsü, otonom sürüşün teknik sorunlarını çözüyor: 3D nesne algılama doğruluğu ve hızı elde etme
Karpuz Konuşması | Nesnelerin İnterneti hakkında bir süredir konuşuluyor, neden anlamıyorsunuz?
NVIDIA Açık Sınıf | Geçiş öğrenimi araç seti tarafından oluşturulan motoru dağıtmak için TensorRT'yi kullanın
Turing Ödülü, Toy Story'nin yaratıcılarına gidiyor! Oscar kazananlar, grafik ustaları
80,000 yuan küçük SUV'daki "emektar"! Changan Ford Yibo'nun yandaki çocuğa nasıl dönüştüğünü görün
2025'te piyasaya sürülen Bentley elektrikli otomobil 2,5 saniye / dayanıklılık 560km hızlanıyor
To Top