Alibaba iDST bu kez yaya algılama ve tanıma için dünya rekorunu kırdı

Leifeng.com AI Technology Review News, 8 Ocak'ta dünyanın yetkili makine görme algoritması sıralaması KITTI, Alibaba iDST, yaya algılama tek etkinliğini kazandı. Aynı zamanda, iyi bilinen yaya yeniden tanımlama veri seti Market1501'de, iDST'nin ilk vuruş oranı da% 96,17'ye çıkarak dünyada ilk sırada yer aldı.

iDST, KITTI Yaya Algılama Projesi Şampiyonu oldu

İDST'nin KITTI'deki yaya algılama projesinin veri çizimi

KITTI algoritma değerlendirme platformu, Almanya'daki Karlsruhe Teknoloji Enstitüsü ve Chicago'daki Toyota Teknoloji Enstitüsü tarafından ortaklaşa kurulmuştur. Şu anda otonom sürüş senaryolarında dünyanın en büyük bilgisayarla görme algoritması değerlendirme veri kümesidir. Hedefleri (motorlu taşıtlar, motorsuz araçlar) değerlendirmek için kullanılır. Araç ortamında algılama, hedef izleme ve yol bölümleme gibi bilgisayarla görme teknolojilerinin performansı.

Market1501 veri setinin görüntüleri, Tsinghua Üniversitesi'ndeki bir süpermarketin girişinde toplandı ve 5 yüksek çözünürlüklü kamera ve 1 düşük pikselli kamera ile çekildi. Şu anda veri seti, 19732 galeri resimleri ve 12936 eğitim resmini kapsayan 1501 kişiyi içermektedir. Tüm etiket kutuları DPM algılayıcısı tarafından oluşturulur.

Hatta bu yılın Mayıs ayında Ali iDST, araç algılama doğruluğunu% 90,46'ya çıkararak listede ilk sırada yer aldı. Aynı zorluk seviyesindeki en son verilerle, Ali iDST şimdi% 90.55'e yenilendi.

Leifeng.com AI Technology Review'a göre, araç algılamanın arkasındaki teknoloji bölgesel füzyon karar verme ve bağlama duyarlı çok görevli derin sinir ağlarına dayanmaktadır.Karmaşık senaryolarda araç algılama görevleri için kullanılır ve çoklu görünüm, çoklu duruş ve araç tıkanması gibi sorunları çözmeye odaklanır. . Ağ yapısı tasarımında, ters evrişim işleminin kullanılması, küçük hedeflerin geri çağırma oranını iyileştirir ve aynı zamanda, çok katmanlı özellikler, düşük seviyeli yerel bilgileri ve yüksek seviyeli anlambilimsel bilgiyi birleştirerek çerçeve konumlandırmanın doğruluğunu artırır. Eğitim sürecinde, GAN'daki (Üretken yüzleşme ağı) yüzleşme eğitim modu da referans olarak kullanılır. Ekip, bilgisayar vizyonu, TIP, ACM MM, vb. Gibi en iyi uluslararası dergilerde ve konferanslarda birçok makale yayınladı ve araştırma sonuçlarını paylaştı.

Yaya algılama teknolojisi şematiği

Yaya yeniden tanımlama teknolojisi şematiği

Yayaların tanınması ve algılanması ve araç algılamanın her ikisi de bilgisayar görüşünün araştırma içeriği olsa da, bunların ilgili zorlukları ve zorlukları biraz farklıdır. Yaya algılama, makinenin bir yaya olup olmadığını ve yayanın görüntü veya videodan nerede olduğunu belirleyebilmesini gerektirir; yaya yeniden tanıma, makinenin farklı kameralar altında belirli bir kişinin tüm görüntülerini tanımasını gerektirir.

Alibaba iDST dekan yardımcısı ve IEEE Üyesi Hua Xiansheng, kameralar tarafından yakalanan görüntülerin çoğunun şu anda yüzleri net göremediğini ve yayaların genel ve kısmi özellikleriyle tanımlanması gerektiğini söyledi. Bununla birlikte, gerçek durumlarda, tıkanma, aydınlatma, çekim açısı, çekim mesafesi ve kişinin duruşu gibi faktörlerden kaynaklanan parazitlerin yanı sıra kamera ekipmanındaki farklılıklar, yaya tanımlama ve algılama konusunda zorluklar getirecektir.

Raporlara göre, yaya algılama teknolojisi açısından, Alibaba iDST ekibi hedef büyüklük sınıflandırmasına dayalı kademeli bir ağ önerdi ve ilgilenilen bölgenin bağlamsal bilgisine tam anlamıyla yer verdi ve yaya algılama problemindeki hedefi çözmek için ağ özelliği çıkarma yeteneğini geliştirdi. Büyük boyut dalgalanmaları, tıkanma, deformasyon ve yanlış konumlandırma; aynı zamanda, çerçeve konumlandırma doğruluğunu optimize etmek için hedef konumlandırmada çapraz entropi düzenli kısıtlamaları kullanılır.

Yayaların yeniden tanımlanması açısından, ekip yalnızca yayaların küresel özelliklerini çıkarmak için en son derin öğrenme teknolojisini kullanmakla kalmıyor, aynı zamanda baş, gövde, uzuvlar ve nesneler gibi yerel ayrıntılı özellikleri elde etmek için bir süper çözünürlük modülü ve derin bir dikkat ağı öneriyor. Kaba taneli küresel özelliklerin ve ince taneli yerel özelliklerin yeni bir füzyon yöntemi önerildi, bu da yaya temsilinin tutarlılığını ve kamera sahneleri arasında yaya yeniden tanımlama doğruluğunu daha da geliştiriyor.

İki yaya algılama ve yaya tanıma teknolojisi, manzaralı alışveriş merkezlerinde yaya akışı tahmini, kişiselleştirilmiş kalabalık analizi, yaya trafiği güvenliği, sürücüsüz sürüş ve kayıp yaşlı ve çocukları bulma gibi uygulamalar dahil olmak üzere çok sayıda uygulama senaryosuna sahiptir. Şu anda, yukarıda belirtilen teknolojilerin tümü Alibaba Cloud ET şehir beynine entegre edilmiş ve uygulanmıştır.

Hua Xiansheng, "1960'lardaki aya iniş planının iletişim teknolojisi ve biyomühendislik teknolojisinin patlamasını beraberinde getirmesi gibi, kentsel beyin dünyanın en iyi bilimsel ve teknolojik yenilik platformu haline geldi ve benzeri görülmemiş sorunlar bilim insanlarını benzeri görülmemiş teknolojiler yaratmaya zorladı." Dedi. .

Leifeng.com'un AI Teknoloji İncelemesine göre, Alibaba Cloud ET City Brain, Hangzhou, Suzhou, Quzhou, Wuzhen ve diğer yerlere çoktan indi. Hangzhou Şehri Beyni, makine görme algoritmalarının yardımıyla,% 92 doğruluk oranıyla günde ortalama 500'den fazla olay alarmı ile trafik kazalarını doğru bir şekilde algılayabilir ve tespit edebilir.

Yunqi Topluluğu aracılığıyla ana resim

Özel röportaj Yu Hewei gece geç saatlerde topu izledi ve bağırdı: Messi, bir daha gol atamazsan bekle!
önceki
Mürekkep püskürtmeli yazıcıları yeniden tanımlayan Domino Ax serisi piyasaya sürüldü
Sonraki
Xiao Shenyang "Nehri Geçen Çeteler" de: Yönetmen aşçısı olmak istemiyorum, iyi bir oyuncu değil
Gerçek kablosuz spor kulaklığı çaylak - Audio-Technica ATH-SPORT7TW
Awan Tucao Yang Chaoyue, senden hoşlanmaya başlamak istiyorum
Arabanın ön dişlisi dokunuşa biraz sıkıcı, ne yapmalıyım?
Heroes Without Flags: "Battlefield 5" in ardındaki gerçek tarihi açığa çıkarma
21. Şangay Film Festivali açıldı, Jiang Wen geldi, Feng Xiaogang gelmedi, "Telefon 2" hala orada
Her zaman arabadaki koltuk başlığının rahatsız olduğunu hissediyorum, değiştirebilir miyim?
Sayfa nedir? Three Gorges Müzesi sizi eski insanların "Pec" hayatını görmeye götürür
He Bing ve Ma Yili, Beyaz Manolya tarafından imparator olarak ödüllendirildikten sonra, jüri şunları söyledi: Bu yılki çalışmaların işi iyi değil.
Lenovo, Google Daydream ve WorldSence teknolojisi ile donatılmış Mirage Solo hepsi bir arada VR'yi piyasaya sürdü | CES 2018
Bayan üniversite öğrencilerini kovalamaktan reddedilen iri adam, memleketine silahla girince öldürüldü.
20W + küresel akıllı teknoloji alıcıları sizinle buluştu ISHE Shenzhen Akıllı Ev Fuarı
To Top