CVPR 2018 atölyesini izledikten sonra, bilmediğim bir Lady Gaga olduğunu öğrendim

Leifeng.com AI Araştırma Enstitüsü'ne göre, CVPR 2018 yerel saatle 6.18-22'de ABD, Salt Lake City'de düzenlenecek. Şu anda, konferansın açılışına hala dört ay var. Konferansın organizatörü Bahar Festivali sırasında kabul edilen bildirilerin listesini açıkladığından, CVPR hakkında bir tartışma çılgınlığı çekti (ayrıntılar için lütfen CVPR 2018'de yer alan bildirilerin tam listesine bakın, çeşitli tanrılardan gelen iyi haberleri sessizce izleyin) . Kabul edilen bildirilerin tartışılması ve incelenmesine ek olarak, aslında kaçırılmaması gereken bir gündem var ve bu da çalıştaydaki çeşitli yarışmalar.

Konferansın resmi web sitesinden, bu yılki atölye çalışmasının kamuflaj yüz tanıma, düşük güçlü görüntü tanıma, görüntü sıkıştırma, sistem sağlamlığı analizi, otonom sürüş, yerleşik görme vb. Gibi birden fazla konuyu içerdiği görülebilir. Bu sorunlara yanıt olarak birçok ilginç oyun ortaya çıktı. Bu atölyelerdeki yarışmalar birçok büyük şirket tarafından desteklenmektedir veya son derece yenilikçi veya büyük pratik değere sahiptir.Görünümden sonra, Leifeng AI Araştırma Enstitüsü aşağıdaki yarışmaları herkese tanıtacaktır.

Aşağıdakiler son derece yenilikçi iki yarışmadır: Yüz tanıma yarışmasında ve büyük ölçekli dönüm noktası tanıma yarışmasında, organizatörler yeni bir büyük ölçekli halka açık veri seti sağlar.Sistemi, kılık değiştirmiş yıldızları ve manzaralı noktaları belirlemek için kullanabilirsiniz.

Yüz tanıma yarışmasını gizleyin

"Vahşi Doğada Gizlenmiş Yüzler Üzerine Birinci Uluslararası Çalıştay" çalıştayında, Maryland Üniversitesi, IBM ve Hindistan Uluslararası Bilgi Enstitüsü'nden (IIIT) birkaç organizatör, gizli bir yüz algılama yarışması başlattı.

Son yıllarda derin öğrenmenin ilerlemesiyle, otomatik yüz tanıma yeteneği önemli ölçüde geliştirildi. Bununla birlikte, kısıtlamasız bir ortamda, çok işbirlikçi olmayan kullanıcılarla karşılaşıldığında, doğru yüz tanıma gerçekleştirmek hala çok zordur.

Halihazırda, duruş, ifade, ışık, yaşlanma ve düşük çözünürlük gibi çeşitli faktörler üzerine pek çok araştırma yapılmaktadır, ancak "kamuflaj" yüz tanımada çözülmesi hala zor bir problemdir.

Aşağıdaki şekilde gösterildiği gibi, kılık değiştirme, kendi kimliğinizi karıştırmak veya başkalarının kimliğini taklit etmek için yüzünüzde kasıtlı ve kasıtsız değişiklikler içerir. Lady Gaga ve Neil Patrick Haris kim olduğunu tahmin edebilir misiniz?

Kamuflaj her ortamda gerçekleşebilir, bu nedenle bu sorunu belirlemek daha zor olacaktır. Ek olarak, mevcut veri seti olmadığı için, insanlar gerçek senaryolarda kapsamlı bir kamuflaj çalışması yapmamışlardır.

Mevcut duruma cevaben, organizatör bu kılık değiştirmiş yüz tanıma yarışmasını bu seminerde düzenledi.Katılımcılardan, doğal çevre veri tabanında gizlenmiş yüzü tanıdıklarını göstermeleri istenecek. Mükemmel algoritma grupları makale göndermeye davet edilecek ve seçilen makaleler çalıştayda gösterilecektir. Ayrıca yarışmaya katılmayan ilgili araştırmacılar da bildiri sunabilir.

Gizlenmiş Yüz Veri Kümesi

Organizatör, 1.000 temayı kapsayan 11.000'den fazla farklı şekilde gizlenmiş resim içeren bir Örtülü Yüz Veri Seti hazırladı. Tema klasörü, kılık değiştirmiş sanatçıların resimlerinden oluşuyor.Ayrıca, düzenleyici ayrıca Hızlı RCNN'den oluşturulan yüz dosyalarını da sağlıyor.

Veri seti adresi:

Yarışma esas olarak aşağıdaki yönleri içerir:

  • Kılık değiştirmiş yüzleri tanıyın

  • Başka bir kimliği taklit edin

  • Çeşitli kılık değiştirme yöntemlerinin tespiti

  • Makyaj sonrası yüz tanıma

  • Maskelemeden sonra yüzü tanıyın

Yarışma hakkında ayrıntılı bilgi için lütfen şu adrese bakın:

Büyük Ölçekli Dönüm Noktası Tanıma: Bir Zorluk

Tur sonrası fotoğraflara göz attığınızda, kendinize hiç sordunuz mu: Çin'de ziyaret ettiğim tapınağın adı nedir? Fransa'da gördüğüm bu anıtı kim inşa etti? Hatırlarsanız önemli değil, dönüm noktası tanıma sistemi Size yardımcı olabilir. Dönüm noktası tanıma teknolojisi, resim pikselleri aracılığıyla yer işareti etiketlerini doğrudan tahmin edebilir, böylece insanların fotoğraflarını daha iyi anlamalarına ve sınıflandırmalarına yardımcı olur.

Günümüzde, dönüm noktası tanıma araştırması büyük bir engelle karşı karşıyadır - büyük etiketli veri kümelerinin eksikliği.

Bu yarışmada organizatörler, bu sorunun çözümünü desteklemek için bugüne kadarki en büyük küresel veri setini açıkladılar. Yarışma Kaggle platformunda yapıldı ve son derece zorlu geçti.

Bu sefer iki olaya bölünmüştür:

Dönüm noktası tanıma

Kagglers'ın test setinde doğru dönüm noktasını belirlemek için bir model oluşturması gerekir (resimde bir yer işareti varsa).

Birçok Kaggler, ImageNet LSVRC gibi büyük ölçekli görsel tanıma zorluklarına aşinadır ILSVRC'nin amacı bin normal nesne kategorisini tanımaktır. Dönüm noktası tanıma bundan biraz farklıdır: daha büyük sınıfları içerir (bu yarışmada 15.000 sınıf) ve her sınıf için eğitim örneklerinin sayısı çok büyük olmayabilir. Dönüm noktası tanımanın kendisi de son derece zordur.

Bu meydan okuma, dönüm noktası geri alma mücadelesiyle aynı zamanda gerçekleştirilir. İki yarışmanın test setleri, katılımcıları her ikisine de katılmaya teşvik etmek için aynıdır.

Landmark arama

Görüntü alma, bilgisayar görüşünde temel bir sorundur: bir görüntü verildiğinde, benzer görüntüleri büyük bir veritabanında bulabilir misiniz? Bu sorun, önemli noktalar içeren görüntüler için çok önemlidir, çünkü çoğu insan arka plan olarak belirli yer işaretlerini kullanmayı sever. Fotoğraf çekin.

Bu yarışmada organizatör yarışmacılara sorgulanacak resimleri verecek ve verilen her görsel için yarışmacıların aynı yer işaretini (varsa) içeren veri tabanındaki tüm görüntüleri alabilecekleri umulmaktadır.

Organizatör ayrıca katılımcıları, geri alma yarışmasında modelleri eğitmek için tanıma yarışmasından elde edilen eğitim verilerini kullanmaya teşvik eder, bu da yararlı olabilir. Ancak lütfen unutmayın: Bu iki zorluğun eğitim / erişim setlerinde ortak bir dönüm noktası yoktur.

Yarışma tarafından sağlanan yeni veri seti, dünyanın en büyük görüntü alma araştırma veri setidir.Bir milyondan fazla resimden oluşur ve 15.000 benzersiz yer işareti içerir. Organizatör, bu veri setinin bu tür araştırmaların ilerlemesini hızlandıracağı umudunu dile getirdi.

Önemli nokta tanıma yarışma adresi: https://www.kaggle.com/c/landmark-recognition-challenge

Önemli nokta alma yarışma adresi: https://www.kaggle.com/c/landmark-retrieval-challenge

Yukarıdaki iki temsili ve yenilikçi yarışmaya ek olarak, LPIRC gibi daha birçok geleneksel yarışmalar da vardı.

Düşük Güçlü Görüntü Tanıma Zorluğu

Yarışmaya IEEE ev sahipliği yapıyor ve bu yıl dördüncü. Yarışma sponsorları arasında IEEE Rebooting Computing, Google ve Facebook bulunmaktadır.

Yarışmanın arka planı şu şekildedir: Şu anda birçok mobil sistem (akıllı telefonlar, elektronik cihazlar, otomatik robotlar) kamera işlevlerine sahiptir ve bu sistemlerin hepsinin pillere ihtiyacı vardır, bu nedenle enerji tüketimini azaltmak son derece önemlidir.

Bu yarışma, görüntü tanıma ve enerji tasarrufunu birleştiren en iyi teknolojiyi keşfetmeyi amaçlamaktadır. Yarışmacıların planları iki boyuta göre değerlendirilecektir: biri yüksek tanınma oranı ve diğeri düşük güç tüketimi.

Görüntü tanıma birçok görevi içerir. Bu zorluk, birçok tanıma yönteminin temel yolu olan nesne algılamaya odaklanmaktadır.

İşte bu görevi açıklamak için iki örnek.

İlk örnekte iki nesne var: bir kuş ve bir kurbağa.

İkinci örnekte, birkaç nesne var: arabalar, insanlar, motosikletler ve kasklar.

LPIRC eğitim ve doğrulama verileri ImageNet Büyük Ölçekli Görsel Tanıma Mücadelesinden gelir. Test verileri bu yarışma için özel olarak hazırlanır.

Yarışma üç farklı zorluğa bölünmüştür:

1. Parça: CVPR 2018'den önce, katılan ekipler modellerini TfLite formatında sunar.Buradaki odak noktası, modelin bilgi işlem platformundaki doğruluğunu ve uygulama süresini belirlemektir.

2. Parça: Katılımcı ekipler CVPR 2018'den önce prosedürleri sunar. Organizatör, doğruluğu ve enerji tüketimini ölçmek için Nvidia TX2'deki prosedürleri uygulayacaktır.

3. Parkur: Yarışmacılar, 2017'de olduğu gibi, yazılı programlarını yerinde yarışmak için kullanırlar.Donanım ve yazılım konusunda herhangi bir kısıtlama yoktur. (Not: NVIDIA TX2 kullanılamaz)

Yarışma hakkında daha fazla bilgi arka arkaya duyurulacaktır. Şunlara dikkat edebilirsiniz:

https://rebootingcomputing.ieee.org/lpirc

Bunlara veya oldukça yenilikçi veya geleneksel yarışmalara ek olarak, aşağıda tanıtılacak sağlam görsel zorluk gibi uzun süredir devam eden etkinlikleri içeren ve gelecekteki pratik değerlere odaklanan yarışmalar da vardır.

Sağlam Vizyon Zorluğu (Sağlam Vizyon Zorluğu)

Geçtiğimiz on yılda, Middlebury, PASCAL VOC, ImageNet, MS COCO, KITTI ve Cityscapes gibi açıklamalı büyük veri kümelerinin sayısı artmıştır.Bu veri kümelerinin ortaya çıkışı, bilgisayarla görme ve makine öğreniminde büyük ilerleme kaydetmiştir.

Herkese açık sıralama ile herkesin yalnızca birden fazla yöntemin sonuçlarını karşılaştırması gerekir ve bu alandaki en ileri teknolojiyi izlemek kolaydır. Her veri setinde sürekli ilerleme kaydedilmiş olmasına rağmen, çoğu belirli alanlarla sınırlıdır. Örneğin, KITTI gerçek dünyadaki şehir içi sürüş senaryolarına odaklanırken, Middlebury iç mekan senaryolarını değerlendiriyor.

Bu nedenle, bir veri kümesindeki birinci sınıf yöntemler genellikle başka bir veri kümesinde kötü performans gösterir veya model parametrelerinde çok fazla değişiklik gerektirir.

Bu atölye çalışmasının amacı, görsel sistemin gelişimini teşvik etmek ve farklı özelliklere sahip çeşitli veri kümeleri üzerinde iyi performans gösterebilecek sağlam bir sistem bulmaktır.

Organizatör, bu hedefe ulaşmak için, farklı özelliklere sahip bir dizi zorlu karşılaştırmayı (iç mekan VS dış mekan, gerçek VS sentezi, güneşli VS kötü hava ve farklı sensörler gibi) geçen Sağlam Vizyon Mücadelesini başlattı. Sistemin çeşitli görevlerdeki performansı (yeniden yapılandırma, anlamsal / örnek bölümleme, tek görüntü derinliği tahmini gibi). Ek olarak, organizatör herkesi yeni algoritmaları, halihazırda incelenmekte olan teknolojileri ve sunumlarında yayınlanmış yöntemleri göndermeye teşvik eder.

Yukarıdaki resimde gösterildiği gibi, organizatör bu 6 mücadelenin şampiyonları ve ikincileri için ödüller veriyor ve onları bu atölyede yöntemlerini göstermeye ve atölye yemeğine katılmaya davet ediyor. Ayrıca organizatör, kazananın önerisini TPAMI belgesinde yayınlamayı planlıyor.

Genel bir perspektiften bakıldığında, trafik sorunları ve kentsel gelişim sorunları ile başa çıkmanın daha iyi yollarını bulmak için bilgisayar teknolojisini kullanmayı amaçlayan, şehrin mevcut durumuna odaklanan birçok yarışma da vardır.Örneğin, iki yarışma aşağıda tanıtılacaktır:

NVIDIA AI ŞEHİR MEYDAN OKUMASI

Nvidia, CVPR 2018'de Nvidia AI City Challenge düzenledi. 2020 yılına kadar 1 milyar kamera olacağını belirttiler. Ulaşım, kameralar için en büyük pazar segmentlerinden biridir çünkü bu kameraların yakaladığı verilerden faydalanabilir. Trafikte, sinyal sisteminde, ulaşım sisteminde ve altyapıda bu kameralardan elde edilen bilgilerin analiz edilmesi, ulaşım sisteminin daha güvenli ve akıllı olmasına yardımcı olacaktır.

Ancak, bazı nedenlerden dolayı, bu potansiyel bilgiyi kullanamadılar. Birincisi, verilerin kalitesinin çok kötü olmasıdır.Ayrıca veri etiketlerinin de eksikliği var.Son olarak, verileri faydalı bilgilere dönüştürebilecek yüksek kaliteli modellerin eksikliği var.Ayrıca, model geliştirme ve dağıtımını hızlandırmak için uçtan buluta analizi destekleyen bir platforma ihtiyaç var.

NVIDIA AI City Challenge atölyesi, trafik akış özelliklerini (araç hızı gibi) analiz etmek ve araç çarpışmalarını ve park etmenin neden olduğu anormal olayları tespit etmek için denetimsiz yöntemlerin kullanımını şiddetle geliştirmek gibi bu konulara özel önem verecektir.

Bilgisayar görüşü, özellikle derin öğrenme, şehirleri daha akıllı ve daha güvenli hale getirmeye yardımcı olacak büyük ölçekli fiili konuşlandırmaya katkıda bulunsa da, Nvidia herkesten daha fazla fikir istemeyi umuyor.

Denetimli yöntemlere olan güveni azaltmak ve aktarım öğrenmeye, denetimsiz ve yarı denetimli yöntemlere daha fazla önem vermek için bu çalıştayda bu yarışmayı düzenlediler ve mükemmel sonuçlar çalıştayda sergilenecek.

Katılımcılar aşağıdaki üç yarışmadan birine veya daha fazlasına katılmayı seçebilirler. Ödül kazanmak isteyen takımların, organizatör tarafından doğrulama için kodlar göndermeleri gerekir.

1. Yol: Trafik Akışı Analizi (Trafik Akışı Analizi)

Katılımcı takımların tahmini hızlarını bildirmeleri gerekir. Test seti 27 adet 1 dakikalık videodur.

2. Parça: Anormallik Algılama

Katılan ekipler, araba çarpışmaları veya araç durmalarından kaynaklanabilecek tespit edilen ilk yüz anormal koşulu sunacak. Anormal durum, normal trafik sıkışıklığını içermez.

3. Parça: Çok Kameralı Araç Algılama ve Yeniden Tanımlama

Katılımcı ekiplerin 15 videoda 4 farklı yerde en az bir kez görünen araçları belirlemesi gerekiyor.

Yarışmacılara verdikleri ödüller de NVIDIA:

Track 1'de şampiyon ve ikincilik ödülleri Jetson TX2;

2. Parkurda şampiyon ödülü Titan Xp1 ve ikinci ödül Jetson TX2;

3. Parkurda şampiyon ödülü Tesla V100 ve ikinci ödül Jetson TX2'dir.

Yarışma ayrıntıları: https://www.aicitychallenge.org/

DeepGlobe Uydu Görüntüsü Zorluğu Anlama

Organizatöre göre, geleneksel görüntülerle karşılaştırıldığında, uydu görüntüleri çok güçlü ve daha yapılandırılmış ve tutarlı veriler içeriyor. Bilgisayarla görme topluluğu şu anda günlük görüntü veri setlerine dayanan son derece zorlu bazı görevleri tamamlamak için derin öğrenmeyi kullanıyor olsa da, uydu görüntüleri ancak son zamanlarda dikkat çekmiştir ve harita ve nüfus, uydu görüntülerine göre analiz edilebilir.

Bu atölye, uydu görüntü analizinin en iyi teknolojisinin ilerlemesini ilerletmek için farklı araştırmacıları burada bir araya getirmeyi amaçlamaktadır.

Organizatörler, daha fazla insanın bu teknolojilere dikkat etmesini sağlamak için, üç farklı uydu görüntüsü anlama görevine dayanan DeepGlobe Satellite Image Understanding Challenge'ı başlattı.

Bu yarışma için hazırlanan veri seti, uydu görüntülerinin gelecekteki analizi ve araştırmaları için referans olarak kullanılabilir. Ek olarak, zorlu görev gerçek çekimlerde (vahşi ortamda) klasik bilgisayar görme problemlerini içereceğinden, bu veri kümeleri son derece değerlidir ve sadece uzaktan algılama teknolojisinin kapsamı ile sınırlı olmayan sağlam görüş algoritmaları için bir üreme alanı haline gelebilir. .

DeepGlobe aşağıdaki üç görevi içerir:

  • Yol çıkarma

Afet bölgelerinde, özellikle gelişmekte olan ülkelerde, haritalar ve mevcut bilgiler krize müdahale için kritik öneme sahiptir. Buradaki zorluk, uydu görüntülerinden yolları ve sokak ağlarını otomatik olarak çıkarmaktır. Bu, her alandaki tüm yolların piksellerini tespit etmesi gereken ikili bir segmentasyon problemidir. Bu yarışmanın değerlendirilmesi, yol piksellerinin doğruluğuna dayalı olacaktır.

  • Bina algılama

Nüfus dinamiği modellemesi, afete müdahale ve iyileştirme için büyük önem taşır ve binaların ve kentsel alanların tespiti, modellemenin anahtarıdır. Bu zorluğun amacı, binaları uydu görüntülerinden otomatik olarak tespit etmektir. Bu problem aynı zamanda ikili bir segmentasyon problemidir.Her bir alandaki tüm farklı binaların yerini bulmak gerekir. Değerlendirme, tespit edilen bina kenarlarının temel gerçek ile örtüşmesine dayanır.

  • Arazi örtüsü sınıflandırması

Yüzeyin otomatik sınıflandırılması ve kesilmesi, sürdürülebilir kalkınma, çiftçilik ve şehir planlaması için büyük önem taşır. Bu zorluk, şehirlerin, ekili arazilerin, otlakların, ormanların, su kaynaklarının, çorak arazilerin ve bilinmeyen alanların tespit edilmesini gerektiren çok sınıflı bir bölümleme görevidir. Değerlendirme, kategori etiketinin doğruluğuna dayanmaktadır.

Katılımcılar bir veya daha fazla zorluğun sonuçlarını sunabilir. Organizatör, herkesi yeni teknolojiler, incelenmekte olan yöntemler ve yayınlanan yöntemler de dahil olmak üzere sonuçları sunmaya çağırdı. Her mücadelenin ilk üçü ödüllendirilecek, kazanan DeepGlobe CVPR 2018 atölyesinde sözlü bir sunum yapacak ve her mücadelenin ilk beşi bir poster sunumuna davet edilecek. Organizatör ayrıca atölyede seçilmiş bazı bildirileri de yayınlayacak.

Tabii ki, yukarıda tanıtılan yarışmalar hepsi değil. Daha fazla atölye yarışması bilgisi görüntülemek ve ilgilendiğiniz herhangi bir konu olup olmadığını görmek için bağlantısını tıklayabilirsiniz.

(Son) Leifeng.com AI Araştırma Enstitüsü tarafından derlenmiş ve derlenmiştir

"Dragon Ball Fighter Z" ikinci yıl sezon bileti açıklandı, altı yeni savaşçı ekleyecek
önceki
"Dünün Mavi Gökyüzü" bir "Elveda" afişi yayınlıyor. En son ayrılan siz misiniz?
Sonraki
Değerim sizin "fiyatınızın" üstünde
Serin bir yaz Sony NW-WS623, Şangay'da bir açık hava canlı şovu düzenledi
CVPR2018'e ilk bakış | DiracNets: Katman bağlantılarını, yapısal parametrelendirmeyi ve Dirac parametrelendirmesini atlamadan daha derin sinir ağlarını eğitmek için ResNet
"Sınırsız Kuzey" 80'ler sonrası yönetmenin çarpıcı bir çalışması olan büyülü gerçeklik, benzersiz Çinli kadınlara odaklanıyor
Diyar olmadan, Lu Guanqiu'yu anlamak zordur korkarım
Yeni platform, büyük değişim, gerçek araba yok, yeni nesil Fox Civic'i selamladı
Awakening 4K Vision Sony BRAVIA KD-65A8F OLED TV derinlemesine değerlendirme
Macron'dan Kurtz ve Ardern'e dünya siyaseti neler yaşıyor?
İLK "Fil Yerde Oturuyor" açılır, gösterim programı duyurulur ve bilet satın alma kanalı çevrim içi olur
Etkiyi görün Caiyun Gölü Sulak Alan Parkı'ndaki binlerce insan gece balıkçılını "izliyor"
4K Pocket Gun-Panasonic ZS220 İnceleme
Qin Shuo: Her girişimci, lütfen bir düşünün Lu Guanqiu'dan ne öğrenebilirsiniz?
To Top