g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

"CVPR en iyi kağıt yayınlandı" Şampiyonayı Tsinghua kazandı, "ülkenin yarısı" Çinliler birkaç ödül kazandı

Xinzhiyuan İşe Alım AI yaz ortasında, yıldız gemisi yelken açıyor. "Yeni Nesil Yapay Zeka Geliştirme Planı" yayınlandığında, Xinzhiyuan ayrıca Raycom Bilgi Merkezi'nin B Blokuna resmi olarak yerleşti ve kullanıma hazır hale geldi. Doğru zaman ve yer, yıldızlar ve deniz, sizi çağırıyoruz - yeni mürettebat katılmaya! COO, baş editör, baş yazar, içerik operasyonu, hesap yöneticisi, hesap yöneticisi, görsel yönetmen (yarı zamanlı) 7 ana pozisyon yeni açıldı . Makalenin sonundaki tıklayın Orijinali okuyun ayrıntılara bakınız.

Çinli akademisyenler bu konferansta olağanüstü iyi performans gösterdi. Toplam makale sayısının% 45'inden fazlasını almakla kalmadılar, konferansın 81 başkanı listesinde Zhang Zhengyou, Chen Xilin ve Hua Gang (2019'da CVPR Program Başkanı) gibi birçok Çinli yüz de vardı. ), Jia Jiaya, Sun Jian, Lu Le, Zhou Shaohua, Zhu Songchun ve diğer öğretmenler.

CVPR 2017 konferans turu

2017 CVPR, düzenlenmeden önce büyük ilgi gördü.

Konferansın resmi web sitesine göre, bu yıl CVPR tarihinde en fazla olmak üzere toplam 2.680 etkili başvuru aldı. Bunların arasından toplam 783 makale kabul edildi.

Katılımcı sayısı açısından ise bu yıl 5.000'e yakın olan katılımcı sayısı 4950'dir. Twitter'daki katılımcıların "ifşaatlarına" göre, yaklaşık 5.000 kişilik mekanda 21. gün erken giriş yaptıklarında uzun kuyruklar vardı. Geçtiğimiz yıl CVPR'nin% 34,35'i akademisyen,% 28,62'si akademisyen ve% 37,03'ü sektörden olmak üzere toplam 3.600 katılımcı vardı.

Ayrıca resmi olarak açıklanan verilerde, bu konferansa dünyanın dört bir yanından yaklaşık 90 şirketin katıldığı 2017 yılında çok sayıda endüstriyel katılım olduğunu görüyoruz. Google, Microsoft, Facebook, Amazon, Apple, Intel ve Nvidia gibi tanınmış devlerin yanı sıra, Çinin Tencent, Alibaba, JD.com ve Didi gibi büyük ölçekli internet şirketleri, Yushi ve Geling Shentong gibi birçok start-up şirketi de var. Ve Momenta ve benzeri.

CV dünyasında Bahar Festivali Galasının ne kadar canlı olduğunu hissedin:

Aşağıda: Yıllar içinde makale sayısında CVPR değişmektedir. Tarihteki en yüksek sayı olan 783 bildiri ile 2017 yılında bildiri sayısında çok büyük bir artış olduğu görülmektedir. Ayrıca tüm araştırma alanında bilgisayarla görmenin popülerliğini görebiliriz.

CVPR 2017 En İyi Kağıt: DenseNet ve Apple Kompozit Görüntü Kağıdı

CVPR 2017, 5 büyük bildiri ödülü seçti:

En iyi kağıt koleksiyonunu indirmek için Xinzhiyuan WeChat genel hesabında "cvpr17" ye yanıt verin.

En iyi 2 makale

Kağıt 1: Yoğun Şekilde Bağlı Evrişimli Ağlar

Yazar: Gao Huang, Zhuang Liu, Kilian Q. Weinberger, Laurens van der Maaten

Belge 2: Tartışmalı Eğitim Yoluyla Simüle Edilmiş ve Denetlenmemiş Görüntülerden Öğrenmek

Yazar: Ashish Shrivastava, Tomas Pfister, Oncel Tuzel, Josh Susskind, Wenda Wang, Russ Webb

En iyi makaleler için 2 adaylık (mükemmel makaleler)

Kağıt 1: YOLO9000: Daha İyi, Daha Hızlı, Daha Güçlü

Yazar: Joseph Redmon, Ali Farhadi

Kağıt 2: Poligon-RNN ile Nesne Örneklerine Açıklama Ekleme

Yazarlar: Lluis Castrejon, Kaustav Kundu, Raquel Urtasun, Sanja Fidler

En iyi 1 öğrenci ödevi

Elektrik şebekesinde hesaplamalı görüntüleme

Mark Sheinin, Yoav Y. Schechner. Ve Kiriakos. N. Kutulakos

Bunların arasında, DenseNet makalesi 2016'da Cornell Üniversitesi'nden Gao Huang ve Tsinghua Üniversitesi'nden Zhuang Liu tarafından yayınlandı. DenseNet, ResNet'in bir çeşidi olarak görülebilir. Artık bir yapı oluşturmak için çıktı ve girdi ekleyen ResNet'in aksine, DenseNet, çıktı ve girdiyi paralel olarak bağlar, böylece her katman önceki tüm katmanların çıktılarını doğrudan alabilir. Bir başka en iyi kağıt Apple'dan. Şunu da söylemek gerekir ki, bu şirket kutlama değilse zaten gişe rekorları kıran bir şirkettir ve gazeteyi halka açık olarak yayınladıktan kısa bir süre sonra en iyi CVPR'yi kazandı. Apple'ın gelecekteki performansı dört gözle beklemeye değer.

Aşağıda en iyi makaleleri kısaca tanıtıyoruz.

En iyi makale 1: Yoğun şekilde bağlı evrişimli ağ

Özet

Son araştırmalar, evrişimli ağın giriş ve çıkışa yakın katmanlar arasında daha kısa bağlantılar içermesi durumunda, evrişimli ağın önemli ölçüde daha derin, daha doğru ve daha verimli olabileceğini göstermiştir. Bu araştırmada, bu gözlemle hemfikiriz ve tüm katmanları ileri beslemeli bir şekilde birbirine bağlayan DenseNet'i (Dense Convolutional Network) öneriyoruz. Bir L-katmanlı geleneksel evrişimli ağın L bağlantıları vardır - yani, her katman ile sonraki katman arasında bir bağlantı vardır Önerdiğimiz DenseNet ağının L (L + 1) / 2 doğrudan bağlantıları vardır. Her katman için girdisi, önceki tüm katmanların özellik haritasıdır ve kendi özellik haritası, sonraki tüm katmanların girdisi olarak kullanılır. DenseNet'in birkaç olağanüstü avantajı vardır: gradyan kaybolması sorununu azaltır, özellik yayılmasını güçlendirir, özelliğin yeniden kullanımını teşvik eder ve parametre sayısını büyük ölçüde azaltır. Önerilen mimarimizi, rekabet gücü yüksek 4 nesne tanıma karşılaştırma görevinde (CIFAR-10, CIFAR-100, SVHN ve ImageNet) değerlendirdik. Sonuçlar, DenseNet'in çoğu görevde önceki optimum sonuçlara kıyasla önemli ilerleme kaydettiğini ve yüksek performans elde ederken daha az bellek ve hesaplama gerektirdiğini göstermektedir. İlgili kod ve model burada bulunabilir: https://github.com/liuzhuang13/ DenseNet

En İyi Makale 2: Çekişmeli eğitim yoluyla simülasyonlu ve denetimsiz görüntülerden öğrenme

Özet

Grafiklerdeki son gelişmelerle birlikte, verileri açıklama eklemenin pahalı maliyetini önleyebilen sentetik görüntüler kullanarak modelleri eğitmek daha kolay hale geldi. Bununla birlikte, sentezlenen görüntü ile gerçek görüntü dağılımı arasındaki boşluk nedeniyle, sentezlenen görüntüden öğrenmek istenen performansı elde edemeyebilir. Bu boşluğu daraltmak için Simüle Edilmiş + Denetimsiz (S + U) öğrenmeyi öneriyoruz. Görevi, simülatörün çıktısının gerçekçiliğini iyileştirmek için etiketlenmemiş gerçek verileri kullanmak için bir model öğrenmektir. , Simülatörden gelen ek açıklama bilgilerini korurken. S + U öğrenme için, Üretken yüzleşme ağına (GAN) benzer bir yüzleşme ağı kullanan bir yöntem geliştirdik, ancak yöntemimiz girdi olarak sentezlenmiş görüntüleri (rastgele vektörler yerine) kullanır. Ek açıklama bilgilerini korumak, yapılardan kaçınmak ve eğitimi sabit tutmak için standart GAN algoritmasında birkaç önemli değişiklik yaptık: (i) "kendi kendini düzenleme" terimi, (ii) yerel bir rakip kayıp ) ve (iii) ayrıştırıcıyı güncellemek için iyileştirilmiş görüntünün geçmiş bilgilerini kullanın. Araştırmamız, bu yöntemin son derece gerçekçi görüntüler üretebileceğini gösteriyor ve bu, nitel araştırma ve kullanıcı araştırmasıyla onaylandı. Bakış tahmini ve el tahmini için eğitim modelleri aracılığıyla nicel değerlendirmeler yaptık. Araştırmamız, bu yöntemin sentetik görüntülerin kullanımında önemli bir gelişme sağladığını ve MPIIGaze veri setinde herhangi bir etiketli veri olmadan son teknoloji sonuçlar elde ettiğini göstermektedir.

En İyi Öğrenci Bildirisi : Elektrik Şebekesinde Hesaplamalı Görüntüleme

Özet

Alternatif akım (AC) aydınlatması gecenin ritmini getirir. Bu tür bir vuruş hissi aracılığıyla, sahnedeki ampulün türü, şehir ölçeğinde ızgaranın aşaması ve optik iletim matrisi dahil olmak üzere yeni sahne bilgilerini açığa çıkardık. Bu bilgi, yansıma ve yarı yansımalar, geceleri yüksek dinamik aralık ve çekim sırasında gözlenmeyen ampullerin sahne sunumu arasında ayrım yapar. İkincisi, topladığımız ve sağladığımız zengin ampul yanıtı işlevi veritabanıyla kolaylaştırılmıştır. Yukarıdaki çalışmayı başarmak için, güç şebekesi üzerindeki AC aydınlatmasında çalışmak üzere özel olarak tasarlanmış yeni bir kodlu pozlamalı yüksek dinamik aralık görüntüleme teknolojisi geliştirdik.

Konferansta ayrıca Longuet-Higgins Ödülü ve PAMI Genç Araştırmacı Ödülü açıklandı:

Longuet-Higgins Ödülü, IEEE Bilgisayar Derneği Model Analizi ve Makine Zekası (PAMI) Teknik Komitesi tarafından yıllık CVPR'de verilen "Bilgisayarla Görme Temel Katkı Ödülü" dür. On yıl önce bilgisayarla görü araştırmalarında önemli bir etkisi olan CVPR kağıtlarını ödüllendirmektedir. Ödül, adını teorik kimyager ve bilişsel bilim adamı H. Christopher Longuet-Higgins'den alıyor.

2017 Longuet-Higgins Ödülü, J. Philbin ve diğerleri tarafından 2007'de yayınlanan "Geniş kelime dağarcığı ve hızlı uzaysal eşleştirme ile nesne bulma" başlıklı CVPR makalesine verildi. Google Scholar motoruna göre bu makale 2122 kez alıntılanmıştır.

Bir diğer ödül ise, 7 yıldan fazla bir süre içinde doktora derecesi ile mezun olan ve bilgisayarla görme konusunda üstün araştırma katkıları olan genç araştırmacılara verilen "PAMI Genç Araştırmacı Ödülü" dür. PAMI Genç Araştırmacı Ödülü 2013 yılından beri verilmektedir ve 2012 yılında IVC'den "Üstün Genç Araştırmacı Ödülü" nü almıştır.

2017 PAMI Young Researcher Award kazananları Ross Girshick (Facebook AI Research, FAIR) ve Julien Mairal (INRIA).

Yukarıdaki çoklu ödüllerin kazananlarına bakılırsa, Çinli akademisyenlerin CVPR kağıt gönderimlerinin ve yarışmalarının sayısında olağanüstü performans göstermelerine rağmen, ödüllerin oranı yüksek değil.

Makale alma: Çinli akademisyenlerin yarısı hâlâ sağlam ve "derin öğrenme" anahtar kelimelerde kesinlikle en üst sırada yer alıyor

Bu yıl CVPR, 2.620'si tamamen gözden geçirilmiş olan toplam 2.680 geçerli başvuru aldı (kalan 60'ın bir kısmı teknik veya etik nedenlerden dolayı komite tarafından reddedildi ve bazıları incelemeden önce geri çekildi).

Sonunda toplam 783 makale kabul edildi (kabul oranı% 29'du). Bunların 71'ine uzun bir sözlü rapor sunma fırsatı verildi ve 144'üne kısa bir rapor (spot ışıkları) alma şansı verildi.

CVPR 2017 kabul edilen bildiriler üç biçimde sunulabilir: iki tür sözlü sunum (uzun ve kısa, Sözlü ve Spot ışıklar) ve poster sunumu. Xinzhiyuan'ın istatistiklerine göre, konferansta toplam 107 oturum var.

SÖZLÜKLER: Geleneksel CVPR sözlü yayınlarda olduğu gibi, CVPR 2017'nin sözlü bölümüne giren yazıların oranı önceki CVPR oturumlarıyla aynıdır. Her sözlü rapor süresi 12 dakikadır.
KONUŞMALAR: Her bir spot habercisinin, makalenin ana katkılarını ve yeniliklerini vurgulamak ve makalenin ana araştırma sonuçlarını rapor etmek için 4 dakikalık sözlü sunum süresi vardır.
POSTERLER: Sözlü sunumlar dışındaki bildiriler posterlerle sunulacaktır. Ayrıca sözlü rapor dışındaki tüm bildiriler de poster sunum oturumunda yer alacaktır.

Tüm kağıtların listesi:

Xinzhiyuan'ın istatistiklerine göre, 783 bildirinin tümü arasında, Çinli bilim adamları tarafından imzalanan yaklaşık 356 bildiri,% 45.47'ye tekabül etmektedir. (Xin Zhiyuanın göz istatistiklerinde küçük hatalar olabilir)

Xinzhiyuan, alınan makalelerin konularına dayalı olarak sıcak kelimelerin kaba bir istatistiğini yaptı (yukarıdaki bulut resmine bakın) - "derin öğrenme" şaşırtıcı olmayan bir şekilde en sıcak anahtar kelimedir. Aynı zamanda, Görüntü, Nesne ve Video gibi sözcükler sık sık görünür, bu da CVPR bir bilgisayarla görme konferansı olduğu için anlaşılması kolaydır. Benzer şekilde, tanıma, algılama, sınıflandırma ve evrişim, artık (ağ) vb. De yüksek frekanslı kelimelerdir.

Yüzün ortaya çıkışı yüz tanımanın şiddetini kanıtlar El ile karşılaştırıldığında poz, özellikle el, Yüzün beşte birinden daha azdır. Model seçiminde GAN ve üretken modeller çok öne çıkıyor ve 2017'den beri görsel topluluğun ilgisinden GAN'a kadar ayrılmazlar. Aslında, bu sefer kabul edilen makalelerde çeşitli GAN varyantları göründü.

Şimdi daha ayrıntılı bir sınıflandırmaya bakalım.

CVPR 2017'de kabul edilen bildirilerin dağıtımı. Konferans toplam 783 bildiri kabul etti.İçteki daire ana alt alanı, dıştaki daire ise ikincil alt alanı temsil ediyor. İç halkanın sağ üst köşesinden başlayarak, kağıtların ana alt alanları en çoktan küçüğe doğru saat yönünde gösterilir. En büyük mavi kısım makine öğrenimini temsil eder, sonraki kırmızı nesne tanımayı ve sahne anlayışını temsil eder ve sonraki mavi kısım 3B bilgisayar vizyonunu temsil eder. Diğer renklerin karşılık gelen içeriği aşağıdaki listede gösterilmektedir.

Bu CVPR tarafından alınan 783 makale arasında, makine öğrenimi ana alt alanlarda en çok makaleye sahip olup,% 23,5'ini oluştururken, bilgisayar vizyonu teorisi en az% 1,40'ına sahiptir. Her bir ana alt alandaki bildirilerin dağılımı aşağıdaki gibidir:

Bilgisayarla görmede makine öğrenimi 184 makale (% 23,5)
Nesne tanıma ve sahne anlama 172 makale (% 22)
993D Bilgisayarla Görme (% 12.6)
93 düşük ve orta düzey görme (% 11,9)
Görüntülerde 87 insanı analiz edin (% 11.1)
Video analizi 55 makale (% 7.02)
Görüntü dinamikleri ve izleme 31 makale (% 3,96)
20 başvuru (% 2,55)
Hesaplamalı Fotoğrafçılık 18 (% 2,30)
12 biyomedikal görüntü analizi (% 1.53)
11 bilgisayar görme teorisi (% 1.40)

Makine öğrenimi kağıtları arasında en çok CNN ve derin öğrenme (dış halkanın sağ üst köşesi mor), ardından bilgisayar görüşünde makine öğrenimi (dış halkanın sağ üst köşesi mavidir) ve üçüncüsü denetimsiz öğrenme, ayrık optimizasyon ve sürekli Optimizasyon vb.

3 Açılış konuşması: Temel araştırmadan uygulamaya, gelecekteki araştırma yönüne

CVPR, 2017 yılında 22., 23. ve 25. yerel saatte 3 açılış konuşması yaptı. Konular, temel bilgilerden - derin sinir ağlarını daha iyi tasarlamak için primat görsel sistemini anlamaktan - uygulamalara ve ardından haftalık konferansın tonunu belirleyen gelecekteki araştırma yönergelerine kadar uzanıyordu.

Keynote Speech 1: Dr. James J. DiCarlo, MIT
Konu: Doğal Zeka (NI) Bilimi: Primat Görsel Algının Tersine Mühendislik

Özet: Sinirbilim ve bilişsel bilimdeki büyük bir problem, insan düşüncesinin tersine mühendisliğidir. Diğer bilimsel alanlarla karşılaştırıldığında bu alan henüz emekleme aşamasındadır. Yapay sistemlerde insan zekasını (AI) simüle etmeyi amaçlayan ileri mühendislik yöntemi henüz emekleme aşamasında. Bununla birlikte, insan davranışında görülen zeka ve bilişsel esneklik, varoluşun kanıtıdır ve makinelerin insan düşüncesini taklit etmek ve insanlarla çalışmak için tasarlanabileceğini kanıtlar. Bu derste, beyin bilimi ve bilişsel bilimcilerin araştırmaları (üretim ve veri toplama) ve düşünmeyi simüle etmeyi amaçlayan ileri mühendislik (örnekleme ve veri tahmini) kombinasyonu yoluyla, tersine düşünme mühendisliğinin çözülebileceğini önereceğim. . Bu argümanı desteklemek için algısal zekaya odaklanacağım (nesne sınıflandırması ve tespiti) Beyin bilimi, bilişsel bilim ve bilgisayar biliminin bu görevleri destekleyebilecek derin sinir ağları oluşturmak için nasıl entegre edilebileceğinden bahsedeceğim. Bu ağlar yalnızca görüntü görevlerinde insan performansı elde etmekle kalmaz, aynı zamanda iç işletim mekanizmaları da büyük ölçüde teorik primat görsel sistemlerinin iç mekanizmalarını taklit eder. Bununla birlikte, primat görsel sisteminin (NI) performansı hala mevcut derin sinir ağının (AI) ötesinde ve nörobilimde bazı yeni ipuçları göstereceğim. Daha genel olarak, bu, doğal zekayı anlamak için bu büyük insan bilimsel arayışının sadece başlangıcıdır.

Keynote Speech 2: Microsoft Başkan Yardımcısı Dr. Shen Xiangyang
Konuşma konusu: Bilgisayarla Görmenin Ticarileştirilmesi: Başarı Hikayeleri ve Alınan Dersler

Özet: Bu, tüm bilgisayarla görme araştırmacıları ve uygulayıcıları için heyecan verici bir zamandır. Yıllardır devam eden teknolojik ilerlemeyi pazar odaklı teknolojilere dönüştürmede eşi görülmemiş bir büyüme gördük. Microsoft, yıllardır yeni bilgisayarla görme teknolojileri geliştirmeye, bunları tüm geliştiricilere açmaya ve bunları çeşitli ürünlere entegre etmeye adamıştır.

Bu araştırmada, Microsoft Research'teki bilgisayar vizyonunun son 25 yıldaki araştırma geçmişini kısaca gözden geçireceğim, Microsoft Research'ün bilgisayar vizyonu alanına katkısını vurgulayacağım ve işletmelerde başarılı bir endüstriyel araştırma enstitüsü kurmaya yönelik uzun vadeli yatırıma odaklanacağım. önemli anlam.

Microsoft'un ticarileştirilmesinin başarılarını tanıtmadan önce, bilgisayar grafikleri, grafik anlayışı, vizyon ve dil alanlarındaki en son araştırma sonuçlarımızdan bazılarını tanıtacağım.Özel olarak, Microsoft'un üç ürün geliştirme konusundaki deneyimini tanıtacağım: Microsoft Pix, HoloLens ve Bilişsel Hizmetler, bilgisayarla görme sistemlerini ve teknolojilerini farklı şekillerde kullanıyor.

Pix, yapay zeka tabanlı bir kamera uygulamasıdır, "harika fotoğraflar" çekmenizi, "odaklanmanızı, fotoğraf çekmenizi, mükemmel hale getirmenizi kolaylaştıracak!" Microsoft Research'ün düzinelerce CVPR, ICCV ve SIGGRAPH araştırma sonuçlarını birleştirir. . HoloLens, piyasada ticari olarak satılan ilk karma gerçeklik sistemidir. Bilişsel hizmetler, yalnızca birkaç satır kodla farklı cihazlarda ve platformlarda yapay zeka tabanlı ve pratik bir APP oluşturmanıza olanak tanır.

Bu derste, geliştiricilerin görüntü tanıma uygulamaları oluşturmalarına olanak tanıyan etkileşimli bir görsel öğrenme hizmeti olan IRIS'i göstereceğim. Ayrıca Holoportation projesi de dahil olmak üzere HoloLens hakkındaki en son demolardan bazılarını göstereceğim. Holoportation, yüksek kaliteli karakter 3D modellerinin her zaman, her yerde yeniden yapılandırılmasına, sıkıştırılmasına ve dönüştürülmesine olanak tanıyan yeni bir 3D yakalama teknolojisidir. Araştırmadan ürüne kadar olan döngüyü ilerletmenin birçok zorluğu vardır. Pix, HoloLens ve bilişsel hizmetlerin yapımından kazanılan deneyimlerden bahsedeceğim.

Keynote Speech 3: Dan Jurafsky, PhD, Stanford Üniversitesi
Konuşma konusu: Dilden sosyal anlamı çıkarın

Özet: Konferansta laboratuvarımızın bilgisayar aracılığıyla dilden sosyal anlam çıkarma araştırmasını, yani insanlar arasındaki sosyal ilişkiyi ele alan araştırmayı tanıtacağım. Trafik ışıkları önünde topluluk üyeleriyle etkileşimleri inceledik. Dil etkileşiminin kalitesini otomatik olarak ölçtük, iletişim sürecinde ırkın rolünü inceledik ve bu alanda gelecekte yapılacak bazı araştırmalar için öneriler sunduk.

Öte yandan, bilimsel yeniliğin ilerlemesini ve disiplinlerarası rolünü daha iyi anlamak için hesaplamalı modelleme gerçekleştirmek için bilimsel makalelerin dilini ve bir bilim adamları ağını ve araştırma alanlarını kullanıyoruz. Yukarıdaki araştırmanın bilim tarihi, özellikle de yapay zeka üzerindeki etkisini tartışacağım. Her iki çalışma da kullandığımız kelimelerin altında yatan anlamları açıklamada sosyal bağlamın ve sosyal modellerin önemini vurgulamaktadır.

14 oyun, tüm kahramanlar sahada yarışıyor

Bu yılki CVPR, aralarında "ILSVRC'nin Ötesinde" çalıştayının da ImageNet yarışmasının sona erdiğini resmen duyuracağı 50'den fazla atölye çalışmasına sahiptir. ImageNet artık resmi olarak tutulmuyor çünkü ILSVRC'nin 2016'daki görüntü tanıma hata oranı, insanları geride bırakarak (% 5,1) yaklaşık% 2,9'a ulaştı ve gelecekte bu tür yarışmaları düzenlemenin çok az önemi olacak. Gelecekte, bilgisayar görüşü görüntülerin ve videoların anlaşılmasına odaklanacaktır. Sonuç olarak, dikkat edilmesi gereken bir soru ortaya çıkıyor: ImageNet'ten sonra bilgisayarla görme dünyasındaki ikonik rekabet nedir.

Eksik istatistiklere göre, bu CVPR atölyesinde 14 yarışma var:

ActivityNet Büyük Ölçekli Etkinlik Tanıma Yarışması 2017

ImageNet'in büyük ölçekli görsel tanıma yarışmasının ötesinde

Video Nesnesi Segmentasyonu için DAVIS Yarışması 2017

2017 Görsel Soru Cevaplama Yarışması

YouTube-8M büyük ölçekli video anlayış rekabeti

Kişiye Bak (LIP) rekabeti

Otonom sürüş rekabeti

"Vahşi" yüz yarışması

Büyük Ölçekli Sahne Anlama (LSUN) Yarışması

Trafik izleme rekabeti

Spor sert olmayan yapı (NRSfM) rekabeti

NTIRE 2017 Tek Görüntü Süper Çözünürlük Yarışması

Açık alan eylem tanıma yarışması

Detay yarışmasında PASCAL

Görülüyor ki sahne anlayışından otonom sürüşe kadar, bu yılki CVPR çeşitli yarışmalar düzenledi. Bunlar arasında Xin Zhiyuan özel haberler, Kişiye Bakma (LIP) yarışması, Çin Bilimler Akademisi Bilgi Mühendisliği Enstitüsü'nden yardımcı araştırmacı Liu Wei liderliğindeki S-Lab ekibi ve Samsung Electronics Beijing Araştırma Enstitüsü yaya görüntü segmentasyonu proje şampiyonasını kazandı. Bu yarışma, devasa resimler, zengin not kategorileri ve çeşitli verilerle görüntü bölümleme alanındaki yaya veri setinin boşluğunu etkin bir şekilde dolduran LIP insan vücudu görüntü veri setini özel olarak yayınlayan CVPR2017 atölyesinin yarışma birimidir.

Yarışma, yaya imajı segmentasyonu, insan vücudu duruş tespiti ve diğer projeler olarak ikiye ayrılır.S-Lab ve Samsung işbirliği ekibi, yaya imajı segmentasyon projesinin şampiyonluğunu kazandı. Bu proje, katılımcıların görüntü bölümlemesini tamamlamak için gerçek yaya resimleri üzerinde piksel düzeyinde kategori tahminleri yapmasını gerektirir.Yarışma zordur ve yurtiçi ve yurtdışından birçok takımı çeker. Yarışmada, S-Lab ve Samsungun işbirliği ekibi, görüntü bölümlemenin doğruluğunu büyük ölçüde artıran ve bunu müteakip akademik araştırma ve endüstri uygulamaları için sağlayan, yaya görüntülerinin çeşitlendirilmiş perspektifine dayanan perspektif tabanlı bir görüntü bölümleme modeli olan VS-Net'i önerdi. Yeni fikirler.

Bilgi Teknolojileri Enstitüsü'nden bir araştırmacı Xin Zhiyuan'ı tanıttı ve bu CVPR'de Çin Bilimler Akademisi Bilgi Teknolojisi Enstitüsü'nden Si Liu, Ruihe Qian, Han Yu, Renda Bao, Yao Sun ve Changhu Wang'ın "Surveillance Video Parsing With with Tek Çerçeve Denetimi, videodaki anlamsal bölümleme ve etiketlemenin zorluğunu etkili bir şekilde azaltmak için videodaki zamanlama bağlam bilgisini kullanır. Makale, her videonun yalnızca bir kareyle işaretlendiği uç durumda çok iyi performans elde etmek için uçtan uca Tek Kare Video Ayrıştırma (SVP) ağı kullanmayı önermektedir. Araştırma grubu ayrıca, görüntü bölütleme problemi için görüş alanını da inceleyen "Derin Görüntü Ayrıştırma Ağı İçin Uyarlanabilir Alıcı Alanları Öğrenme" başlıklı makaleyi yayınladı.

Yarışma hakkında daha ayrıntılı tanıtımlar için, Xinzhiyuan'ın takip raporunu takip etmeye devam edin.

Sponsorlar: BAT'a ek olarak, çok sayıda girişim ortaya çıktı

Konferansın sponsorları bir ölçüde endüstri ile olan bağı yansıtıyor ve akademik başarıların endüstriyel dönüşümü de ondan görülebiliyor. CVPR'nin 2017'deki kurumsal sponsorluğu, bu konferansa dünyanın dört bir yanından yaklaşık 90 şirketin katıldığı büyük bir olay olarak tanımlanabilir. Google, Microsoft, Facebook, Amazon, Apple, Intel ve Nvidia gibi tanınmış devlerin yanı sıra, Çinin Tencent, Alibaba, JD.com ve Didi gibi büyük ölçekli internet şirketleri, Yushi ve Geling Shentong gibi birçok start-up şirketi de var. Ve Momenta ve benzeri.

Bunların arasında, konferansın platin sponsorları arasında Google, Microsoft, Facebook, Amazon, Apple, Intel, Nvidia ve Çin'in Tencent, Alibaba, JD.com, Didi ve Yushi, Geling Shentong ve Momenta yer alıyor.

Konferans Altın Sponsoru

Konferans gümüş sponsoru

Bronz sponsor

Başlangıç sponsoru

Diğer sponsorlar

CVPR'de Çin Başkanı: 31

CVPR 2017'de bir konferans başkanı, program başkanı, atölye başkanı, kurumsal başkan, Doktora Konsorsiyumu başkanı, Finans başkanı, öğrenci gönüllü başkanı, teknik başkan, yayın başkanı ve alan başkanı bulunmaktadır. Yaklaşık 30 Çinli bilim adamı da dahil olmak üzere toplam 81 başkan var.

Görsel aramanın tanıtımına göre, CVPR Alan Başkanı (Alan Başkanı veya AC) konferans programının başkanı tarafından belirlenir. Bölge Başkanı son derece önemli bir rol oynar ve bir dereceye kadar teslim için doğrudan "yaşam ve ölüm gücü" vardır. Bu nedenle, Alan Başkanları genellikle bu alanda köklü uzmanlar ve akademisyenlerdir.

Esas olarak konferansa başkanlık eden Çinli bilim adamlarını tanıtıyoruz:

Başkan

Zhang Zhengyou (Microsoft). Dr. Zhang Zhengyou, dünyaca ünlü bir bilgisayar görüşü ve multimedya teknolojisi uzmanı ve bir ACM Üyesi ve IEEE Üyesi. Stereo görüş, 3B yeniden yapılandırma, hareket analizi, görüntü kaydı ve kameranın kendi kendini kalibrasyonu konularında öncü katkılarda bulundu. Şu anda, insan-bilgisayar etkileşimi ve uzaktan gerçeklik alanlarında bazı temel teknolojilerin araştırmasıyla uğraşmaktadır. Onun icat ettiği düz panel kamera kalibrasyon yöntemi tüm dünyada yaygın olarak kullanılmaktadır ve "Zhang'ın yöntemi" olarak adlandırılır.

Program başkanı

Liu Yanxi (Pennsylvan Eyalet Üniversitesi)

Wu Ying (Kuzeybatı Üniversitesi)

Atölye Başkanı

Mei Chen (Albany Üniversitesi)

Kurumsal İlişkiler Koltukları

Yan Shuicheng (Qihoo 360)

Han Mei (Google)

Demos Sandalye

Lu Le (NIH)

Web Sitesi Başkanı

Yuan Junsong (Nanyang Teknoloji Üniversitesi)