CVPR 2017'yi kaçırdınız mı? GAIR konferans salonunu asla kaçırmayın - Şangay Jiaotong Üniversitesi özel oturumu kayıtları açar

CVPR (Uluslararası Bilgisayar Görüsü ve Örüntü Tanıma Konferansı), IEEE tarafından düzenlenen yıllık bir akademik konferanstır.Konferans esas olarak bilgisayarla görme ve örüntü tanımanın teknik içeriğine odaklanmaktadır. Çeşitli akademik konferans istatistiklerinde, CVPR çok güçlü bir etkiye ve yüksek bir sıralamaya sahiptir. Hawaii'de yapılan CVPR 2017 konferansında akademi ve endüstri büyük ilgi gösterdi. Hem dahil edilen makale sayısı hem de katılımcı sayısı CVPR için rekor kırdı.

Böylesine üst düzey bir akademik konferans için, ilgili makaleleri okumanın yanı sıra, etkinliğe katılma şansı olmayan öğrenciler CVPR 2017'nin akademik başarıları hakkında nasıl daha derin bir anlayışa sahip olabilirler?

12 Ağustos öğleden sonra, Leifeng.com'un ev sahipliği yaptığı "GAIR Konferans Salonu CVPR Shanghai Jiaotong Üniversitesi Özel Oturumu" resmi olarak Şangay Jiaotong Üniversitesi'nde açılacak. Leifeng.com altında üst düzey bir akademik paylaşım markası olan GAIR Lecture Hall, akademik uzmanlar, yapay zeka uzmanları ve okul öğrencileri arasında derinlemesine paylaşımlar sağlamak için yüksek frekanslı çevrimdışı kampüs akademik paylaşım etkinlikleri düzenleyecektir. Bu etkinlikte Leifeng.com, 5 CVPR 2017 ön konuşmacısını özel olarak davet etti, onları makalelerini açıklamaya ve CVPR'ye katılma deneyimlerini paylaşmaya davet etti. 5 akademik gencin orijinal paylaşımının size CVPR'ye daha canlı bir giriş getireceğine inanıyorum.

Faaliyetlere genel bakış

Sponsor : Leifeng.com

Co : Shanghai Jiaotong Üniversitesi, AI Araştırma Enstitüsü, Ali AI Lab, AI MOOC Academy

Yöneten : Çin Bilgisayar Federasyonu (CCF)

Kooperatif medya : AI Teknolojisi İncelemesi

zaman : 2: 00-6: 3012 Ağustos

yer : Shanghai Jiao Tong Üniversitesi (Minhang Kampüsü) 200 Nolu Telekom Binası Konferans Salonu

Faaliyet süreci

2: 00-2: 05 Organizatör bu etkinliği tanıtır

2: 05-2: 15 Okul liderinin konuşması

2: 15-2: 55 Wu Jiajun, MIT EECS Bölümü üçüncü sınıf doktora öğrencisi

Paylaşım konusu: Üç boyutlu nesneleri tek bir görüntüden yeniden oluşturmak için kullanılan nokta bulutu oluşturma ağı

Tek Bir Görüntüden 3B Nesne Yeniden Oluşturma için Nokta Kümesi Oluşturma Ağı

2: 55-3: 35 Wang Yang, Kıdemli Algoritma Mühendisi, Alibaba Yapay Zeka Laboratuvarı

Paylaşım konusu: Sahne Etiketleme için Bağlamsal Dikkat Temelli Bellek Ağları

3: 35-4: 15 Shanghai Jiaotong Üniversitesi öğrencisi yüksek lisans öğrencisi Yang Rui

Paylaşım konusu: Çoklu ayrıntı analizi aracılığıyla video segmentasyonu

4: 15-4: 30 Yerinde dinlenin

4: 30-5: 10 Lin Tianwei, Shanghai Jiaotong Üniversitesi yüksek lisans öğrencisi

Paylaşım konusu: Tek seferlik geçici eylem algılama

5: 10-5: 50 Wang Minsi, PhD öğrencisi, Shanghai Jiaotong Üniversitesi

Paylaşım konusu: Kolektif Aktivite Tanıma için Tekrarlayan Etkileşim Bağlamı Modellemesi

5: 50-6: 20 Yerinde birleşik soru ve cevap

6:20 Etkinliğin sonu

Konuk tanıtımı

Jiajun Wu, MIT EECS Departmanında danışman Profesör Bill Freeman ve Profesör Josh Tenenbaum ile üçüncü sınıf doktora öğrencisidir. Araştırma ilgi alanı bilgisayarla görme, makine öğrenimi ve hesaplamalı bilişsel bilimin kesişme noktasında yatmaktadır. Bundan önce, 2014 yılında Tsinghua Üniversitesi Disiplinlerarası Bilgi Okulu'ndan lisans derecesi aldı. Microsoft, Facebook ve Baidu araştırma laboratuvarlarında staj yaptı.

Konu: Tek Bir Görüntüden 3B Nesne Yeniden Yapılandırması İçin Bir Nokta Kümesi Oluşturma Ağı (Üç boyutlu nesneleri tek bir görüntüden yeniden yapılandırmak için kullanılan bir nokta bulutu oluşturma ağı)

İçerik paylaşın : Derin sinir ağları aracılığıyla 3B verilerin oluşturulması, akademide giderek daha fazla ilgi görüyor. Mevcut yöntemlerin çoğu, üç bitlik vokseller veya görüntü kümeleri gibi geleneksel üç bitlik veri temsilini kullanır. Bu CVPR makalesinde yazar, tek bir görüntüden doğrudan 3B nokta bulutu koordinatları oluşturmaya ve 3B yeniden yapılandırma gerçekleştirmeye çalıştı. Yazar, problem için karşılık gelen sinir ağı mimarisini, kayıp işlevini ve öğrenme paradigmasını tasarladı. Deneysel sonuçlar, önerilen yöntemin iyi performansını da kanıtlamaktadır.

Alibaba Yapay Zeka Laboratuvarı'nda kıdemli algoritma mühendisi olan Wang Yang. 2014 yılında Çin Elektronik Bilimi ve Teknolojisi Üniversitesi Elektronik Mühendisliği Okulu'ndan, araştırma ilgi alanlarının sinyal ve bilgi işlemeden mezun oldu. Alibaba'ya aynı yıl katıldı ve art arda veri madenciliği, makine öğrenimi, bilgisayar görüşü vb. İle uğraştı ve şu anki araştırma ilgi alanları hedef algılama ve izleme, anlamsal bölümleme ve derin ağ sıkıştırma ve hızlandırma.

Konu: Sahne Etiketleme için Bağlamsal Dikkat Temelli Bellek Ağları (sahne etiketlemede bağlamsal dikkat mekanizması bellek ağının uygulanması)

İçerik paylaşın : Sahne etiketlemenin çözmeyi amaçladığı sorun, bir görüntünün her bir pikselinin kategorisini tahmin etmektir.Aslında bu, bir diziden diziye tahmin görevi olarak değerlendirilebilir. Bu nedenle, ilgili bağlam bilgisinin tam olarak nasıl kullanılacağı, etiketlemenin etkisini iyileştirmenin anahtarıdır. Bir Epizodik CAMN yöntemi öneriyoruz ve bu yönteme dayanarak, tamamen evrişimli bir sinir ağı (Tam Bağlı Ağ, FCN) ve geri bildirim bağlantılarına sahip dikkat tabanlı bir bellek ağı (Dikkat Temelli Bellek Ağı) tanımlıyoruz. Bağlamsal bilgilerin seçimini ve ayarlamasını gerçekleştirmek için Geri Bildirim Bağlantıları ile). PASCAL Context, SIFT Flow ve PASCAL VOC 2011 ve diğer sahne açıklama veri setlerinde bir dizi değerlendirme yaptık ve iyi sonuçlar elde ettik.

Yang Rui, Şanghay Jiaotong Üniversitesi'nde yüksek lisans öğrencisidir.

Konu: Birden çok ayrıntı düzeyi analizi aracılığıyla video bölümleme (birden çok ayrıntı düzeyi analizine dayalı video bölümleme)

İçerik paylaşın : Video hedef segmentasyonu, videodaki hedef nesnenin her karedeki kontur boyunca segmentasyonunu ifade eder. Çok taneciklikli bir çerçeve kullanmak, videoyu kabadan ince değere doğru şekilde bölümlere ayırabilir. Video segmentasyonu, bir zaman serisi süper piksel işaretleme işlemi olarak anlaşılabilir.Doğru video izleme teknolojisinin yardımıyla, uzamsal-zamansal çoklu örnek öğrenme algoritması, süper pikselleri iki kategoriye ayırabilir ve ardından grafik kesme yöntemini kullanabilir. Nihayetinde doğru segmentasyon elde etmek için piksel düzeyinde hassaslaştırın.

Lin Tianwei, Şangay Jiaotong Üniversitesi Otomasyon Bölümü Bilgisayarla Görme Laboratuvarı'nda yüksek lisans öğrencisidir ve öğretmeni Bay Zhao Xu'dur. Temel olarak bilgisayarla görme, derin öğrenme, video analizi vb. Üzerine odaklanın ve esas olarak video hareket analizi alanında sıralı hareket algılamayı inceleyin.

Konu: Tek atım geçici eylem algılama (Tek atım geçici eylem algılama)

İçerik paylaşın : Sıralı davranış algılama, video dizisindeki zaman aralığını (başlangıç zamanı ve bitiş zamanı dahil) ve eylemin türünü belirlemektir. Yakından ilişkili bir alan, görüntü tabanlı nesne algılamadır Nesne algılama, uzunluk ve genişlik dahil olmak üzere bir görüntüdeki bir nesnenin konumunu algılamaktır, sıralı davranış algılaması ise yalnızca eylemin zaman boyutundaki konumunu belirlemelidir. . Bu makale ACM multimedya 2017'ye gönderildi

Wang Minsi, Shanghai Jiaotong Üniversitesi'nde doktora öğrencisi.

Konu: Kolektif Aktivite Tanıma için Etkileşim Bağlamının Tekrarlayan Modellemesi (grup davranışı tanıma için interaktif bilginin yinelemeli modellemesi)

İçerik paylaşın : Grup davranışı tanıma, sahnedeki tüm kalabalığın davranışını değerlendirmeyi amaçlar. Grup davranışı genellikle, tek bir kişinin hareket bilgileri, yerel bir gruptaki insanlar arasındaki etkileşim bilgileri ve yerel gruplar ve gruplar arasındaki etkileşim bilgileri dahil olmak üzere çoklu etkileşim bilgisi düzeylerini (Etkileşim Bağlamı) içerir. Bu fenomene yanıt olarak, makale çok seviyeli tekrarlayan sinir ağına dayalı bir grup davranışı tanıma algoritması önermektedir.Algoritma, etkileşimli bilgi modellemesinin her seviyesinde LSTM düğümlerini kullanır ve düşük seviyeli bilgi, yüksek seviyeli bilgi düğümünün girdisi olarak toplanır. , Temel olarak üç farklı LSTM düzeyine ayrılmıştır: kişi düzeyi, grup düzeyi ve sahne düzeyi. Son olarak, çok seviyeli LSTM yapısı sayesinde, seviyeler arası grup davranışı tanıma gerçekleştirilir. Bu yöntem, kolektif faaliyet veri tabanı Collective-Activity'de mevcut çok iyi tanıma doğruluğunu elde etmiştir.

Yukarıdakiler bu etkinliğin kısa bir girişidir.Eğer bildiri gönderimiyle ilgili daha fazla ayrıntı öğrenmek istiyorsanız, lütfen konferansa kaydolun. Ayrıca, bu etkinlik tüm süreç için ücretsizdir ve sitede bir kitap teslim etkinliği vardır.Ödül, son zamanlarda satılan kitap "Derin Öğrenme" dir. Ne için bekliyorsun? Kaydolmak için aşağıdaki etkinlik posterinin QR kodunu tarayın veya kaydolmak için etkinlik bağlantısına tıklayın.

PS4'e özel oyun "Spider-Man"in ulusal versiyonunu piyasaya sürdüğü doğrulandı
önceki
Özel uşak hizmetinden daha samimi! Samsung, merkezi ekran değiştirme hizmetini zorluyor, Samsung Note9 yalnızca 989 yuan'a mal oluyor
Sonraki
Redmi 7 tamam! Lei Jun: Redmi 7'nin fiyatı yedi veya sekiz yüz yuan. Ne tür önerileriniz var?
Tarım Üniversitesi, General Wang Zhen'in bronz heykeline çiçek sepeti takdim töreni düzenledi.
Beklenmedik bir şekilde, yan taraftaki kız Zhao Liying, Kraliçe Fan'ı tutabilir ve Feng Shaofeng'e aşık olabilir mi?
Bu panda gibi güzel olmaya çalışıyorsun
CES2019: Samsung, daha akıllı bir deneyim sunmak için üç robot çıkardı
Zhongnan Jiuchen Hareketli metro girişinde, şehir merkezindeki bungalovlar itilmiş durumda
Yerel olarak sınırlı arama alanına dayalı özellik eşleştirme algoritması
Qualcomm CEO'su Apple'a şantaj için dava açtı: özel siparişlere sahip olmak için "1 milyar" geri ödeme yapılması gerekiyor
"Undercover Superstar", Hong Kong posterinin vaftiz babası Ruan Dayong'un "nehirlere ve göllere geri döndüğünü" abartılı posterleri ortaya çıkarıyor
Liangshan yangınının 31. kurbanı: bütün bir çalışma kaydı yazılmış
Amazon'un AI imparatorluğu, Bezos'un Star Trek yolculuğu
"The Nineteenth Generations of Ancestors" filminde rol alan 33 ünlü, Lin Chiling'in kaosunu Yue Yunpeng'in pembe rüyasına dönüştüren son afişi ortaya koyuyor
To Top