5 akademik genç sizi CVPR, GAIR konferans salonu CVPR Shanghai Jiaotong Üniversitesi özel oturum incelemesini yorumlamaya götürecek

12 Ağustos öğleden sonra, Leifeng.com'un ev sahipliği yaptığı "GAIR Konferans Salonu CVPR Şangay Jiaotong Üniversitesi Özel Oturumu" resmi olarak Şangay Jiao Tong Üniversitesi'nde açıldı. Leifeng.com altında üst düzey bir akademik paylaşım markası olan "GAIR Lecture Hall" un misyonu, yüksek frekanslı çevrimdışı kampüs akademik paylaşım etkinlikleri düzenleyerek akademik uzmanlar, yapay zeka uzmanları ve okul öğrencileri arasında derinlemesine alışverişler sağlamaktır. Bu etkinlik için Leifeng.com, 5 CVPR 2017 ön konuşmacısını makalelerini açıklamaları ve CVPR'ye katılma deneyimlerini paylaşmaları için özel olarak davet etti. Etkinlik gününde, Şanghay Jiaotong Üniversitesi'nden üç profesör yardım etmek için geldi: Bunlar, Elektronik Bilgi ve Elektrik Mühendisliği Fakültesi Dekan Yardımcısı Profesör Yang Xiaokang (bundan böyle "Elektrik Mühendisliği Enstitüsü" olarak anılacaktır), Elektrik Mühendisliği Enstitüsü'nden özel bir araştırmacı ve doktora öğrencisi idi. Elektrik Mühendisliği Okulu'nun yardımcı araştırmacısı Bay Xu Yi'nin yanı sıra, hepsi öğrencileri akademik coşkularından ötürü övmeye geldi. Bu etkinliğin ortak medyası olarak AI Technology Review de tüm süreç boyunca rapora katıldı.

Beş akademik genç:

MIT EECS üçüncü sınıf doktora öğrencisi Wu Jiajun

Wang Yang, Kıdemli Algoritma Mühendisi, Alibaba Yapay Zeka Laboratuvarı

Yang Rui, Yüksek Lisans Öğrencisi, Shanghai Jiaotong Üniversitesi

Lin Tianwei, Yüksek Lisans Öğrencisi, Shanghai Jiaotong Üniversitesi

Şangay Jiaotong Üniversitesi Minsi Wang'da doktora öğrencisi

Bu etkinlik ağırlıklı olarak CVPR 2017 seçilmiş bildirilerin temasına dayanmaktadır.Bazı konuklar, açıklama ve paylaşım için diğer uluslararası akademik konferanslarda seçilen bazı bildirileri de hazırladı. Şimdi yapay zeka teknolojisi inceleme muhabirlerinin sizi hangi içeriği paylaştıklarına götürmesine izin verin.

Etkinliğin başında Şangay Jiaotong Üniversitesi Elektronik Bilgi ve Elektrik Mühendisliği Okulu dekan yardımcısı Profesör Yang Xiaokang bir konuşma yaptı. Profesör Yang Xiaokang, üniversiteye giren GAIR konferans salonunun bir dizi faaliyetine övgü ve onayını ilk kez ifade etti. CVPR hakkında konuşurken şunları söyledi: CVPR şu anda sadece CS alanında popüler değil, aynı zamanda tüm akademik çevrede de büyük bir etkiye sahip CVPR konferansları için makale seçimi çok zor. Profesör Yang Xiaokang, AI'nın küresel yayılmasının mevcut sıcak eğilimine yanıt olarak, öğrencileri ciddiyetle akademisyenlerde iyi bir iş çıkarmanın ve bu çağın fırsatlarını değerlendirmenin yanı sıra, dış dünyanın cazibesine direnmeleri ve sakince düşünmeleri gerektiği konusunda uyardı.

Misafir paylaşım oturumu

Jiajun Wu, yazarı kendisi olmayan çok ilginç bir makaleyi paylaştı: Tek Bir Görüntüden 3D Nesne Yeniden Yapılandırması İçin Bir Nokta Kümesi Oluşturma Ağı (üç boyutlu nesneleri tek bir görüntüden yeniden oluşturmak için kullanılan bir nokta bulutu oluşturma ağı)

Derin sinir ağları çok popülerdir, ancak derin sinir ağları genellikle evrişimli sinir ağları olarak kullanılır.Tek bir resimden üç boyutlu nesneleri kurtarmak ve yeniden yapılandırmak için derin sinir ağlarını kullanmak zor bir sorundur. Görüntü pikseldir, resim üzerinde 400 * 800, 800 * 600 elde edilebilir ancak üç boyutta 128 * 128 * 128'i aşmak zordur. Wu Jiajun, üç boyutlu nesneleri tek bir görüntüden yeniden oluşturmanın zorluğu ile başlıyor ve ardından mevcut bazı yöntemlerin dezavantajlarına gidiyor. Mevcut yöntemlerin çoğu, üç bitlik vokseller veya görüntü kümeleri gibi geleneksel üç bitlik veri temsilini kullanır. Bu CVPR makalesinde yazar, tek bir görüntüden doğrudan 3B nokta bulutu koordinatları oluşturmaya ve 3B yeniden yapılandırma gerçekleştirmeye çalışan yeni bir fikir önerdi. Üç boyutlu nokta bulutu çok yüksek esnekliğe sahiptir ve nesnenin detaylarında çok iyi performans gösterir ve sadece detay performansında nokta bulutlarının sayısını arttırması gerekir. Tezin yazarı, problem için karşılık gelen sinir ağı mimarisini, kayıp fonksiyonunu ve öğrenme paradigmasını tasarladı. Deneysel sonuçlar, önerilen yöntemin iyi performansını da kanıtlamaktadır. Kağıt indirme adresi: https://arxiv.org/pdf/1612.00603.pdf

Ali AI Lab adına Wang Yang, Ali AI Lab tarafından seçilen bir makaleyi paylaştı: Sahne Etiketleme için Bağlamsal Dikkat tabanlı Bellek Ağları (sahne etiketlemede bağlamsal dikkat mekanizması bellek ağının uygulanması)

Sahne etiketlemenin çözmesi gereken sorun, görüntünün her bir pikselinin kategorisini tahmin etmektir.Aslında bu, bir diziden diziye tahmin görevi olarak kabul edilebilir. Bu nedenle, ilgili bağlam bilgisinin tam olarak nasıl kullanılacağı, etiketlemenin etkisini iyileştirmenin anahtarıdır. Ali Yapay Zeka Laboratuvarı tarafından seçilen bu CVPR kağıdı, bir Epizodik CAMN yöntemi önermektedir ve bu yönteme dayanarak, tamamen evrişimli bir sinir ağını (Tam Bağlı Ağ, FCN) ve geri bildirim bağlantısıyla dikkati tanımlamaktadır. Geribildirim Bağlantılı Dikkat Temelli Bellek Ağı, bağlamsal bilgilerin seçimini ve ayarlamasını gerçekleştirmek için birleşik bir çerçeve oluşturur. PASCAL Context, SIFT Flow ve PASCAL VOC 2011 ve diğer sahne açıklama veri setleri üzerinde bir dizi değerlendirme gerçekleştirilmiş ve iyi sonuçlar elde edilmiştir.

Öğrenci Yang Rui, bu yıl CVPR 2017'nin ilk yazarı olarak seçildiği makaleyi paylaştı: Çoklu Granularity Analizi Yoluyla Video Segmentasyonu (Çoklu Granularity Analizi yoluyla Video Segmentasyonu). Etkinlikte kendini tanıttı ve Wu Jiajunun yayınından pek çok ilham geldi Makale ve ikisi, makalenin içeriğinin ayrıntılarını da tartıştılar.

Yang Rui, video hedef bölümlemenin tanımını açıklamaya başladı.Video hedef bölümleme, videodaki hedef nesnenin arka plandan, her çerçevedeki nesnenin dış çizgisi boyunca piksel düzeyinde bölümlenmesini ifade eder. Çok taneli bir çerçeve, kabadan inceye uyarlanabilir. Videoyu tam olarak bölümlere ayırın. Esas olan, görüntü bölümleme ve video izleme görevlerinin birleşimidir. Video segmentasyonu, bir zaman serisi süper piksel işaretleme işlemi olarak anlaşılabilir.Doğru video izleme teknolojisinin yardımıyla, uzamsal-zamansal çoklu örnek öğrenme algoritması, süper pikselleri iki kategoriye ayırabilir ve ardından grafik kesme yöntemini kullanabilir. Nihayetinde doğru segmentasyon elde etmek için piksel düzeyinde hassaslaştırın. Aynı zamanda, geleneksel video hedef bölümleme yöntemi ve video bulanıklığı, tıkanma, deformasyon ve aydınlatma gibi yeni yöntemin karşılaştığı zorluklardan da bahsetti.

Lin Tianwei, ACM Multimedia 2017: Single Shot Temporal Action Detection'a (zaman serisi evrişimli ağa dayalı bir video eylem algılama yöntemi) gönderilen bir makaleyi paylaştı ve CVPR tarafından düzenlenen iki ActivityNet Challenge 2017'yi elde etmek için makalede belirtilen yöntemi kullandı. şampiyon.

Lin Tianwei ilk önce video sınıflandırması ile görüntü sınıflandırması arasında kabaca bir karşılaştırma yaptı. Görüntü sınıflandırmanın amacı, resmi etiketlemek, sadece hedef türünü değil, aynı zamanda hedef konumu da etiketlemektir. Video sınıflandırması, sıralı eylem tespiti sorunu olan kısa bir video klip için eylem analizi gerektirir. Pratikte bir video genellikle çok uzundur Makalede incelenen eylem sadece küçük bir bölümdür.Küçük bir segment de birçok eylem segmenti içerebilir.Bu nedenle, yalnızca eylem türünü değil aynı zamanda eylemin başlangıç ve bitiş zamanını da algılaması umulur. . Değerlendirme süreci sadece tahmin edilen eylem türünün doğru olup olmadığına bağlı değildir, aynı zamanda tahmin edilen eylem segmenti ile gerçek segment arasındaki örtüşme oranını da karşılaştırır. Yalnızca örtüşme oranı önceden belirlenmiş belirli bir değerden yüksek olduğunda, tahmin doğru kabul edilir.

Özet olarak, sıralı davranış algılama, video dizisindeki zaman aralığını (başlangıç zamanı ve bitiş zamanı dahil) ve eylemin türünü belirlemektir. Yakından ilişkili bir alan, görüntü tabanlı nesne algılamadır Nesne algılama, uzunluk ve genişlik dahil olmak üzere bir görüntüdeki bir nesnenin konumunu algılamaktır, sıralı davranış algılaması ise yalnızca eylemin zaman boyutundaki konumunu belirlemelidir. .

Wang Minsi, bu yıl CVPR 2017'ye katkıda bulunduğu makaleyi paylaştı: Kolektif Etkinlik Tanıma için Etkileşim Bağlamının Tekrarlayan Modellemesi (grup davranışını tanıma için insan bedenleri arasındaki etkileşimin yinelemeli modellemesi)

Wang Minsi, grup davranışının popüler bir tanımını yaptı. İki veya daha fazla kişinin birlikte tamamlamasını gerektiren davranış kalıbına grup davranışı denir. Grup davranışı tanıma, sahnedeki tüm kalabalığın davranışını yargılamaktır. Grup davranışı genellikle, tek bir kişinin hareket bilgileri, yerel bir gruptaki insanlar arasındaki etkileşim bilgileri ve yerel gruplar ve gruplar arasındaki etkileşim bilgileri dahil olmak üzere çoklu etkileşim bilgisi düzeylerini (Etkileşim Bağlamı) içerir. Bu fenomene yanıt olarak, makale çok seviyeli tekrarlayan sinir ağına dayalı bir grup davranışı tanıma algoritması önermektedir.Algoritma, etkileşimli bilgi modellemesinin her seviyesinde LSTM düğümlerini kullanır ve düşük seviyeli bilgi, yüksek seviyeli bilgi düğümünün girdisi olarak toplanır. , Temel olarak üç farklı LSTM düzeyine ayrılmıştır: kişi düzeyi, grup düzeyi ve sahne düzeyi. Son olarak, çok seviyeli LSTM yapısı sayesinde, seviyeler arası grup davranışı tanıma gerçekleştirilir. Bu yöntem, kolektif faaliyet veri tabanı Collective-Activity'de mevcut çok iyi tanıma doğruluğunu elde etmiştir.

Aktivite sitesi

Aktivite saati yaz tatili için planlanmış ve hafta sonu zamanı gelmiş olsa da yine de kağıt paylaşımını dinlemek için siteye gelen çok sayıda öğrenci var. Birçoğu Şangay Teknoloji Enstitüsü ve Fudan Üniversitesi gibi yakındaki üniversitelerden geldi. Ayrıca hafta sonunu çalışmaya gelmek için kullanan tanınmış internet şirketlerinden teknik personel de var. Yerinde yapılan sorgulama oturumu da herkesten sıcak tepkiler aldı.

Kolejler ve üniversitelerdeki GAIR konferans salonu etkinlikler dizisi yapılmaya devam edecek, Harbin Teknoloji Enstitüsü Shenzhen özelliğinin bir sonraki durağı 26 Ağustos öğleden sonra Harbin Teknoloji Enstitüsü'nde yapılacak. AI Technology Review muhabirleri, konuklar tarafından paylaşılan kuru ürünler ve etkinlikteki bazı durumlar hakkında rapor vermeye devam edecek. Etkinliğin yapıldığı şehrin içinde veya yakınında olursanız, gelip bizzat dinleseniz de, bundan bir şeyler kazanacağınıza inanıyorum. Şu anda, "GAIR Ders Salonu-CVPR Harbin Teknoloji Enstitüsü Shenzhen Özel" etkinliği kayıtlar açtı, herkes kaydolabilir.

Etkinlik adresi: https://www.leiphone.com/activity/view/id/3

"Yeni Ürün Ekspresi" Texas Instruments, Çin Versiyonu Robot Öğrenme Kiti RSLK'yı Yayınladı
önceki
"Sekiro" 22 Mart 2019'da piyasaya sürülecek Koleksiyon sürüm içeriği ortaya çıktı
Sonraki
Akıllı telefon pazarı büyük dalgalar yaşayacak ve 5G çağında ilk sırada yer alacak olan kumu ovacak
"Domuz" kutsamalarıyla dolu: Bahar Şenliği için en iyi hediye, uygun maliyetli bir akıllı telefon önerisi
Güvenli sürüş için sıfır tolerans mı? Görme ile ilk deneyim, Subaru'nun üçüncü nirvanası
Huba yeni yılı karşılamak için iblis grubuyla aptalca dans ediyor Jolin Tsai, iblisler dünyasındaki ilk sıcak adamı itiraf ediyor
Gartner, 2017 teknoloji olgunluk eğrisini ve giderek daha belirgin hale gelen teknoloji "küçük vakum dönemi" ni yayınladı
"Gintama" bitmek üzere, neden inanmıyorum?
ARM Microcontroller-AET'e Dayalı Uçuş Veri Kaydedici Tasarımı
Arabanızda "T" harfi var mı? Bu kompakt sedan sandalyeleri satın alın ve tüm yüze sahip olun
"İkinci Nesil Peri: Neyse ki Bu Hayatta" şu anda gösteriliyor
Oyun Karakter Popülerliği Genel Seçim İlk 8 Nakavt Raporu
Changsha Metro şeftali çiçeği tarlasında "haklı" ve tadı şiirle dolu değil
Büyük Veri Platformu-AET Bazında Elektrikli Isıtma Gücü Tüketiminin Tahmin ve Analizi
To Top