Envanter etkisi bilgisayar vizyonu ResNet'ten AlexNet'e Top100 belgeleri

1 Yeni Zhiyuan derlemesi

Kaynak: github

Derleyin ve düzenleyin: Xinzhiyuan Yazı İşleri Departmanı

Xin Zhiyuan Rehberi Bilgisayar görüşü, son yıllarda büyük bir gelişme kaydetti ve derin öğrenmenin en ileri araştırma yönünü temsil ediyor. Bu makale, 2012'den 2017'ye kadar bilgisayar görüşü alanındaki başlıca olayları sıralıyor: esas olarak kağıtlar ve diğer kuru mal kaynakları ve kaynak adresini ekleyin. ImageNet sınıflandırması, nesne algılama, nesne izleme, nesne tanıma, görüntü ve dil ve görüntü oluşturma olarak ayrılmış yüzlerce belge içerir.

Bu yılın Şubat ayında, Xinzhiyuan, optimizasyon / eğitim yöntemlerini, denetimsiz / üretken modelleri, evrişimli ağ modellerini ve görüntü segmentasyonu / hedef tespiti vb. İçeren son 5 yılda en çok alıntı yapılan 100 derin öğrenme belgesini tanıttı. On alt alan.

[Xinzhiyuan'ın resmi hesabını girin, bu klasik bilgiyi indirmek için iletişim kutusuna "Kağıt 100" girin]

Yukarıda bahsedilen derin öğrenmeyle ilgili en çok alıntı yapılan 100 makale Github'da açık kaynaklı bir projedir ve topluluğun tüm üyeleri katılabilir. Bu projede, son yıllarda sahada en fazla etkiye sahip olan makale, kitap ve blogların bir özetini içeren bilgisayar vizyonu kaynakları üzerine bir proje olan Deep Vision adlı başka bir proje bulduk. Bunların arasında, kağıt bölümünde yazar ayrıca ImageNet sınıflandırması, nesne algılama, nesne izleme, nesne tanıma, görüntü ve dil ve görüntü oluşturma olarak ikiye ayrılır.

Klasik kağıtlar

ImageNet sınıflandırması

Nesne algılama

Nesne izleme

Düşük düzey görme

  • Süper çözünürlük

  • diğer uygulamalar

Kenar algılama

Anlamsal bölümleme

Görsel dikkat ve belirginlik

Nesne tanıma

İnsan vücudu poz tahmini

CNN ilkesi ve doğası (CNN'i Anlamak)

Görüntü ve dil

  • Resim açıklaması

  • Video yorumu

  • Soru-Cevap

Görüntü oluşturma

Yukarıdakiler, bu makalelerin, yazarların ve kurumların bazı anahtar kelimelerine dayanan bir ısı haritasıdır.

ImageNet sınıflandırması

Resim kaynağı: AlexNet kağıdı

  • Microsoft ResNet

Kağıt: Görüntü Tanıma için Derin Artık Ağ

Yazar: Ho Kai Ming, Zhang Xiang Yu ve Sun Jian Ren Shaoqing

  • Microsoft PRelu (rastgele düzeltilmiş doğrusal birim / ağırlık başlatma)

Kağıt: Derin Öğrenme Doğrultucu: ImageNet Sınıflandırmasında İnsan Seviyesini Aşmak

Yazar: Ho Kai Ming, Zhang Xiang Yu ve Sun Jian Ren Shaoqing

Bağlantı: https://arxiv.org/pdf/1502.01852.pdf

  • Google Toplu Normalleştirme

Kağıt: Toplu Normalleştirme: Dahili Değişkenleri Azaltarak Derin Ağ Eğitimini Hızlandırma

Yazar: Sergey Ioffe, Christian Szegedy

Bağlantı: https://arxiv.org/pdf/1502.03167.pdf

  • Google GoogLeNet

Makale: Deeper Convolution, CVPR 2015

Yazar: Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich

Bağlantı: https://arxiv.org/pdf/1409.4842.pdf

  • Oxford VGG-Net

Makale: Büyük Ölçekli Görsel Tanıma Alanında Çok Derin Evrişimli Ağlar, ICLR 2015

Yazar: Karen Simonyan ve Andrew Zisserman

Bağlantı: https://arxiv.org/pdf/1409.1556.pdf

  • AlexNet

Kağıt: Derin evrişimli sinir ağları kullanan ImageNet sınıflandırması

Yazar: Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton

Nesne algılama

Görüntü kaynağı: Daha hızlı RCNN kağıdı

  • PVANET

Kağıt: Gerçek Zamanlı Nesne Algılama için Derin Ama Hafif Sinir Ağları (PVANET: Gerçek Zamanlı Nesne Algılama için Derin ama Hafif Sinir Ağları)

Yazar: Kye-Hyeon Kim, Sanghoon Hong, Byungseok Roh, Yeongjae Cheon, Minje Park

Bağlantı: https://arxiv.org/pdf/1608.08021

  • New York Üniversitesi OverFeat

Makale: Tanıma, Yerelleştirme ve Algılama için Evrişimli Ağları Kullanma (OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks), ICLR 2014

Yazar: Pierre Sermanet, David Eigen, Xiang Zhang, Michael Mathieu, Rob Fergus, Yann LeCun

Bağlantı: https://arxiv.org/pdf/1312.6229.pdf

  • Berkeley R-CNN

Kağıt: Doğru nesne algılama ve anlamsal bölümleme için zengin özellik hiyerarşileri (Doğru nesne algılama ve anlamsal bölümleme için zengin özellik hiyerarşileri), CVPR 2014

Yazar: Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik

Bağlantı:

  • Microsoft SPP

Makale: Görsel Tanıma için Derin Evrişimli Ağlarda Uzamsal Piramit Havuzlaması, ECCV 2014

Yazar: Ho Kai Ming, Zhang Xiang Yu ve Sun Jian Ren Shaoqing

Bağlantı: https://arxiv.org/pdf/1406.4729.pdf

  • Microsoft Hızlı R-CNN

Kağıt: Hızlı R-CNN

Yazar: Ross Girshick

Bağlantı: https://arxiv.org/pdf/1504.08083.pdf

  • Microsoft Daha Hızlı R-CNN

Kağıt: RPN ile Gerçek Zamanlı Nesne Algılamaya Doğru (Daha Hızlı R-CNN: Bölge Teklif Ağlarıyla Gerçek Zamanlı Nesne Algılamaya Doğru)

Yazarlar: Ren Shaoqing, Ho Kai Ming, Ross Girshick, Sun Jian

Bağlantı: https://arxiv.org/pdf/1506.01497.pdf

  • Oxford Üniversitesi R-CNN eksi R

Kağıt: R-CNN eksi R

Yazar: Karel Lenc, Andrea Vedaldi

Bağlantı: https://arxiv.org/pdf/1506.06981.pdf

  • Uçtan uca yaya algılama

Kağıt: Kalabalık Ortamlarda Uçtan Uca İnsan Algılama

Yazar: Russell Stewart, Mykhaylo Andriluka

Bağlantı: https://arxiv.org/pdf/1506.04878.pdf

  • Gerçek zamanlı nesne algılama

Kağıt: Yalnızca Bir Kez Bakarsınız: Birleşik, Gerçek Zamanlı Nesne Algılama

Yazar: Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi

Bağlantı: https://arxiv.org/pdf/1506.02640.pdf

  • İç-Dış Net

Makale: Atlama Havuzlama ve Tekrarlayan Sinir Ağları ile Bağlamdaki Nesneleri Algılama (İç-Dış Ağ: Atlama Havuzlama ve Tekrarlayan Sinir Ağları ile Bağlamdaki Nesneleri Algılama)

Yazar: Sean Bell, C. Lawrence Zitnick, Kavita Bala, Ross Girshick

Bağlantı: https://arxiv.org/abs/1512.04143.pdf

  • R-FCN

Belge: Bölge Tabanlı Tamamen Evrişimli Ağlar aracılığıyla Nesne Tanıma (R-FCN: Bölge Tabanlı Tamamen Evrişimli Ağlar aracılığıyla Nesne Algılama)

Yazar: Nesil zirve sezonu, Li Yi, Ho Kai Ming, Sun Jian

Bağlantı: https://arxiv.org/abs/1605.06409

  • SSD

Kağıt: Tek Atış Çoklu Kutu Dedektörü (SSD: Tek Atış Çoklu Kutu Dedektörü)

Yazar: Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg

Bağlantı: https://arxiv.org/pdf/1512.02325v2.pdf

  • Hız / doğruluk değiş tokuşu

Kağıt: Modern evrişimli nesne dedektörleri için hız / doğruluk değiş tokuşları

Yazar: Jonathan Huang, Vivek Rathod, Chen Sun, Menglong Zhu, Anoop Korattikara, Alireza Fathi, Ian Fischer, Zbigniew Wojna, Yang Song, Sergio Guadarrama, Kevin Murphy

Bağlantı: https://arxiv.org/pdf/1611.10012v1.pdf

Nesne izleme

Makale: Konvolüsyonel Sinir Ağı ile Ayrımcı Belirginlik Haritası Öğrenerek Çevrimiçi İzleme (Konvolüsyonel Sinir Ağı ile Ayrımcı Belirginlik Haritası Öğrenerek Çevrimiçi İzleme)

Yazar: Seunghoon Hong, Tackgeun You, Suha Kwak, Bohyung Han

Adres: arXiv: 1502.06796.

Makale: DeepTrack: Görsel İzleme için Evrişimli Sinir Ağları ile Ayrımcı Özellik Temsillerinin Öğrenilmesi (DeepTrack: Görsel İzleme için Konvolüsyonel Sinir Ağları Tarafından Ayrımcı Özellik Temsillerinin Öğrenilmesi)

Yazarlar: Hanxi Li, Yi Li ve Fatih Porikli

Yayın: BMVC, 2014.

Bildiri: Görsel İzleme için Derin Kompakt Görüntü Temsili Öğrenmek

Yazar: N Wang, DY Yeung

Yayınlandı: NIPS, 2013.

Belge: Görsel İzleme için Hiyerarşik Evrişimli Özellikler

Yazarlar: Chao Ma, Jia-Bin Huang, Xiaokang Yang ve Ming-Hsuan Yang

Yayınlanma Tarihi: ICCV 2015

Kağıt: Tamamen Evrişimli Ağlarla Görsel İzleme

Yazar: Lijun Wang, Wanli Ouyang, Xiaogang Wang ve Huchuan Lu,

Yayınlanma Tarihi: ICCV 2015

Kağıt: Görsel izleme için çok alanlı evrişimli sinir ağını öğrenme

(Görsel İzleme için Çok Alanlı Evrişimli Sinir Ağlarını Öğrenme)

Yazar: Hyeonseob Namand Bohyung Han

Nesne tanıma

Kağıt: Evrişimli sinir ağları ile zayıf denetimli öğrenme

Yazar: Maxime Oquab, Leon Bottou, Ivan Laptev, Josef Sivic, CVPR, 2015

Bağlantı:

FV-CNN

Kağıt: Doku Tanıma ve Segmentasyon için Derin Filtre Bankaları

Yazar: Mircea Cimpoi, Subhransu Maji, Andrea Vedaldi, CVPR, 2015.

Bağlantı:

İnsan Duruşu Tahmini

Kağıt: Parça Benzeşme Alanlarını Kullanarak Gerçek Zamanlı Çok Kişili 2D Poz Tahmini

Yazar: Zhe Cao, Tomas Simon, Shih-En Wei ve Yaser Sheikh, CVPR, 2017.

Kağıt: Derin kesme: Çok kişili poz tahmini için ortak alt küme bölümü ve etiketleme (Derin kesim: Çok kişili poz tahmini için ortak alt küme bölümü ve etiketleme)

Yazar: Leonid Pishchulin, Eldar Insafutdinov, Siyu Tang, Bjoern Andres, Mykhaylo Andriluka, Peter Gehler ve Bernt Schiele, CVPR, 2016.

Kağıt: Evrişimli poz makineleri

Yazar: Shih-En Wei, Varun Ramakrishna, Takeo Kanade ve Yaser Sheikh, CVPR, 2016.

Kağıt: İnsan poz tahmini için yığılmış kum saati ağları (İnsan poz tahmini için yığılmış kum saati ağları)

Yazar: Alejandro Newell, Kaiyu Yang ve Jia Deng, ECCV, 2016.

Kağıt: Videolarda insan pozu tahmini için akan konvnetler (Videolarda insan pozu tahmini için akan konvnetler)

Yazar: Tomas Pfister, James Charles ve Andrew Zisserman, ICCV, 2015.

Kağıt: Evrişimli bir ağın ortak eğitimi ve insan pozu tahmini için grafiksel bir model

Yazar: Jonathan J.Tompson, Arjun Jain, Yann LeCun, Christoph Bregler, NIPS, 2014.

CNN'i Anlamak

Kağıt: Eşdeğerlik ve eşdeğerliklerini ölçerek görüntü temsillerini anlama

Yazar: Karel Lenc, Andrea Vedaldi, CVPR, 2015.

Bağlantı:

Kağıt: Derin Sinir Ağları Kolayca Kandırılır: Tanınmayan Görüntüler İçin Yüksek Güvenle Tahminler (Derin Sinir Ağları Kolayca Kandırılır: Tanınmayan Görüntüler İçin Yüksek Güvenle Tahminler)

Yazar: Anh Nguyen, Jason Yosinski, Jeff Clune, CVPR, 2015.

Bağlantı:

Kağıt: Derin Görüntü Temsillerini Ters Çevirerek Anlamak

Yazar: Aravindh Mahendran, Andrea Vedaldi, CVPR, 2015

Bağlantı:

Kağıt: Nesne Dedektörleri Derin Sahne CNN'lerinde Ortaya Çıkıyor

Yazar: Bolei Zhou, Aditya Khosla, Agata Lapedriza, Aude Oliva, Antonio Torralba, ICLR, 2015.

Kağıt: Evrişimli Ağlarla Görsel Temsilleri Tersine Çevirme

Yazar: Alexey Dosovitskiy, Thomas Brox, arXiv, 2015.

Belge: Evrişimli Ağları Görselleştirme ve Anlama

Yazar: Matthrew Zeiler, Rob Fergus, ECCV, 2014.

Bağlantı: https://www.cs.nyu.edu/~fergus/papers/zeilerECCV2014.pdf

Görüntü ve dil

Resim Yazısı

Resim: (Andrej Karpathy, Li Fei-Fei'den, Görüntü Tanımı Oluşturmak İçin Derin Görsel-Anlamsal Hizalamalar, CVPR, 2015.)

UCLA / Baidu

Multimodal Tekrarlayan Sinir Ağları ile Görüntüleri Açıklayın

Junhua Mao, Wei Xu, Yi Yang, Jiang Wang, Alan L. Yuille, arXiv: 1410.1090

Toronto

Görsel-Anlamsal Gömmeleri Multimodal Sinir Dili Modelleriyle Birleştirme

Ryan Kiros, Ruslan Salakhutdinov, Richard S.Zemel, arXiv: 1411.2539.

Berkeley

Görsel Tanıma ve Tanımlama için Uzun Süreli Tekrarlayan Evrişimli Ağlar (Görsel Tanıma ve Tanımlama için Uzun Süreli Tekrarlayan Evrişimli Ağlar)

Jeff Donahue, Lisa Anne Hendricks, Sergio Guadarrama, Marcus Rohrbach, Subhashini Venugopalan, Kate Saenko, Trevor Darrell, arXiv: 1411.4389.

Google

Resimlere bakın ve kelimeler yazın: Göster ve Anlat: Bir Sinirsel Görüntü Başlığı Oluşturucu

Oriol Vinyals, Alexander Toshev, Samy Bengio, Dumitru Erhan, arXiv: 1411.4555.

Stanford

Görüntü Açıklaması Oluşturmak için Derin Görsel-Anlamsal Hizalamalar (Görüntü Açıklaması Oluşturmak İçin Derin Görsel-Anlamsal Hizalamalar)

Andrej Karpathy, Li Fei-Fei, CVPR, 2015.

UML / UT

Tekrarlayan Derin Sinir Ağlarını Kullanarak Videoları Doğal Dile Çevirme

Subhashini Venugopalan, Huijuan Xu, Jeff Donahue, Marcus Rohrbach, Raymond Mooney, Kate Saenko, NAACL-HLT, 2015.

CMU / Microsoft

Resim Yazısı Oluşturma için Tekrarlayan Görsel Temsili Öğrenme

Xinlei Chen, C. Lawrence Zitnick, arXiv: 1411.5654.

Xinlei Chen, C. Lawrence Zitnick, Zihin Gözü: Resim Yazısı Üretimi için Tekrarlayan Görsel Temsil, CVPR 2015

Microsoft

Altyazılardan Görsel Kavramlara ve Geri

Hao Fang, Saurabh Gupta, Forrest Iandola, Rupesh Srivastava, Li Deng, Piotr Dollár, Jianfeng Gao, Xiaodong He, Margaret Mitchell, John C. Platt, C. Lawrence Zitnick, Geoffrey Zweig, CVPR, 2015.

Üniv. Montreal / Üniv. Toronto

Göster, Katıl ve Söyle: Görsel Katılım ve Söyle: Görsel Dikkatle Nöral Görüntü Altyazısı Oluşturma

Kelvin Xu, Jimmy Lei Ba, Ryan Kiros, Kyunghyun Cho, Aaron Courville, Ruslan Salakhutdinov, Richard S.Zemel, Yoshua Bengio, arXiv: 1502.03044 / ICML 2015

Idiap / EPFL / Facebook

Cümle Tabanlı Resim Yazısı

Remi Lebret, Pedro O. Pinheiro, Ronan Collobert, arXiv: 1502.03671 / ICML 2015

UCLA / Baidu

Çocuk gibi öğrenmek: Çocuk Gibi Öğrenme: Görsellerin Cümle Tanımlarından Öğrenme Hızlı Roman Görsel Kavram

Junhua Mao, Wei Xu, Yi Yang, Jiang Wang, Zhiheng Huang, Alan L. Yuille, arXiv: 1504.06692

MS + Berkeley

Resim Yazısı İçin En Yakın Komşu Yaklaşımlarını Keşfetme

Jacob Devlin, Saurabh Gupta, Ross Girshick, Margaret Mitchell, C. Lawrence Zitnick, arXiv: 1505.04467

Resim Yazısı İçin Dil Modelleri: Tuhaflıklar ve İşe Yarayanlar

Jacob Devlin, Hao Cheng, Hao Fang, Saurabh Gupta, Li Deng, Xiaodong He, Geoffrey Zweig, Margaret Mitchell, arXiv: 1505.01809

Adelaide

Ara Nitelikler Katmanı ile Resim Yazısı

Qi Wu, Chunhua Shen, Anton van den Hengel, Lingqiao Liu, Anthony Dick, arXiv: 1506.01144

Tilburg

Resimlerle dil öğrenmek

Grzegorz Chrupala, Akos Kadar, Afra Alishahi, arXiv: 1506.03694

Montreal Üniversitesi

Dikkat Temelli Kodlayıcı-Kod Çözücü Ağlarını kullanarak multimedya içeriğini tanımlama (Dikkat Temelli Kodlayıcı-Kod Çözücü Ağlarını Kullanarak Multimedya İçeriğini Tanımlama)

Kyunghyun Cho, Aaron Courville, Yoshua Bengio, arXiv: 1507.01053

Cornell

Sinirsel Görüntü Yazımında Görüntü Temsilleri ve Yeni Etki Alanları

Jack Hessel, Nicolas Savva, Michael J. Wilber, arXiv: 1508.02091

HongKong MS + Şehir Üniv.

Sıralama Kanonik Korelasyon Analizi ile Sorgu ve Görüntü Benzerliklerini Öğrenmek

Ting Yao, Tao Mei ve Chong-Wah Ngo, ICCV, 2015

Video Altyazı

Berkeley

Jeff Donahue, Lisa Anne Hendricks, Sergio Guadarrama, Marcus Rohrbach, Subhashini Venugopalan, Kate Saenko, Trevor Darrell, Long-term Recurrent Convolutional Networks for Visual Recognition and Description, CVPR, 2015.

Utah / UML / Berkeley

Subhashini Venugopalan, Huijuan Xu, Jeff Donahue, Marcus Rohrbach, Raymond Mooney, Kate Saenko, Derin Tekrarlayan Sinir Ağlarını Kullanarak Videoları Doğal Dile Çevirmek, arXiv: 1412.4729.

Microsoft

Yingwei Pan, Tao Mei, Ting Yao, Houqiang Li, Yong Rui, Ortak Modelleme Gömme ve Köprü Video ve Diline Çeviri, arXiv: 1505.01861.

Utah / UML / Berkeley

Subhashini Venugopalan, Marcus Rohrbach, Jeff Donahue, Raymond Mooney, Trevor Darrell, Kate Saenko, Sequence to Sequence - Video to Text, arXiv: 1505.00487.

Montreal Üniversitesi / Sherbrooke

Li Yao, Atousa Torabi, Kyunghyun Cho, Nicolas Ballas, Christopher Pal, Hugo Larochelle, Aaron Courville, Zamansal Yapıyı Kullanarak Videoların Açıklanması, arXiv: 1502.08029

MPI / Berkeley

Anna Rohrbach, Marcus Rohrbach, Bernt Schiele, The Long-Short Story of Movie Description, arXiv: 1506.01698

Toronto Üniversitesi / MIT

Yukun Zhu, Ryan Kiros, Richard Zemel, Ruslan Salakhutdinov, Raquel Urtasun, Antonio Torralba, Sanja Fidler, Aligning Books and Movies: Towards Story-like Visual Explanations by Movie Watching Books Books, arXiv: 1506.06724

Montreal Üniversitesi

Kyunghyun Cho, Aaron Courville, Yoshua Bengio, Dikkat Temelli Kodlayıcı-Kod Çözücü Ağlarını Kullanarak Multimedya İçeriğini Tanımlama, arXiv: 1507.01053

TAU / Güney Kaliforniya Üniversitesi

Dotan Kaufman, Gil Levi, Tal Hassner, Lior Wolf, Video Ek Açıklama ve Özetleme için Geçici Mozaikleme, arXiv: 1612.06950.

Görüntü oluşturma

Evrişimli / tekrarlayan ağ

Kağıt: PixelCNN Kod Çözücülerle Koşullu Görüntü Oluşturma "

Yazar: Aäron van den Oord, Nal Kalchbrenner, Oriol Vinyals, Lasse Espeholt, Alex Graves, Koray Kavukcuoğlu

Makale: Evrişimli Sinir Ağları ile Sandalye Oluşturmayı Öğrenmek

Yazar: Alexey Dosovitskiy, Jost Tobias Springenberg, Thomas Brox

Yayınlandı: CVPR, 2015.

Kağıt: ÇİZİM: Görüntü Oluşturma İçin Tekrarlayan Bir Sinir Ağı

Yazar: Karol Gregor, Ivo Danihelka, Alex Graves, Danilo Jimenez Rezende, Daan Wierstra

Yayınlandı: ICML, 2015.

Yüzleşme Ağı

Makale: Generative Adversarial Networks

Yazar: Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio

Yayınlandı: NIPS, 2014.

Makale: Bir Laplacian Düşman Ağları Piramidi kullanan Derin Üretken Görüntü Modelleri (Laplacian Düşman Ağları Piramidi kullanan Derin Üretken Görüntü Modelleri)

Yazarlar: Emily Denton, Soumith Chintala, Arthur Szlam, Rob Fergus

Yayınlandı: NIPS, 2015.

Kağıt: Üretken modellerin değerlendirilmesine ilişkin bir not

Yazar: Lucas Theis, Aäron van den Oord, Matthias Bethge

Yayınlanma tarihi: ICLR 2016.

Kağıt: Değişken Olarak Otomatik Kodlanmış Derin Gauss Süreçleri (Değişken Olarak Otomatik Kodlanmış Derin Gauss Süreçleri)

Yazar: Zhenwen Dai, Andreas Damianou, Javier Gonzalez, Neil Lawrence

Yayınlanma tarihi: ICLR 2016.

Tez: Dikkat mekanizmasını kullanarak Başlıklardan Dikkat Çekerek Görüntü Oluşturma

Yazar: Elman Mansimov, Emilio Parisotto, Jimmy Ba, Ruslan Salakhutdinov

Yayınlanma Tarihi: ICLR 2016

Makale: Kategorik Üretken Çekişmeli Ağlar ile Denetimsiz ve Yarı Denetimli Öğrenme

Yazar: Jost Tobias Springenberg

Yayınlanma Tarihi: ICLR 2016

Makale: Bir Düşmanla Temsilleri Sansürlemek

Yazar: Harrison Edwards, Amos Storkey

Yayınlanma Tarihi: ICLR 2016

Kağıt: Sanal Tartışmalı Eğitim ile Dağıtımsal Düzeltme

Yazar: Takeru Miyato, Shin-ichi Maeda, Masanori Koyama, Ken Nakae, Shin Ishii

Yayınlanma Tarihi: ICLR 2016

Kağıt: Doğal Görüntü Manifoldunda Üretken Görsel Manipülasyon

Yazar: Zhu Junyan, Philipp Krahenbuhl, Eli Shechtman ve Alexei A. Efros

Yayınlanma tarihi: ECCV 2016.

Bildiri: Derin Evrişimli Üretken Çekişmeli Ağlar ile Denetimsiz Temsil Öğrenimi

Yazar: Alec Radford, Luke Metz, Soumith Chintala

Yayınlanma Tarihi: ICLR 2016

soru cevap

Resim: (Stanislaw Antol, Aishwarya Agrawal, Jiasen Lu, Margaret Mitchell, Dhruv Batra, C. Lawrence Zitnick, Devi Parikh, VQA: Görsel Soru Cevaplama, CVPR, 2015 SUNw: Sahne Anlama atölyesi)

Virginia Üniversitesi / Microsoft Araştırmaları

Bildiri: VQA: Görsel Soru Cevaplama, CVPR, 2015 SUNw: Sahne Anlama atölyesi.

Yazar: Stanislaw Antol, Aishwarya Agrawal, Jiasen Lu, Margaret Mitchell, Dhruv Batra, C. Lawrence Zitnick, Devi Parikh

MPI / Berkeley

Bildiri: Nöronlarınıza Sorun: Görüntüler Hakkındaki Soruları Yanıtlamaya Nöral Temelli Bir Yaklaşım

Yazarlar: Mateusz Malinowski, Marcus Rohrbach, Mario Fritz,

Sürüm: arXiv: 1505.01121.

Toronto

Bildiri: Görüntü Soru Cevaplama: Görsel Anlamsal Gömme Modeli ve Yeni Veri Kümesi

Yazarlar: Mengye Ren, Ryan Kiros, Richard Zemel

Yayın tarihi: arXiv: 1505.02074 / ICML 2015 derin öğrenme atölyesi.

Baidu / Kaliforniya Üniversitesi, Los Angeles

Yazar: Hauyuan Gao, Junhua Mao, Jie Zhou, Zhiheng Huang, Lei Wang, Xu Wei

Kağıt: Bir Makineyle mi Konuşuyorsunuz? Çok Dilli Görüntü için Veri Kümesi ve Yöntemleri Soru Cevaplama

Yayın tarihi: arXiv: 1505.05612.

POBTEK (Güney Kore)

Kağıt: Dinamik Parametre Tahmini ile Evrişimli Sinir Ağını Kullanarak Görüntü Soru Cevaplama

Yazar: Hyeonwoo Noh, Paul Hongsuck Seo ve Bohyung Han

Yayın tarihi: arXiv: 1511.05765

CMU / Microsoft Araştırması

Kağıt: Resimli Soru Cevaplama için Yığınlanmış Dikkat Ağları

Yazar: Yang, Z., He, X., Gao, J., Deng, L. ve Smola, A. (2015)

Yayın tarihi: arXiv: 1511.02274.

MetaMind

Bildiri: Görsel ve Metinsel Soru Cevaplama için Dinamik Bellek Ağları

Yazar: Xiong, Caiming, Stephen Merity ve Richard Socher

Yayın tarihi: arXiv: 1603.01417 (2016).

Seul Ulusal Üniversitesi + NAVER

Bildiri: Görsel Kalite Güvencesi için Çok Modlu Artık Öğrenme

Yazar: Jin-Hwa Kim, Sang-Woo Lee, Dong-Hyun Kwak, Min-Oh Heo, Jeonghee Kim, Jung-Woo Ha, Byoung-Tak Zhang

Yayın tarihi: arXiv: 1606: 01455

UC Berkeley + Sony

Makale: Görsel Soru Cevaplama ve Görsel Topraklama için Çok Modlu Kompakt Bilineer Havuzlama

Yazarlar: Akira Fukui, Dong Huk Park, Daylen Yang, Anna Rohrbach, Trevor Darrell ve Marcus Rohrbach

Yayın tarihi: arXiv: 1606.01847

Postech

Belge: MYK için Ortak Kayıp Minimizasyonu ile Tekrarlayan Cevaplama Birimlerinin Eğitimi

Yazar: Hyeonwoo Noh ve Bohyung Han

Yayın tarihi: arXiv: 1606.03647

Seul Ulusal Üniversitesi + NAVER

Kağıt: Düşük Sıralı Bilineer Havuzlama için Hadamard Ürünü

Yazar: Jin-Hwa Kim, Kyoung Woon On, Jeonghee Kim, Jung-Woo Ha, Byoung-Tak Zhan

Yayın tarihi: arXiv: 1610.04325.

Görsel dikkat ve belirginlik

  • Bay-CNN

  • Kağıt: Evrişimli Sinir Ağlarını Kullanarak Göz Fiksasyonlarını Tahmin Etme

    Yazar: Nian Liu, Junwei Han, Dingwen Zhang, Shifeng Wen, Tianming Liu

    Yayınlandı: CVPR, 2015.

  • Öğrenim noktalarının sürekli aranması

  • Yazar: Yer İşaretleri için Sıralı Aramayı Öğrenme

    Makaleler: Saurabh Singh, Derek Hoiem, David Forsyth

    Yayınlandı: CVPR, 2015.

  • Çoklu nesne tanıma için görsel dikkat mekanizması

  • Kağıt: Görsel Dikkatle Çoklu Nesne Tanıma

    Yazar: Jimmy Lei Ba, Volodymyr Mnih, Koray Kavukcuoğlu,

    Yayınlandı: ICLR, 2015.

  • Tekrarlayan görsel dikkat mekanizması modeli

  • Yazar: Volodymyr Mnih, Nicolas Heess, Alex Graves, Koray Kavukcuoğlu

    Makale: Tekrarlayan Görsel Dikkat Modelleri

    Yayınlandı: NIPS, 2014.

Düşük düzey görme

Süper çözünürlük

  • Yinelemeli Görüntü Yeniden Yapılandırma

    • Sven Behnke: Yinelemeli Görüntü Yeniden Yapılandırmayı Öğrenmek, IJCAI, 2001.

    • Sven Behnke: Sinirsel Soyutlama Piramidinde Yinelemeli Görüntü Yeniden Yapılandırmayı Öğrenme International Journal of Computational Intelligence and Applications, cilt 1, no. 4, s. 427-438, 2001.

  • Süper Çözünürlük (SRCNN)

    • Chao Dong, Chen Change Loy, Kaiming He, Xiaoou Tang, Görüntü Süper Çözünürlüğü için Derin Evrişimli Ağ Öğrenme, ECCV, 2014.

    • Chao Dong, Chen Change Loy, Kaiming He, Xiaoou Tang, Derin Evrişimli Ağları Kullanan Görüntü Süper Çözünürlük, arXiv: 1501.00092.

  • Çok Derin Süper Çözünürlük

    • Jiwon Kim, Jung Kwon Lee, Kyoung Mu Lee, Çok Derin Evrişimli Ağlar Kullanarak Doğru Görüntü Süper Çözünürlüğü, arXiv: 1511.04587, 2015.

  • Derinden Yinelemeli Evrişimli Ağ

    • Jiwon Kim, Jung Kwon Lee, Kyoung Mu Lee, Görüntü Süper Çözünürlük için Derin Özyinelemeli Evrişim Ağı, arXiv: 1511.04491, 2015.

  • Casade-Seyrek-Kodlama-Ağı

    • Zhaowen Wang, Ding Liu, Wei Han, Jianchao Yang ve Thomas S. Huang, Deep Networks for Image Super-Resolution with Sparse Prior. ICCV, 2015.

  • Süper Çözünürlük için Algısal Kayıplar

    • Justin Johnson, Alexandre Alahi, Li Fei-Fei, Gerçek Zamanlı Stil Aktarımı ve Süper Çözünürlük için Algısal Kayıplar, arXiv: 1603.08155, 2016.

  • SRGAN

    • Christian Ledig, Lucas Theis, Ferenc Huszar, Jose Caballero, Andrew Cunningham, Alejandro Acosta, Andrew Aitken, Alykhan Tejani, Johannes Totz, Zehan Wang, Wenzhe Shi, Generative Adversarial Network Kullanarak Foto-Gerçekçi Tek Görüntü Süper Çözünürlük, arXiv: 1609.04802 v3, 2016.

diğer uygulamalar

  • Optik Akış (FlowNet)

    • Philipp Fischer, Alexey Dosovitskiy, Eddy Ilg, Philip Häusser, Caner Hazırbaş, Vladimir Golkov, Patrick van der Smagt, Daniel Cremers, Thomas Brox, FlowNet: Evrişimli Ağlarla Optik Akışı Öğrenme, arXiv: 1504.06852.

  • Sıkıştırma Artefaktlarının Azaltılması

    • Chao Dong, Yubin Deng, Chen Change Loy, Xiaoou Tang, Compression Artifacts Reduction by a Deep Convolutional Network, arXiv: 1504.06993.

  • Bulanıklığı Giderme

    • Christian J. Schuler, Michael Hirsch, Stefan Harmeling, Bernhard Schölkopf, Learning to Deblur, arXiv: 1406.7444

    • Jian Sun, Wenfei Cao, Zongben Xu, Jean Ponce, Tekdüze Olmayan Hareket Bulanıklığını Giderme için Evrişimli Sinir Ağını Öğrenme, CVPR, 2015

  • Görüntü Ters Evrişimi

    • Li Xu, Jimmy SJ. Ren, Ce Liu, Jiaya Jia, Görüntü Ters Evrişimi için Derin Evrişimli Sinir Ağı, NIPS, 2014.

  • Derin Kenara Duyarlı Filtre

    • Li Xu, Jimmy SJ. Ren, Qiong Yan, Renjie Liao, Jiaya Jia, Deep Edge-Aware Filters, ICML, 2015.

  • Stereo Eşleştirme Maliyetini Evrişimli Sinir Ağı ile Hesaplama

    • Jure bontar, Yann LeCun, Stereo Eşleştirme Maliyetini Evrişimli Sinir Ağı ile Hesaplamak, CVPR, 2015.

  • Renkli Görüntü Renklendirme Richard Zhang, Phillip Isola, Alexei A. Efros, ECCV, 2016

  • Inpainting ile Özellik Öğrenimi

    • Deepak Pathak, Philipp Krahenbuhl, Jeff Donahue, Trevor Darrell, Alexei A. Efros, Context Encoders: Feature Learning by Inpainting, CVPR, 2016

Kenar algılama

  • Bütünsel Olarak Yuvalanmış Kenar Algılama

    • Saining Xie, Zhuowen Tu, Bütünsel Olarak Yuvalanmış Kenar Algılama, arXiv: 1504.06375.

  • DeepEdge

    • Gedas Bertasius, Jianbo Shi, Lorenzo Torresani, DeepEdge: Yukarıdan Aşağıya Kontur Tespiti için Çok Ölçekli Bifurcated Derin Ağ, CVPR, 2015.

  • DeepContour

    • Wei Shen, Xinggang Wang, Yan Wang, Xiang Bai, Zhijiang Zhang, DeepContour: Kontur Tespiti için Pozitif Paylaşım Kaybı ile Öğrenilen Derin Evrişimsel Özellik, CVPR, 2015.

Anlamsal bölümleme

Resim kaynağı: BoxSup kağıdı

  • SEC: Çekme, Genişletme ve Kısıtlama

    • Alexander Kolesnikov, Christoph Lampert, Seed, Expand and Constrain: Three Principles for Weakly-Supervised Image Segmentation, ECCV, 2016.

  • Adelaide

    • Guosheng Lin, Chunhua Shen, Ian Reid, Anton van dan Hengel, Semantik segmentasyon için derin yapılandırılmış modellerin parçalı etkili eğitimi, arXiv: 1504.01013. (VOC2012'de 1. sırada)

    • Guosheng Lin, Chunhua Shen, Ian Reid, Anton van den Hengel, Message Passing Inference'taki Mesajları Derinlemesine Öğrenmek, arXiv: 1508.02108. (VOC2012'de 4. sırada)

  • Derin Ayrıştırma Ağı (DPN)

    • Ziwei Liu, Xiaoxiao Li, Ping Luo, Chen Change Loy, Xiaoou Tang, Derin Ayrıştırma Ağı aracılığıyla Anlamsal Görüntü Segmentasyonu, arXiv: 1509.02634 / ICCV 2015 (VOC 2012'de 2. sırada)

  • CentraleSuperBoundaries, INRIA

    • Iasonas Kokkinos, Derin Öğrenmeyi Kullanarak Sınır Algılamada İnsanları Aşan, arXiv: 1411.07386 (VOC 2012'de 4. sırada)

  • BoxSup

    • Jifeng Dai, Kaiming He, Jian Sun, BoxSup: Anlamsal Segmentasyon için Evrişimli Ağları Denetlemek için Sınırlayıcı Kutuları Kullanmak, arXiv: 1503.01640. (VOC2012'de 6. sırada)

  • POBTEK

    • Hyeonwoo Noh, Seunghoon Hong, Bohyung Han, Learning Deconvolution Network for Semantic Segmentation, arXiv: 1505.04366. (VOC2012'de 7. sırada)

    • Seunghoon Hong, Hyeonwoo Noh, Bohyung Han, Yarı Denetimli Anlamsal Segmentasyon için Ayrılmış Derin Sinir Ağı, arXiv: 1506.04924.

    • Seunghoon Hong, Junhyuk Oh, Bohyung Han veHonglak Lee, Derin Evrişimli Sinir Ağı ile Anlamsal Segmentasyon için Aktarılabilir Bilgiyi Öğrenme, arXiv: 1512.07928

  • Tekrarlayan Sinir Ağları Olarak Koşullu Rastgele Alanlar

    • Shuai Zheng, Sadeep Jayasumana, Bernardino Romera-Paredes, Vibhav Vineet, Zhizhong Su, Dalong Du, Chang Huang, Philip H. S. Torr, Conditional Random Fields as Recurrent Neural Networks, arXiv: 1502.03240. (VOC2012'de 8. sırada)

  • DeepLab

    • Liang-Chieh Chen, George Papandreou, Kevin Murphy, Alan L. Yuille, Anlamsal görüntü segmentasyonu için bir DCNN'nin zayıf ve yarı denetimli öğrenimi, arXiv: 1502.02734. (VOC2012'de 9. sırada)

  • Uzaklaştır

    • Mohammadreza Mostajabi, Payman Yadollahpour, Gregory Shakhnarovich, Uzaklaştırma Özellikli İleri Beslemeli Anlamsal Segmentasyon, CVPR, 2015

  • Eklem Kalibrasyonu

    • Holger Caesar, Jasper Uijlings, Vittorio Ferrari, Anlamsal Segmentasyon için Ortak Kalibrasyon, arXiv: 1507.01581.

  • Anlamsal Bölümleme için Tam Evrişimli Ağlar

    • Jonathan Long, Evan Shelhamer, Trevor Darrell, Semantik Segmentasyon için Tam Evrişimli Ağlar, CVPR, 2015.

  • Hypercolumn

    • Bharath Hariharan, Pablo Arbelaez, Ross Girshick, Jitendra Malik, Hypercolumns for Object Segmentation and Fine-Grained Localization, CVPR, 2015.

  • Derin Hiyerarşik Ayrıştırma

    • Abhishek Sharma, Oncel Tuzel, David W. Jacobs, Semantik Segmentasyon için Derin Hiyerarşik Ayrıştırma, CVPR, 2015.

  • Sahne Etiketleme için Hiyerarşik Özellikleri Öğrenme

    • Clement Farabet, Camille Couprie, Laurent Najman, Yann LeCun, Çok Ölçekli Özellik Öğrenimiyle Sahne Ayrıştırma, Saflık Ağaçları ve Optimal Kapaklar, ICML, 2012.

    • Clement Farabet, Camille Couprie, Laurent Najman, Yann LeCun, Sahne Etiketleme için Hiyerarşik Özellikleri Öğrenme, PAMI, 2013.

  • Cambridge Üniversitesi

    • Vijay Badrinarayanan, Alex Kendall ve Roberto Cipolla "SegNet: Görüntü Segmentasyonu için Derin Evrişimli Kodlayıcı-Kod Çözücü Mimarisi." ArXiv ön baskı arXiv: 1511.00561, 2015.

  • Alex Kendall, Vijay Badrinarayanan ve Roberto Cipolla "Bayesian SegNet: Sahne Anlama için Derin Evrişimli Kodlayıcı-Kod Çözücü Mimarilerinde Model Belirsizliği." ArXiv ön baskı arXiv: 1511.02680, 2015.

  • Princeton

    • Fisher Yu, Vladlen Koltun, "Genişletilmiş Evrişimlerle Çok Ölçekli Bağlam Birleştirme", ICLR 2016

  • Washington Üniversitesi, Allen AI

    • Hamid Izadinia, Fereshteh Sadeghi, Santosh Kumar Divvala, Yejin Choi, Ali Farhadi, "Segment-Phrase Table for Semantic Segmentation, Visual Entailment and Paraphrasing", ICCV, 2015

  • INRIA

    • Iasonas Kokkinos, "Derin Öğrenmeyi Kullanarak Sınır Tespitinin Sınırlarını Puslamak", ICLR 2016

  • UCSB

    • Niloufar Pourian, S. Karthikeyan ve B.S. Manjunath, "Görüntü parçalarının topluluklarını öğrenerek zayıf denetimli grafik tabanlı semantik bölümleme", ICCV, 2015

Diğer kaynaklar

kurs

Derinlik Görüşü

CS231n: Görsel Tanıma için Evrişimli Sinir Ağları

ELEG 5040: Sinyal İşlemede İleri Konular (Derin Öğrenmeye Giriş)

Daha ayrıntılı kurs önerileri

CS224d: Doğal Dil İşleme için Derin Öğrenme

Ayda 1500 cep harçlığı harcayan profesyonel bir oyuncu olan Wuli Song Long, yan komşudur.
önceki
Hepsi otomatik başlatma ve durdurma konusunda şikayet ediyor, üreticiler neden hala bunu yapmakta ısrar ediyor?
Sonraki
İnsanların kalplerini görmek neden bu kadar uzun sürüyor? Kişilik Üzerine
Malezya Havayolları araştırma ekibi dağıtıldı, ancak kayıp aile üyeleri uçağın enkazını buldu: Seni çok seviyorum, nasıl pes edebilirim
Milli futbol takımı yaptı ama Japonya, Güney Kore ve Avustralya yapmadı!
"AI Doctor Beş Yıldızlı Kılavuz" öz değerlendirmeye girdi, büyük bir şirket veya yeni bir şirket seçin (4D uzun metin)
Yeni bir araba almak için tamamen kullanılmış bir araba almaktansa kredi almayı mı tercih edersiniz? Netizen: Gerçekten ucuz değil!
Başka bir Avrupa yeni favorisini keşfedin! Seni sadece Madrid ve Barselona'ya değil İspanya'ya götürmek istiyorum
Kai-Fu Lee: Hayatın algoritması ne kadar aşırı olursa olsun, aşk kadar iyi değil
En Çinli kim | Lakers rahat
Çin'i dünyadaki bir sonraki inovasyon süper gücü olmaya iten nedir? Yabancılar övdü
Yerli bir otomobil ile ortak girişim aracı arasındaki fark nedir? Bakım işçisi: Yerli arabalarda birçok arıza var
9 petrol ülkesi yuan'a yaklaştıktan sonra işler ilerledi ve bu ülke ham petrol yuanına yaklaşıyor olabilir
Hızlı bir bakış, ama rüyamda akıyorsun
To Top