1 Yeni Zhiyuan derlemesi
Kaynak: github
Derleyin ve düzenleyin: Xinzhiyuan Yazı İşleri Departmanı
Xin Zhiyuan Rehberi Bilgisayar görüşü, son yıllarda büyük bir gelişme kaydetti ve derin öğrenmenin en ileri araştırma yönünü temsil ediyor. Bu makale, 2012'den 2017'ye kadar bilgisayar görüşü alanındaki başlıca olayları sıralıyor: esas olarak kağıtlar ve diğer kuru mal kaynakları ve kaynak adresini ekleyin. ImageNet sınıflandırması, nesne algılama, nesne izleme, nesne tanıma, görüntü ve dil ve görüntü oluşturma olarak ayrılmış yüzlerce belge içerir.
Bu yılın Şubat ayında, Xinzhiyuan, optimizasyon / eğitim yöntemlerini, denetimsiz / üretken modelleri, evrişimli ağ modellerini ve görüntü segmentasyonu / hedef tespiti vb. İçeren son 5 yılda en çok alıntı yapılan 100 derin öğrenme belgesini tanıttı. On alt alan.
[Xinzhiyuan'ın resmi hesabını girin, bu klasik bilgiyi indirmek için iletişim kutusuna "Kağıt 100" girin]
Yukarıda bahsedilen derin öğrenmeyle ilgili en çok alıntı yapılan 100 makale Github'da açık kaynaklı bir projedir ve topluluğun tüm üyeleri katılabilir. Bu projede, son yıllarda sahada en fazla etkiye sahip olan makale, kitap ve blogların bir özetini içeren bilgisayar vizyonu kaynakları üzerine bir proje olan Deep Vision adlı başka bir proje bulduk. Bunların arasında, kağıt bölümünde yazar ayrıca ImageNet sınıflandırması, nesne algılama, nesne izleme, nesne tanıma, görüntü ve dil ve görüntü oluşturma olarak ikiye ayrılır.
Klasik kağıtlar
ImageNet sınıflandırması
Nesne algılama
Nesne izleme
Düşük düzey görme
Süper çözünürlük
diğer uygulamalar
Kenar algılama
Anlamsal bölümleme
Görsel dikkat ve belirginlik
Nesne tanıma
İnsan vücudu poz tahmini
CNN ilkesi ve doğası (CNN'i Anlamak)
Görüntü ve dil
Resim açıklaması
Video yorumu
Soru-Cevap
Görüntü oluşturma
Yukarıdakiler, bu makalelerin, yazarların ve kurumların bazı anahtar kelimelerine dayanan bir ısı haritasıdır.
ImageNet sınıflandırması
Resim kaynağı: AlexNet kağıdı
Microsoft ResNet
Kağıt: Görüntü Tanıma için Derin Artık Ağ
Yazar: Ho Kai Ming, Zhang Xiang Yu ve Sun Jian Ren Shaoqing
Microsoft PRelu (rastgele düzeltilmiş doğrusal birim / ağırlık başlatma)
Kağıt: Derin Öğrenme Doğrultucu: ImageNet Sınıflandırmasında İnsan Seviyesini Aşmak
Yazar: Ho Kai Ming, Zhang Xiang Yu ve Sun Jian Ren Shaoqing
Bağlantı: https://arxiv.org/pdf/1502.01852.pdf
Google Toplu Normalleştirme
Kağıt: Toplu Normalleştirme: Dahili Değişkenleri Azaltarak Derin Ağ Eğitimini Hızlandırma
Yazar: Sergey Ioffe, Christian Szegedy
Bağlantı: https://arxiv.org/pdf/1502.03167.pdf
Google GoogLeNet
Makale: Deeper Convolution, CVPR 2015
Yazar: Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich
Bağlantı: https://arxiv.org/pdf/1409.4842.pdf
Oxford VGG-Net
Makale: Büyük Ölçekli Görsel Tanıma Alanında Çok Derin Evrişimli Ağlar, ICLR 2015
Yazar: Karen Simonyan ve Andrew Zisserman
Bağlantı: https://arxiv.org/pdf/1409.1556.pdf
AlexNet
Kağıt: Derin evrişimli sinir ağları kullanan ImageNet sınıflandırması
Yazar: Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton
Nesne algılama
Görüntü kaynağı: Daha hızlı RCNN kağıdı
PVANET
Kağıt: Gerçek Zamanlı Nesne Algılama için Derin Ama Hafif Sinir Ağları (PVANET: Gerçek Zamanlı Nesne Algılama için Derin ama Hafif Sinir Ağları)
Yazar: Kye-Hyeon Kim, Sanghoon Hong, Byungseok Roh, Yeongjae Cheon, Minje Park
Bağlantı: https://arxiv.org/pdf/1608.08021
New York Üniversitesi OverFeat
Makale: Tanıma, Yerelleştirme ve Algılama için Evrişimli Ağları Kullanma (OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks), ICLR 2014
Yazar: Pierre Sermanet, David Eigen, Xiang Zhang, Michael Mathieu, Rob Fergus, Yann LeCun
Bağlantı: https://arxiv.org/pdf/1312.6229.pdf
Berkeley R-CNN
Kağıt: Doğru nesne algılama ve anlamsal bölümleme için zengin özellik hiyerarşileri (Doğru nesne algılama ve anlamsal bölümleme için zengin özellik hiyerarşileri), CVPR 2014
Yazar: Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik
Bağlantı:
Microsoft SPP
Makale: Görsel Tanıma için Derin Evrişimli Ağlarda Uzamsal Piramit Havuzlaması, ECCV 2014
Yazar: Ho Kai Ming, Zhang Xiang Yu ve Sun Jian Ren Shaoqing
Bağlantı: https://arxiv.org/pdf/1406.4729.pdf
Microsoft Hızlı R-CNN
Kağıt: Hızlı R-CNN
Yazar: Ross Girshick
Bağlantı: https://arxiv.org/pdf/1504.08083.pdf
Microsoft Daha Hızlı R-CNN
Kağıt: RPN ile Gerçek Zamanlı Nesne Algılamaya Doğru (Daha Hızlı R-CNN: Bölge Teklif Ağlarıyla Gerçek Zamanlı Nesne Algılamaya Doğru)
Yazarlar: Ren Shaoqing, Ho Kai Ming, Ross Girshick, Sun Jian
Bağlantı: https://arxiv.org/pdf/1506.01497.pdf
Oxford Üniversitesi R-CNN eksi R
Kağıt: R-CNN eksi R
Yazar: Karel Lenc, Andrea Vedaldi
Bağlantı: https://arxiv.org/pdf/1506.06981.pdf
Uçtan uca yaya algılama
Kağıt: Kalabalık Ortamlarda Uçtan Uca İnsan Algılama
Yazar: Russell Stewart, Mykhaylo Andriluka
Bağlantı: https://arxiv.org/pdf/1506.04878.pdf
Gerçek zamanlı nesne algılama
Kağıt: Yalnızca Bir Kez Bakarsınız: Birleşik, Gerçek Zamanlı Nesne Algılama
Yazar: Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
Bağlantı: https://arxiv.org/pdf/1506.02640.pdf
İç-Dış Net
Makale: Atlama Havuzlama ve Tekrarlayan Sinir Ağları ile Bağlamdaki Nesneleri Algılama (İç-Dış Ağ: Atlama Havuzlama ve Tekrarlayan Sinir Ağları ile Bağlamdaki Nesneleri Algılama)
Yazar: Sean Bell, C. Lawrence Zitnick, Kavita Bala, Ross Girshick
Bağlantı: https://arxiv.org/abs/1512.04143.pdf
R-FCN
Belge: Bölge Tabanlı Tamamen Evrişimli Ağlar aracılığıyla Nesne Tanıma (R-FCN: Bölge Tabanlı Tamamen Evrişimli Ağlar aracılığıyla Nesne Algılama)
Yazar: Nesil zirve sezonu, Li Yi, Ho Kai Ming, Sun Jian
Bağlantı: https://arxiv.org/abs/1605.06409
SSD
Kağıt: Tek Atış Çoklu Kutu Dedektörü (SSD: Tek Atış Çoklu Kutu Dedektörü)
Yazar: Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg
Bağlantı: https://arxiv.org/pdf/1512.02325v2.pdf
Hız / doğruluk değiş tokuşu
Kağıt: Modern evrişimli nesne dedektörleri için hız / doğruluk değiş tokuşları
Yazar: Jonathan Huang, Vivek Rathod, Chen Sun, Menglong Zhu, Anoop Korattikara, Alireza Fathi, Ian Fischer, Zbigniew Wojna, Yang Song, Sergio Guadarrama, Kevin Murphy
Bağlantı: https://arxiv.org/pdf/1611.10012v1.pdf
Nesne izleme
Makale: Konvolüsyonel Sinir Ağı ile Ayrımcı Belirginlik Haritası Öğrenerek Çevrimiçi İzleme (Konvolüsyonel Sinir Ağı ile Ayrımcı Belirginlik Haritası Öğrenerek Çevrimiçi İzleme)
Yazar: Seunghoon Hong, Tackgeun You, Suha Kwak, Bohyung Han
Adres: arXiv: 1502.06796.
Makale: DeepTrack: Görsel İzleme için Evrişimli Sinir Ağları ile Ayrımcı Özellik Temsillerinin Öğrenilmesi (DeepTrack: Görsel İzleme için Konvolüsyonel Sinir Ağları Tarafından Ayrımcı Özellik Temsillerinin Öğrenilmesi)
Yazarlar: Hanxi Li, Yi Li ve Fatih Porikli
Yayın: BMVC, 2014.
Bildiri: Görsel İzleme için Derin Kompakt Görüntü Temsili Öğrenmek
Yazar: N Wang, DY Yeung
Yayınlandı: NIPS, 2013.
Belge: Görsel İzleme için Hiyerarşik Evrişimli Özellikler
Yazarlar: Chao Ma, Jia-Bin Huang, Xiaokang Yang ve Ming-Hsuan Yang
Yayınlanma Tarihi: ICCV 2015
Kağıt: Tamamen Evrişimli Ağlarla Görsel İzleme
Yazar: Lijun Wang, Wanli Ouyang, Xiaogang Wang ve Huchuan Lu,
Yayınlanma Tarihi: ICCV 2015
Kağıt: Görsel izleme için çok alanlı evrişimli sinir ağını öğrenme
(Görsel İzleme için Çok Alanlı Evrişimli Sinir Ağlarını Öğrenme)
Yazar: Hyeonseob Namand Bohyung Han
Nesne tanıma
Kağıt: Evrişimli sinir ağları ile zayıf denetimli öğrenme
Yazar: Maxime Oquab, Leon Bottou, Ivan Laptev, Josef Sivic, CVPR, 2015
Bağlantı:
FV-CNN
Kağıt: Doku Tanıma ve Segmentasyon için Derin Filtre Bankaları
Yazar: Mircea Cimpoi, Subhransu Maji, Andrea Vedaldi, CVPR, 2015.
Bağlantı:
İnsan Duruşu Tahmini
Kağıt: Parça Benzeşme Alanlarını Kullanarak Gerçek Zamanlı Çok Kişili 2D Poz Tahmini
Yazar: Zhe Cao, Tomas Simon, Shih-En Wei ve Yaser Sheikh, CVPR, 2017.
Kağıt: Derin kesme: Çok kişili poz tahmini için ortak alt küme bölümü ve etiketleme (Derin kesim: Çok kişili poz tahmini için ortak alt küme bölümü ve etiketleme)
Yazar: Leonid Pishchulin, Eldar Insafutdinov, Siyu Tang, Bjoern Andres, Mykhaylo Andriluka, Peter Gehler ve Bernt Schiele, CVPR, 2016.
Kağıt: Evrişimli poz makineleri
Yazar: Shih-En Wei, Varun Ramakrishna, Takeo Kanade ve Yaser Sheikh, CVPR, 2016.
Kağıt: İnsan poz tahmini için yığılmış kum saati ağları (İnsan poz tahmini için yığılmış kum saati ağları)
Yazar: Alejandro Newell, Kaiyu Yang ve Jia Deng, ECCV, 2016.
Kağıt: Videolarda insan pozu tahmini için akan konvnetler (Videolarda insan pozu tahmini için akan konvnetler)
Yazar: Tomas Pfister, James Charles ve Andrew Zisserman, ICCV, 2015.
Kağıt: Evrişimli bir ağın ortak eğitimi ve insan pozu tahmini için grafiksel bir model
Yazar: Jonathan J.Tompson, Arjun Jain, Yann LeCun, Christoph Bregler, NIPS, 2014.
CNN'i Anlamak
Kağıt: Eşdeğerlik ve eşdeğerliklerini ölçerek görüntü temsillerini anlama
Yazar: Karel Lenc, Andrea Vedaldi, CVPR, 2015.
Bağlantı:
Kağıt: Derin Sinir Ağları Kolayca Kandırılır: Tanınmayan Görüntüler İçin Yüksek Güvenle Tahminler (Derin Sinir Ağları Kolayca Kandırılır: Tanınmayan Görüntüler İçin Yüksek Güvenle Tahminler)
Yazar: Anh Nguyen, Jason Yosinski, Jeff Clune, CVPR, 2015.
Bağlantı:
Kağıt: Derin Görüntü Temsillerini Ters Çevirerek Anlamak
Yazar: Aravindh Mahendran, Andrea Vedaldi, CVPR, 2015
Bağlantı:
Kağıt: Nesne Dedektörleri Derin Sahne CNN'lerinde Ortaya Çıkıyor
Yazar: Bolei Zhou, Aditya Khosla, Agata Lapedriza, Aude Oliva, Antonio Torralba, ICLR, 2015.
Kağıt: Evrişimli Ağlarla Görsel Temsilleri Tersine Çevirme
Yazar: Alexey Dosovitskiy, Thomas Brox, arXiv, 2015.
Belge: Evrişimli Ağları Görselleştirme ve Anlama
Yazar: Matthrew Zeiler, Rob Fergus, ECCV, 2014.
Bağlantı: https://www.cs.nyu.edu/~fergus/papers/zeilerECCV2014.pdf
Görüntü ve dil
Resim Yazısı
Resim: (Andrej Karpathy, Li Fei-Fei'den, Görüntü Tanımı Oluşturmak İçin Derin Görsel-Anlamsal Hizalamalar, CVPR, 2015.)
UCLA / Baidu
Multimodal Tekrarlayan Sinir Ağları ile Görüntüleri Açıklayın
Junhua Mao, Wei Xu, Yi Yang, Jiang Wang, Alan L. Yuille, arXiv: 1410.1090
Toronto
Görsel-Anlamsal Gömmeleri Multimodal Sinir Dili Modelleriyle Birleştirme
Ryan Kiros, Ruslan Salakhutdinov, Richard S.Zemel, arXiv: 1411.2539.
Berkeley
Görsel Tanıma ve Tanımlama için Uzun Süreli Tekrarlayan Evrişimli Ağlar (Görsel Tanıma ve Tanımlama için Uzun Süreli Tekrarlayan Evrişimli Ağlar)
Jeff Donahue, Lisa Anne Hendricks, Sergio Guadarrama, Marcus Rohrbach, Subhashini Venugopalan, Kate Saenko, Trevor Darrell, arXiv: 1411.4389.
Resimlere bakın ve kelimeler yazın: Göster ve Anlat: Bir Sinirsel Görüntü Başlığı Oluşturucu
Oriol Vinyals, Alexander Toshev, Samy Bengio, Dumitru Erhan, arXiv: 1411.4555.
Stanford
Görüntü Açıklaması Oluşturmak için Derin Görsel-Anlamsal Hizalamalar (Görüntü Açıklaması Oluşturmak İçin Derin Görsel-Anlamsal Hizalamalar)
Andrej Karpathy, Li Fei-Fei, CVPR, 2015.
UML / UT
Tekrarlayan Derin Sinir Ağlarını Kullanarak Videoları Doğal Dile Çevirme
Subhashini Venugopalan, Huijuan Xu, Jeff Donahue, Marcus Rohrbach, Raymond Mooney, Kate Saenko, NAACL-HLT, 2015.
CMU / Microsoft
Resim Yazısı Oluşturma için Tekrarlayan Görsel Temsili Öğrenme
Xinlei Chen, C. Lawrence Zitnick, arXiv: 1411.5654.
Xinlei Chen, C. Lawrence Zitnick, Zihin Gözü: Resim Yazısı Üretimi için Tekrarlayan Görsel Temsil, CVPR 2015
Microsoft
Altyazılardan Görsel Kavramlara ve Geri
Hao Fang, Saurabh Gupta, Forrest Iandola, Rupesh Srivastava, Li Deng, Piotr Dollár, Jianfeng Gao, Xiaodong He, Margaret Mitchell, John C. Platt, C. Lawrence Zitnick, Geoffrey Zweig, CVPR, 2015.
Üniv. Montreal / Üniv. Toronto
Göster, Katıl ve Söyle: Görsel Katılım ve Söyle: Görsel Dikkatle Nöral Görüntü Altyazısı Oluşturma
Kelvin Xu, Jimmy Lei Ba, Ryan Kiros, Kyunghyun Cho, Aaron Courville, Ruslan Salakhutdinov, Richard S.Zemel, Yoshua Bengio, arXiv: 1502.03044 / ICML 2015
Idiap / EPFL / Facebook
Cümle Tabanlı Resim Yazısı
Remi Lebret, Pedro O. Pinheiro, Ronan Collobert, arXiv: 1502.03671 / ICML 2015
UCLA / Baidu
Çocuk gibi öğrenmek: Çocuk Gibi Öğrenme: Görsellerin Cümle Tanımlarından Öğrenme Hızlı Roman Görsel Kavram
Junhua Mao, Wei Xu, Yi Yang, Jiang Wang, Zhiheng Huang, Alan L. Yuille, arXiv: 1504.06692
MS + Berkeley
Resim Yazısı İçin En Yakın Komşu Yaklaşımlarını Keşfetme
Jacob Devlin, Saurabh Gupta, Ross Girshick, Margaret Mitchell, C. Lawrence Zitnick, arXiv: 1505.04467
Resim Yazısı İçin Dil Modelleri: Tuhaflıklar ve İşe Yarayanlar
Jacob Devlin, Hao Cheng, Hao Fang, Saurabh Gupta, Li Deng, Xiaodong He, Geoffrey Zweig, Margaret Mitchell, arXiv: 1505.01809
Adelaide
Ara Nitelikler Katmanı ile Resim Yazısı
Qi Wu, Chunhua Shen, Anton van den Hengel, Lingqiao Liu, Anthony Dick, arXiv: 1506.01144
Tilburg
Resimlerle dil öğrenmek
Grzegorz Chrupala, Akos Kadar, Afra Alishahi, arXiv: 1506.03694
Montreal Üniversitesi
Dikkat Temelli Kodlayıcı-Kod Çözücü Ağlarını kullanarak multimedya içeriğini tanımlama (Dikkat Temelli Kodlayıcı-Kod Çözücü Ağlarını Kullanarak Multimedya İçeriğini Tanımlama)
Kyunghyun Cho, Aaron Courville, Yoshua Bengio, arXiv: 1507.01053
Cornell
Sinirsel Görüntü Yazımında Görüntü Temsilleri ve Yeni Etki Alanları
Jack Hessel, Nicolas Savva, Michael J. Wilber, arXiv: 1508.02091
HongKong MS + Şehir Üniv.
Sıralama Kanonik Korelasyon Analizi ile Sorgu ve Görüntü Benzerliklerini Öğrenmek
Ting Yao, Tao Mei ve Chong-Wah Ngo, ICCV, 2015
Video Altyazı
Berkeley
Jeff Donahue, Lisa Anne Hendricks, Sergio Guadarrama, Marcus Rohrbach, Subhashini Venugopalan, Kate Saenko, Trevor Darrell, Long-term Recurrent Convolutional Networks for Visual Recognition and Description, CVPR, 2015.
Utah / UML / Berkeley
Subhashini Venugopalan, Huijuan Xu, Jeff Donahue, Marcus Rohrbach, Raymond Mooney, Kate Saenko, Derin Tekrarlayan Sinir Ağlarını Kullanarak Videoları Doğal Dile Çevirmek, arXiv: 1412.4729.
Microsoft
Yingwei Pan, Tao Mei, Ting Yao, Houqiang Li, Yong Rui, Ortak Modelleme Gömme ve Köprü Video ve Diline Çeviri, arXiv: 1505.01861.
Utah / UML / Berkeley
Subhashini Venugopalan, Marcus Rohrbach, Jeff Donahue, Raymond Mooney, Trevor Darrell, Kate Saenko, Sequence to Sequence - Video to Text, arXiv: 1505.00487.
Montreal Üniversitesi / Sherbrooke
Li Yao, Atousa Torabi, Kyunghyun Cho, Nicolas Ballas, Christopher Pal, Hugo Larochelle, Aaron Courville, Zamansal Yapıyı Kullanarak Videoların Açıklanması, arXiv: 1502.08029
MPI / Berkeley
Anna Rohrbach, Marcus Rohrbach, Bernt Schiele, The Long-Short Story of Movie Description, arXiv: 1506.01698
Toronto Üniversitesi / MIT
Yukun Zhu, Ryan Kiros, Richard Zemel, Ruslan Salakhutdinov, Raquel Urtasun, Antonio Torralba, Sanja Fidler, Aligning Books and Movies: Towards Story-like Visual Explanations by Movie Watching Books Books, arXiv: 1506.06724
Montreal Üniversitesi
Kyunghyun Cho, Aaron Courville, Yoshua Bengio, Dikkat Temelli Kodlayıcı-Kod Çözücü Ağlarını Kullanarak Multimedya İçeriğini Tanımlama, arXiv: 1507.01053
TAU / Güney Kaliforniya Üniversitesi
Dotan Kaufman, Gil Levi, Tal Hassner, Lior Wolf, Video Ek Açıklama ve Özetleme için Geçici Mozaikleme, arXiv: 1612.06950.
Görüntü oluşturma
Evrişimli / tekrarlayan ağ
Kağıt: PixelCNN Kod Çözücülerle Koşullu Görüntü Oluşturma "
Yazar: Aäron van den Oord, Nal Kalchbrenner, Oriol Vinyals, Lasse Espeholt, Alex Graves, Koray Kavukcuoğlu
Makale: Evrişimli Sinir Ağları ile Sandalye Oluşturmayı Öğrenmek
Yazar: Alexey Dosovitskiy, Jost Tobias Springenberg, Thomas Brox
Yayınlandı: CVPR, 2015.
Kağıt: ÇİZİM: Görüntü Oluşturma İçin Tekrarlayan Bir Sinir Ağı
Yazar: Karol Gregor, Ivo Danihelka, Alex Graves, Danilo Jimenez Rezende, Daan Wierstra
Yayınlandı: ICML, 2015.
Yüzleşme Ağı
Makale: Generative Adversarial Networks
Yazar: Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio
Yayınlandı: NIPS, 2014.
Makale: Bir Laplacian Düşman Ağları Piramidi kullanan Derin Üretken Görüntü Modelleri (Laplacian Düşman Ağları Piramidi kullanan Derin Üretken Görüntü Modelleri)
Yazarlar: Emily Denton, Soumith Chintala, Arthur Szlam, Rob Fergus
Yayınlandı: NIPS, 2015.
Kağıt: Üretken modellerin değerlendirilmesine ilişkin bir not
Yazar: Lucas Theis, Aäron van den Oord, Matthias Bethge
Yayınlanma tarihi: ICLR 2016.
Kağıt: Değişken Olarak Otomatik Kodlanmış Derin Gauss Süreçleri (Değişken Olarak Otomatik Kodlanmış Derin Gauss Süreçleri)
Yazar: Zhenwen Dai, Andreas Damianou, Javier Gonzalez, Neil Lawrence
Yayınlanma tarihi: ICLR 2016.
Tez: Dikkat mekanizmasını kullanarak Başlıklardan Dikkat Çekerek Görüntü Oluşturma
Yazar: Elman Mansimov, Emilio Parisotto, Jimmy Ba, Ruslan Salakhutdinov
Yayınlanma Tarihi: ICLR 2016
Makale: Kategorik Üretken Çekişmeli Ağlar ile Denetimsiz ve Yarı Denetimli Öğrenme
Yazar: Jost Tobias Springenberg
Yayınlanma Tarihi: ICLR 2016
Makale: Bir Düşmanla Temsilleri Sansürlemek
Yazar: Harrison Edwards, Amos Storkey
Yayınlanma Tarihi: ICLR 2016
Kağıt: Sanal Tartışmalı Eğitim ile Dağıtımsal Düzeltme
Yazar: Takeru Miyato, Shin-ichi Maeda, Masanori Koyama, Ken Nakae, Shin Ishii
Yayınlanma Tarihi: ICLR 2016
Kağıt: Doğal Görüntü Manifoldunda Üretken Görsel Manipülasyon
Yazar: Zhu Junyan, Philipp Krahenbuhl, Eli Shechtman ve Alexei A. Efros
Yayınlanma tarihi: ECCV 2016.
Bildiri: Derin Evrişimli Üretken Çekişmeli Ağlar ile Denetimsiz Temsil Öğrenimi
Yazar: Alec Radford, Luke Metz, Soumith Chintala
Yayınlanma Tarihi: ICLR 2016
soru cevap
Resim: (Stanislaw Antol, Aishwarya Agrawal, Jiasen Lu, Margaret Mitchell, Dhruv Batra, C. Lawrence Zitnick, Devi Parikh, VQA: Görsel Soru Cevaplama, CVPR, 2015 SUNw: Sahne Anlama atölyesi)
Virginia Üniversitesi / Microsoft Araştırmaları
Bildiri: VQA: Görsel Soru Cevaplama, CVPR, 2015 SUNw: Sahne Anlama atölyesi.
Yazar: Stanislaw Antol, Aishwarya Agrawal, Jiasen Lu, Margaret Mitchell, Dhruv Batra, C. Lawrence Zitnick, Devi Parikh
MPI / Berkeley
Bildiri: Nöronlarınıza Sorun: Görüntüler Hakkındaki Soruları Yanıtlamaya Nöral Temelli Bir Yaklaşım
Yazarlar: Mateusz Malinowski, Marcus Rohrbach, Mario Fritz,
Sürüm: arXiv: 1505.01121.
Toronto
Bildiri: Görüntü Soru Cevaplama: Görsel Anlamsal Gömme Modeli ve Yeni Veri Kümesi
Yazarlar: Mengye Ren, Ryan Kiros, Richard Zemel
Yayın tarihi: arXiv: 1505.02074 / ICML 2015 derin öğrenme atölyesi.
Baidu / Kaliforniya Üniversitesi, Los Angeles
Yazar: Hauyuan Gao, Junhua Mao, Jie Zhou, Zhiheng Huang, Lei Wang, Xu Wei
Kağıt: Bir Makineyle mi Konuşuyorsunuz? Çok Dilli Görüntü için Veri Kümesi ve Yöntemleri Soru Cevaplama
Yayın tarihi: arXiv: 1505.05612.
POBTEK (Güney Kore)
Kağıt: Dinamik Parametre Tahmini ile Evrişimli Sinir Ağını Kullanarak Görüntü Soru Cevaplama
Yazar: Hyeonwoo Noh, Paul Hongsuck Seo ve Bohyung Han
Yayın tarihi: arXiv: 1511.05765
CMU / Microsoft Araştırması
Kağıt: Resimli Soru Cevaplama için Yığınlanmış Dikkat Ağları
Yazar: Yang, Z., He, X., Gao, J., Deng, L. ve Smola, A. (2015)
Yayın tarihi: arXiv: 1511.02274.
MetaMind
Bildiri: Görsel ve Metinsel Soru Cevaplama için Dinamik Bellek Ağları
Yazar: Xiong, Caiming, Stephen Merity ve Richard Socher
Yayın tarihi: arXiv: 1603.01417 (2016).
Seul Ulusal Üniversitesi + NAVER
Bildiri: Görsel Kalite Güvencesi için Çok Modlu Artık Öğrenme
Yazar: Jin-Hwa Kim, Sang-Woo Lee, Dong-Hyun Kwak, Min-Oh Heo, Jeonghee Kim, Jung-Woo Ha, Byoung-Tak Zhang
Yayın tarihi: arXiv: 1606: 01455
UC Berkeley + Sony
Makale: Görsel Soru Cevaplama ve Görsel Topraklama için Çok Modlu Kompakt Bilineer Havuzlama
Yazarlar: Akira Fukui, Dong Huk Park, Daylen Yang, Anna Rohrbach, Trevor Darrell ve Marcus Rohrbach
Yayın tarihi: arXiv: 1606.01847
Postech
Belge: MYK için Ortak Kayıp Minimizasyonu ile Tekrarlayan Cevaplama Birimlerinin Eğitimi
Yazar: Hyeonwoo Noh ve Bohyung Han
Yayın tarihi: arXiv: 1606.03647
Seul Ulusal Üniversitesi + NAVER
Kağıt: Düşük Sıralı Bilineer Havuzlama için Hadamard Ürünü
Yazar: Jin-Hwa Kim, Kyoung Woon On, Jeonghee Kim, Jung-Woo Ha, Byoung-Tak Zhan
Yayın tarihi: arXiv: 1610.04325.
Görsel dikkat ve belirginlik
Bay-CNN
Kağıt: Evrişimli Sinir Ağlarını Kullanarak Göz Fiksasyonlarını Tahmin Etme
Yazar: Nian Liu, Junwei Han, Dingwen Zhang, Shifeng Wen, Tianming Liu
Yayınlandı: CVPR, 2015.
Öğrenim noktalarının sürekli aranması
Yazar: Yer İşaretleri için Sıralı Aramayı Öğrenme
Makaleler: Saurabh Singh, Derek Hoiem, David Forsyth
Yayınlandı: CVPR, 2015.
Çoklu nesne tanıma için görsel dikkat mekanizması
Kağıt: Görsel Dikkatle Çoklu Nesne Tanıma
Yazar: Jimmy Lei Ba, Volodymyr Mnih, Koray Kavukcuoğlu,
Yayınlandı: ICLR, 2015.
Tekrarlayan görsel dikkat mekanizması modeli
Yazar: Volodymyr Mnih, Nicolas Heess, Alex Graves, Koray Kavukcuoğlu
Makale: Tekrarlayan Görsel Dikkat Modelleri
Yayınlandı: NIPS, 2014.
Düşük düzey görme
Süper çözünürlük
Yinelemeli Görüntü Yeniden Yapılandırma
Sven Behnke: Yinelemeli Görüntü Yeniden Yapılandırmayı Öğrenmek, IJCAI, 2001.
Sven Behnke: Sinirsel Soyutlama Piramidinde Yinelemeli Görüntü Yeniden Yapılandırmayı Öğrenme International Journal of Computational Intelligence and Applications, cilt 1, no. 4, s. 427-438, 2001.
Süper Çözünürlük (SRCNN)
Chao Dong, Chen Change Loy, Kaiming He, Xiaoou Tang, Görüntü Süper Çözünürlüğü için Derin Evrişimli Ağ Öğrenme, ECCV, 2014.
Chao Dong, Chen Change Loy, Kaiming He, Xiaoou Tang, Derin Evrişimli Ağları Kullanan Görüntü Süper Çözünürlük, arXiv: 1501.00092.
Çok Derin Süper Çözünürlük
Jiwon Kim, Jung Kwon Lee, Kyoung Mu Lee, Çok Derin Evrişimli Ağlar Kullanarak Doğru Görüntü Süper Çözünürlüğü, arXiv: 1511.04587, 2015.
Derinden Yinelemeli Evrişimli Ağ
Jiwon Kim, Jung Kwon Lee, Kyoung Mu Lee, Görüntü Süper Çözünürlük için Derin Özyinelemeli Evrişim Ağı, arXiv: 1511.04491, 2015.
Casade-Seyrek-Kodlama-Ağı
Zhaowen Wang, Ding Liu, Wei Han, Jianchao Yang ve Thomas S. Huang, Deep Networks for Image Super-Resolution with Sparse Prior. ICCV, 2015.
Süper Çözünürlük için Algısal Kayıplar
Justin Johnson, Alexandre Alahi, Li Fei-Fei, Gerçek Zamanlı Stil Aktarımı ve Süper Çözünürlük için Algısal Kayıplar, arXiv: 1603.08155, 2016.
SRGAN
Christian Ledig, Lucas Theis, Ferenc Huszar, Jose Caballero, Andrew Cunningham, Alejandro Acosta, Andrew Aitken, Alykhan Tejani, Johannes Totz, Zehan Wang, Wenzhe Shi, Generative Adversarial Network Kullanarak Foto-Gerçekçi Tek Görüntü Süper Çözünürlük, arXiv: 1609.04802 v3, 2016.
diğer uygulamalar
Optik Akış (FlowNet)
Philipp Fischer, Alexey Dosovitskiy, Eddy Ilg, Philip Häusser, Caner Hazırbaş, Vladimir Golkov, Patrick van der Smagt, Daniel Cremers, Thomas Brox, FlowNet: Evrişimli Ağlarla Optik Akışı Öğrenme, arXiv: 1504.06852.
Sıkıştırma Artefaktlarının Azaltılması
Chao Dong, Yubin Deng, Chen Change Loy, Xiaoou Tang, Compression Artifacts Reduction by a Deep Convolutional Network, arXiv: 1504.06993.
Bulanıklığı Giderme
Christian J. Schuler, Michael Hirsch, Stefan Harmeling, Bernhard Schölkopf, Learning to Deblur, arXiv: 1406.7444
Jian Sun, Wenfei Cao, Zongben Xu, Jean Ponce, Tekdüze Olmayan Hareket Bulanıklığını Giderme için Evrişimli Sinir Ağını Öğrenme, CVPR, 2015
Görüntü Ters Evrişimi
Li Xu, Jimmy SJ. Ren, Ce Liu, Jiaya Jia, Görüntü Ters Evrişimi için Derin Evrişimli Sinir Ağı, NIPS, 2014.
Derin Kenara Duyarlı Filtre
Li Xu, Jimmy SJ. Ren, Qiong Yan, Renjie Liao, Jiaya Jia, Deep Edge-Aware Filters, ICML, 2015.
Stereo Eşleştirme Maliyetini Evrişimli Sinir Ağı ile Hesaplama
Jure bontar, Yann LeCun, Stereo Eşleştirme Maliyetini Evrişimli Sinir Ağı ile Hesaplamak, CVPR, 2015.
Renkli Görüntü Renklendirme Richard Zhang, Phillip Isola, Alexei A. Efros, ECCV, 2016
Inpainting ile Özellik Öğrenimi
Deepak Pathak, Philipp Krahenbuhl, Jeff Donahue, Trevor Darrell, Alexei A. Efros, Context Encoders: Feature Learning by Inpainting, CVPR, 2016
Kenar algılama
Bütünsel Olarak Yuvalanmış Kenar Algılama
Saining Xie, Zhuowen Tu, Bütünsel Olarak Yuvalanmış Kenar Algılama, arXiv: 1504.06375.
DeepEdge
Gedas Bertasius, Jianbo Shi, Lorenzo Torresani, DeepEdge: Yukarıdan Aşağıya Kontur Tespiti için Çok Ölçekli Bifurcated Derin Ağ, CVPR, 2015.
DeepContour
Wei Shen, Xinggang Wang, Yan Wang, Xiang Bai, Zhijiang Zhang, DeepContour: Kontur Tespiti için Pozitif Paylaşım Kaybı ile Öğrenilen Derin Evrişimsel Özellik, CVPR, 2015.
Anlamsal bölümleme
Resim kaynağı: BoxSup kağıdı
SEC: Çekme, Genişletme ve Kısıtlama
Alexander Kolesnikov, Christoph Lampert, Seed, Expand and Constrain: Three Principles for Weakly-Supervised Image Segmentation, ECCV, 2016.
Adelaide
Guosheng Lin, Chunhua Shen, Ian Reid, Anton van dan Hengel, Semantik segmentasyon için derin yapılandırılmış modellerin parçalı etkili eğitimi, arXiv: 1504.01013. (VOC2012'de 1. sırada)
Guosheng Lin, Chunhua Shen, Ian Reid, Anton van den Hengel, Message Passing Inference'taki Mesajları Derinlemesine Öğrenmek, arXiv: 1508.02108. (VOC2012'de 4. sırada)
Derin Ayrıştırma Ağı (DPN)
Ziwei Liu, Xiaoxiao Li, Ping Luo, Chen Change Loy, Xiaoou Tang, Derin Ayrıştırma Ağı aracılığıyla Anlamsal Görüntü Segmentasyonu, arXiv: 1509.02634 / ICCV 2015 (VOC 2012'de 2. sırada)
CentraleSuperBoundaries, INRIA
Iasonas Kokkinos, Derin Öğrenmeyi Kullanarak Sınır Algılamada İnsanları Aşan, arXiv: 1411.07386 (VOC 2012'de 4. sırada)
BoxSup
Jifeng Dai, Kaiming He, Jian Sun, BoxSup: Anlamsal Segmentasyon için Evrişimli Ağları Denetlemek için Sınırlayıcı Kutuları Kullanmak, arXiv: 1503.01640. (VOC2012'de 6. sırada)
POBTEK
Hyeonwoo Noh, Seunghoon Hong, Bohyung Han, Learning Deconvolution Network for Semantic Segmentation, arXiv: 1505.04366. (VOC2012'de 7. sırada)
Seunghoon Hong, Hyeonwoo Noh, Bohyung Han, Yarı Denetimli Anlamsal Segmentasyon için Ayrılmış Derin Sinir Ağı, arXiv: 1506.04924.
Seunghoon Hong, Junhyuk Oh, Bohyung Han veHonglak Lee, Derin Evrişimli Sinir Ağı ile Anlamsal Segmentasyon için Aktarılabilir Bilgiyi Öğrenme, arXiv: 1512.07928
Tekrarlayan Sinir Ağları Olarak Koşullu Rastgele Alanlar
Shuai Zheng, Sadeep Jayasumana, Bernardino Romera-Paredes, Vibhav Vineet, Zhizhong Su, Dalong Du, Chang Huang, Philip H. S. Torr, Conditional Random Fields as Recurrent Neural Networks, arXiv: 1502.03240. (VOC2012'de 8. sırada)
DeepLab
Liang-Chieh Chen, George Papandreou, Kevin Murphy, Alan L. Yuille, Anlamsal görüntü segmentasyonu için bir DCNN'nin zayıf ve yarı denetimli öğrenimi, arXiv: 1502.02734. (VOC2012'de 9. sırada)
Uzaklaştır
Mohammadreza Mostajabi, Payman Yadollahpour, Gregory Shakhnarovich, Uzaklaştırma Özellikli İleri Beslemeli Anlamsal Segmentasyon, CVPR, 2015
Eklem Kalibrasyonu
Holger Caesar, Jasper Uijlings, Vittorio Ferrari, Anlamsal Segmentasyon için Ortak Kalibrasyon, arXiv: 1507.01581.
Anlamsal Bölümleme için Tam Evrişimli Ağlar
Jonathan Long, Evan Shelhamer, Trevor Darrell, Semantik Segmentasyon için Tam Evrişimli Ağlar, CVPR, 2015.
Hypercolumn
Bharath Hariharan, Pablo Arbelaez, Ross Girshick, Jitendra Malik, Hypercolumns for Object Segmentation and Fine-Grained Localization, CVPR, 2015.
Derin Hiyerarşik Ayrıştırma
Abhishek Sharma, Oncel Tuzel, David W. Jacobs, Semantik Segmentasyon için Derin Hiyerarşik Ayrıştırma, CVPR, 2015.
Sahne Etiketleme için Hiyerarşik Özellikleri Öğrenme
Clement Farabet, Camille Couprie, Laurent Najman, Yann LeCun, Çok Ölçekli Özellik Öğrenimiyle Sahne Ayrıştırma, Saflık Ağaçları ve Optimal Kapaklar, ICML, 2012.
Clement Farabet, Camille Couprie, Laurent Najman, Yann LeCun, Sahne Etiketleme için Hiyerarşik Özellikleri Öğrenme, PAMI, 2013.
Cambridge Üniversitesi
Vijay Badrinarayanan, Alex Kendall ve Roberto Cipolla "SegNet: Görüntü Segmentasyonu için Derin Evrişimli Kodlayıcı-Kod Çözücü Mimarisi." ArXiv ön baskı arXiv: 1511.00561, 2015.
Alex Kendall, Vijay Badrinarayanan ve Roberto Cipolla "Bayesian SegNet: Sahne Anlama için Derin Evrişimli Kodlayıcı-Kod Çözücü Mimarilerinde Model Belirsizliği." ArXiv ön baskı arXiv: 1511.02680, 2015.
Princeton
Fisher Yu, Vladlen Koltun, "Genişletilmiş Evrişimlerle Çok Ölçekli Bağlam Birleştirme", ICLR 2016
Washington Üniversitesi, Allen AI
Hamid Izadinia, Fereshteh Sadeghi, Santosh Kumar Divvala, Yejin Choi, Ali Farhadi, "Segment-Phrase Table for Semantic Segmentation, Visual Entailment and Paraphrasing", ICCV, 2015
INRIA
Iasonas Kokkinos, "Derin Öğrenmeyi Kullanarak Sınır Tespitinin Sınırlarını Puslamak", ICLR 2016
UCSB
Niloufar Pourian, S. Karthikeyan ve B.S. Manjunath, "Görüntü parçalarının topluluklarını öğrenerek zayıf denetimli grafik tabanlı semantik bölümleme", ICCV, 2015
Diğer kaynaklar
kurs
Derinlik Görüşü
CS231n: Görsel Tanıma için Evrişimli Sinir Ağları
ELEG 5040: Sinyal İşlemede İleri Konular (Derin Öğrenmeye Giriş)
Daha ayrıntılı kurs önerileri
CS224d: Doğal Dil İşleme için Derin Öğrenme