g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Envanter etkisi bilgisayar vizyonu ResNet'ten AlexNet'e Top100 belgeleri

1 Yeni Zhiyuan derlemesi

Kaynak: github

Derleyin ve düzenleyin: Xinzhiyuan Yazı İşleri Departmanı

Xin Zhiyuan Rehberi Bilgisayar görüşü, son yıllarda büyük bir gelişme kaydetti ve derin öğrenmenin en ileri araştırma yönünü temsil ediyor. Bu makale, 2012'den 2017'ye kadar bilgisayar görüşü alanındaki başlıca olayları sıralıyor: esas olarak kağıtlar ve diğer kuru mal kaynakları ve kaynak adresini ekleyin. ImageNet sınıflandırması, nesne algılama, nesne izleme, nesne tanıma, görüntü ve dil ve görüntü oluşturma olarak ayrılmış yüzlerce belge içerir.

Bu yılın Şubat ayında, Xinzhiyuan, optimizasyon / eğitim yöntemlerini, denetimsiz / üretken modelleri, evrişimli ağ modellerini ve görüntü segmentasyonu / hedef tespiti vb. İçeren son 5 yılda en çok alıntı yapılan 100 derin öğrenme belgesini tanıttı. On alt alan.

[Xinzhiyuan'ın resmi hesabını girin, bu klasik bilgiyi indirmek için iletişim kutusuna "Kağıt 100" girin]

Yukarıda bahsedilen derin öğrenmeyle ilgili en çok alıntı yapılan 100 makale Github'da açık kaynaklı bir projedir ve topluluğun tüm üyeleri katılabilir. Bu projede, son yıllarda sahada en fazla etkiye sahip olan makale, kitap ve blogların bir özetini içeren bilgisayar vizyonu kaynakları üzerine bir proje olan Deep Vision adlı başka bir proje bulduk. Bunların arasında, kağıt bölümünde yazar ayrıca ImageNet sınıflandırması, nesne algılama, nesne izleme, nesne tanıma, görüntü ve dil ve görüntü oluşturma olarak ikiye ayrılır.

Klasik kağıtlar

ImageNet sınıflandırması

Nesne algılama

Nesne izleme

Düşük düzey görme

Süper çözünürlük
diğer uygulamalar

Kenar algılama

Anlamsal bölümleme

Görsel dikkat ve belirginlik

Nesne tanıma

İnsan vücudu poz tahmini

CNN ilkesi ve doğası (CNN'i Anlamak)

Görüntü ve dil

Resim açıklaması
Video yorumu
Soru-Cevap

Görüntü oluşturma

Yukarıdakiler, bu makalelerin, yazarların ve kurumların bazı anahtar kelimelerine dayanan bir ısı haritasıdır.

ImageNet sınıflandırması

Resim kaynağı: AlexNet kağıdı

Microsoft ResNet

Kağıt: Görüntü Tanıma için Derin Artık Ağ

Yazar: Ho Kai Ming, Zhang Xiang Yu ve Sun Jian Ren Shaoqing

Microsoft PRelu (rastgele düzeltilmiş doğrusal birim / ağırlık başlatma)

Kağıt: Derin Öğrenme Doğrultucu: ImageNet Sınıflandırmasında İnsan Seviyesini Aşmak

Yazar: Ho Kai Ming, Zhang Xiang Yu ve Sun Jian Ren Shaoqing

Bağlantı: https://arxiv.org/pdf/1502.01852.pdf

Google Toplu Normalleştirme

Kağıt: Toplu Normalleştirme: Dahili Değişkenleri Azaltarak Derin Ağ Eğitimini Hızlandırma

Yazar: Sergey Ioffe, Christian Szegedy

Bağlantı: https://arxiv.org/pdf/1502.03167.pdf

Google GoogLeNet

Makale: Deeper Convolution, CVPR 2015

Yazar: Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich

Bağlantı: https://arxiv.org/pdf/1409.4842.pdf

Oxford VGG-Net

Makale: Büyük Ölçekli Görsel Tanıma Alanında Çok Derin Evrişimli Ağlar, ICLR 2015

Yazar: Karen Simonyan ve Andrew Zisserman

Bağlantı: https://arxiv.org/pdf/1409.1556.pdf

AlexNet

Kağıt: Derin evrişimli sinir ağları kullanan ImageNet sınıflandırması

Yazar: Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton

Nesne algılama

Görüntü kaynağı: Daha hızlı RCNN kağıdı

PVANET

Kağıt: Gerçek Zamanlı Nesne Algılama için Derin Ama Hafif Sinir Ağları (PVANET: Gerçek Zamanlı Nesne Algılama için Derin ama Hafif Sinir Ağları)

Yazar: Kye-Hyeon Kim, Sanghoon Hong, Byungseok Roh, Yeongjae Cheon, Minje Park

Bağlantı: https://arxiv.org/pdf/1608.08021

New York Üniversitesi OverFeat

Makale: Tanıma, Yerelleştirme ve Algılama için Evrişimli Ağları Kullanma (OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks), ICLR 2014

Yazar: Pierre Sermanet, David Eigen, Xiang Zhang, Michael Mathieu, Rob Fergus, Yann LeCun

Bağlantı: https://arxiv.org/pdf/1312.6229.pdf

Berkeley R-CNN

Kağıt: Doğru nesne algılama ve anlamsal bölümleme için zengin özellik hiyerarşileri (Doğru nesne algılama ve anlamsal bölümleme için zengin özellik hiyerarşileri), CVPR 2014

Yazar: Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik

Bağlantı:

Microsoft SPP

Makale: Görsel Tanıma için Derin Evrişimli Ağlarda Uzamsal Piramit Havuzlaması, ECCV 2014

Yazar: Ho Kai Ming, Zhang Xiang Yu ve Sun Jian Ren Shaoqing

Bağlantı: https://arxiv.org/pdf/1406.4729.pdf

Microsoft Hızlı R-CNN

Kağıt: Hızlı R-CNN

Yazar: Ross Girshick

Bağlantı: https://arxiv.org/pdf/1504.08083.pdf

Microsoft Daha Hızlı R-CNN

Kağıt: RPN ile Gerçek Zamanlı Nesne Algılamaya Doğru (Daha Hızlı R-CNN: Bölge Teklif Ağlarıyla Gerçek Zamanlı Nesne Algılamaya Doğru)

Yazarlar: Ren Shaoqing, Ho Kai Ming, Ross Girshick, Sun Jian

Bağlantı: https://arxiv.org/pdf/1506.01497.pdf

Oxford Üniversitesi R-CNN eksi R

Kağıt: R-CNN eksi R

Yazar: Karel Lenc, Andrea Vedaldi

Bağlantı: https://arxiv.org/pdf/1506.06981.pdf

Uçtan uca yaya algılama

Kağıt: Kalabalık Ortamlarda Uçtan Uca İnsan Algılama

Yazar: Russell Stewart, Mykhaylo Andriluka

Bağlantı: https://arxiv.org/pdf/1506.04878.pdf

Gerçek zamanlı nesne algılama

Kağıt: Yalnızca Bir Kez Bakarsınız: Birleşik, Gerçek Zamanlı Nesne Algılama

Yazar: Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi

Bağlantı: https://arxiv.org/pdf/1506.02640.pdf

İç-Dış Net

Makale: Atlama Havuzlama ve Tekrarlayan Sinir Ağları ile Bağlamdaki Nesneleri Algılama (İç-Dış Ağ: Atlama Havuzlama ve Tekrarlayan Sinir Ağları ile Bağlamdaki Nesneleri Algılama)

Yazar: Sean Bell, C. Lawrence Zitnick, Kavita Bala, Ross Girshick

Bağlantı: https://arxiv.org/abs/1512.04143.pdf

R-FCN

Belge: Bölge Tabanlı Tamamen Evrişimli Ağlar aracılığıyla Nesne Tanıma (R-FCN: Bölge Tabanlı Tamamen Evrişimli Ağlar aracılığıyla Nesne Algılama)

Yazar: Nesil zirve sezonu, Li Yi, Ho Kai Ming, Sun Jian

Bağlantı: https://arxiv.org/abs/1605.06409

SSD

Kağıt: Tek Atış Çoklu Kutu Dedektörü (SSD: Tek Atış Çoklu Kutu Dedektörü)

Yazar: Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg

Bağlantı: https://arxiv.org/pdf/1512.02325v2.pdf

Hız / doğruluk değiş tokuşu

Kağıt: Modern evrişimli nesne dedektörleri için hız / doğruluk değiş tokuşları

Yazar: Jonathan Huang, Vivek Rathod, Chen Sun, Menglong Zhu, Anoop Korattikara, Alireza Fathi, Ian Fischer, Zbigniew Wojna, Yang Song, Sergio Guadarrama, Kevin Murphy

Bağlantı: https://arxiv.org/pdf/1611.10012v1.pdf

Nesne izleme

Makale: Konvolüsyonel Sinir Ağı ile Ayrımcı Belirginlik Haritası Öğrenerek Çevrimiçi İzleme (Konvolüsyonel Sinir Ağı ile Ayrımcı Belirginlik Haritası Öğrenerek Çevrimiçi İzleme)

Yazar: Seunghoon Hong, Tackgeun You, Suha Kwak, Bohyung Han

Adres: arXiv: 1502.06796.

Makale: DeepTrack: Görsel İzleme için Evrişimli Sinir Ağları ile Ayrımcı Özellik Temsillerinin Öğrenilmesi (DeepTrack: Görsel İzleme için Konvolüsyonel Sinir Ağları Tarafından Ayrımcı Özellik Temsillerinin Öğrenilmesi)

Yazarlar: Hanxi Li, Yi Li ve Fatih Porikli

Yayın: BMVC, 2014.

Bildiri: Görsel İzleme için Derin Kompakt Görüntü Temsili Öğrenmek

Yazar: N Wang, DY Yeung

Yayınlandı: NIPS, 2013.

Belge: Görsel İzleme için Hiyerarşik Evrişimli Özellikler

Yazarlar: Chao Ma, Jia-Bin Huang, Xiaokang Yang ve Ming-Hsuan Yang

Yayınlanma Tarihi: ICCV 2015

Kağıt: Tamamen Evrişimli Ağlarla Görsel İzleme

Yazar: Lijun Wang, Wanli Ouyang, Xiaogang Wang ve Huchuan Lu,

Yayınlanma Tarihi: ICCV 2015

Kağıt: Görsel izleme için çok alanlı evrişimli sinir ağını öğrenme

(Görsel İzleme için Çok Alanlı Evrişimli Sinir Ağlarını Öğrenme)

Yazar: Hyeonseob Namand Bohyung Han

Nesne tanıma

Kağıt: Evrişimli sinir ağları ile zayıf denetimli öğrenme

Yazar: Maxime Oquab, Leon Bottou, Ivan Laptev, Josef Sivic, CVPR, 2015

Bağlantı:

FV-CNN

Kağıt: Doku Tanıma ve Segmentasyon için Derin Filtre Bankaları

Yazar: Mircea Cimpoi, Subhransu Maji, Andrea Vedaldi, CVPR, 2015.

Bağlantı:

İnsan Duruşu Tahmini

Kağıt: Parça Benzeşme Alanlarını Kullanarak Gerçek Zamanlı Çok Kişili 2D Poz Tahmini

Yazar: Zhe Cao, Tomas Simon, Shih-En Wei ve Yaser Sheikh, CVPR, 2017.

Kağıt: Derin kesme: Çok kişili poz tahmini için ortak alt küme bölümü ve etiketleme (Derin kesim: Çok kişili poz tahmini için ortak alt küme bölümü ve etiketleme)

Yazar: Leonid Pishchulin, Eldar Insafutdinov, Siyu Tang, Bjoern Andres, Mykhaylo Andriluka, Peter Gehler ve Bernt Schiele, CVPR, 2016.

Kağıt: Evrişimli poz makineleri

Yazar: Shih-En Wei, Varun Ramakrishna, Takeo Kanade ve Yaser Sheikh, CVPR, 2016.

Kağıt: İnsan poz tahmini için yığılmış kum saati ağları (İnsan poz tahmini için yığılmış kum saati ağları)

Yazar: Alejandro Newell, Kaiyu Yang ve Jia Deng, ECCV, 2016.

Kağıt: Videolarda insan pozu tahmini için akan konvnetler (Videolarda insan pozu tahmini için akan konvnetler)

Yazar: Tomas Pfister, James Charles ve Andrew Zisserman, ICCV, 2015.

Kağıt: Evrişimli bir ağın ortak eğitimi ve insan pozu tahmini için grafiksel bir model

Yazar: Jonathan J.Tompson, Arjun Jain, Yann LeCun, Christoph Bregler, NIPS, 2014.

CNN'i Anlamak

Kağıt: Eşdeğerlik ve eşdeğerliklerini ölçerek görüntü temsillerini anlama

Yazar: Karel Lenc, Andrea Vedaldi, CVPR, 2015.

Bağlantı:

Kağıt: Derin Sinir Ağları Kolayca Kandırılır: Tanınmayan Görüntüler İçin Yüksek Güvenle Tahminler (Derin Sinir Ağları Kolayca Kandırılır: Tanınmayan Görüntüler İçin Yüksek Güvenle Tahminler)

Yazar: Anh Nguyen, Jason Yosinski, Jeff Clune, CVPR, 2015.

Bağlantı:

Kağıt: Derin Görüntü Temsillerini Ters Çevirerek Anlamak

Yazar: Aravindh Mahendran, Andrea Vedaldi, CVPR, 2015

Bağlantı:

Kağıt: Nesne Dedektörleri Derin Sahne CNN'lerinde Ortaya Çıkıyor

Yazar: Bolei Zhou, Aditya Khosla, Agata Lapedriza, Aude Oliva, Antonio Torralba, ICLR, 2015.

Kağıt: Evrişimli Ağlarla Görsel Temsilleri Tersine Çevirme

Yazar: Alexey Dosovitskiy, Thomas Brox, arXiv, 2015.

Belge: Evrişimli Ağları Görselleştirme ve Anlama

Yazar: Matthrew Zeiler, Rob Fergus, ECCV, 2014.

Bağlantı: https://www.cs.nyu.edu/~fergus/papers/zeilerECCV2014.pdf

Görüntü ve dil

Resim Yazısı

Resim: (Andrej Karpathy, Li Fei-Fei'den, Görüntü Tanımı Oluşturmak İçin Derin Görsel-Anlamsal Hizalamalar, CVPR, 2015.)

UCLA / Baidu

Multimodal Tekrarlayan Sinir Ağları ile Görüntüleri Açıklayın

Junhua Mao, Wei Xu, Yi Yang, Jiang Wang, Alan L. Yuille, arXiv: 1410.1090

Toronto

Görsel-Anlamsal Gömmeleri Multimodal Sinir Dili Modelleriyle Birleştirme

Ryan Kiros, Ruslan Salakhutdinov, Richard S.Zemel, arXiv: 1411.2539.

Berkeley

Görsel Tanıma ve Tanımlama için Uzun Süreli Tekrarlayan Evrişimli Ağlar (Görsel Tanıma ve Tanımlama için Uzun Süreli Tekrarlayan Evrişimli Ağlar)

Jeff Donahue, Lisa Anne Hendricks, Sergio Guadarrama, Marcus Rohrbach, Subhashini Venugopalan, Kate Saenko, Trevor Darrell, arXiv: 1411.4389.

Google

Resimlere bakın ve kelimeler yazın: Göster ve Anlat: Bir Sinirsel Görüntü Başlığı Oluşturucu

Oriol Vinyals, Alexander Toshev, Samy Bengio, Dumitru Erhan, arXiv: 1411.4555.

Stanford

Görüntü Açıklaması Oluşturmak için Derin Görsel-Anlamsal Hizalamalar (Görüntü Açıklaması Oluşturmak İçin Derin Görsel-Anlamsal Hizalamalar)

Andrej Karpathy, Li Fei-Fei, CVPR, 2015.

UML / UT

Tekrarlayan Derin Sinir Ağlarını Kullanarak Videoları Doğal Dile Çevirme

Subhashini Venugopalan, Huijuan Xu, Jeff Donahue, Marcus Rohrbach, Raymond Mooney, Kate Saenko, NAACL-HLT, 2015.

CMU / Microsoft

Resim Yazısı Oluşturma için Tekrarlayan Görsel Temsili Öğrenme

Xinlei Chen, C. Lawrence Zitnick, arXiv: 1411.5654.

Xinlei Chen, C. Lawrence Zitnick, Zihin Gözü: Resim Yazısı Üretimi için Tekrarlayan Görsel Temsil, CVPR 2015

Microsoft

Altyazılardan Görsel Kavramlara ve Geri

Hao Fang, Saurabh Gupta, Forrest Iandola, Rupesh Srivastava, Li Deng, Piotr Dollár, Jianfeng Gao, Xiaodong He, Margaret Mitchell, John C. Platt, C. Lawrence Zitnick, Geoffrey Zweig, CVPR, 2015.

Üniv. Montreal / Üniv. Toronto

Göster, Katıl ve Söyle: Görsel Katılım ve Söyle: Görsel Dikkatle Nöral Görüntü Altyazısı Oluşturma

Kelvin Xu, Jimmy Lei Ba, Ryan Kiros, Kyunghyun Cho, Aaron Courville, Ruslan Salakhutdinov, Richard S.Zemel, Yoshua Bengio, arXiv: 1502.03044 / ICML 2015

Idiap / EPFL / Facebook

Cümle Tabanlı Resim Yazısı

Remi Lebret, Pedro O. Pinheiro, Ronan Collobert, arXiv: 1502.03671 / ICML 2015

UCLA / Baidu

Çocuk gibi öğrenmek: Çocuk Gibi Öğrenme: Görsellerin Cümle Tanımlarından Öğrenme Hızlı Roman Görsel Kavram

Junhua Mao, Wei Xu, Yi Yang, Jiang Wang, Zhiheng Huang, Alan L. Yuille, arXiv: 1504.06692

MS + Berkeley

Resim Yazısı İçin En Yakın Komşu Yaklaşımlarını Keşfetme

Jacob Devlin, Saurabh Gupta, Ross Girshick, Margaret Mitchell, C. Lawrence Zitnick, arXiv: 1505.04467

Resim Yazısı İçin Dil Modelleri: Tuhaflıklar ve İşe Yarayanlar

Jacob Devlin, Hao Cheng, Hao Fang, Saurabh Gupta, Li Deng, Xiaodong He, Geoffrey Zweig, Margaret Mitchell, arXiv: 1505.01809

Adelaide

Ara Nitelikler Katmanı ile Resim Yazısı

Qi Wu, Chunhua Shen, Anton van den Hengel, Lingqiao Liu, Anthony Dick, arXiv: 1506.01144

Tilburg

Resimlerle dil öğrenmek

Grzegorz Chrupala, Akos Kadar, Afra Alishahi, arXiv: 1506.03694

Montreal Üniversitesi

Dikkat Temelli Kodlayıcı-Kod Çözücü Ağlarını kullanarak multimedya içeriğini tanımlama (Dikkat Temelli Kodlayıcı-Kod Çözücü Ağlarını Kullanarak Multimedya İçeriğini Tanımlama)

Kyunghyun Cho, Aaron Courville, Yoshua Bengio, arXiv: 1507.01053

Cornell

Sinirsel Görüntü Yazımında Görüntü Temsilleri ve Yeni Etki Alanları

Jack Hessel, Nicolas Savva, Michael J. Wilber, arXiv: 1508.02091

HongKong MS + Şehir Üniv.

Sıralama Kanonik Korelasyon Analizi ile Sorgu ve Görüntü Benzerliklerini Öğrenmek

Ting Yao, Tao Mei ve Chong-Wah Ngo, ICCV, 2015

Video Altyazı

Berkeley

Jeff Donahue, Lisa Anne Hendricks, Sergio Guadarrama, Marcus Rohrbach, Subhashini Venugopalan, Kate Saenko, Trevor Darrell, Long-term Recurrent Convolutional Networks for Visual Recognition and Description, CVPR, 2015.

Utah / UML / Berkeley

Subhashini Venugopalan, Huijuan Xu, Jeff Donahue, Marcus Rohrbach, Raymond Mooney, Kate Saenko, Derin Tekrarlayan Sinir Ağlarını Kullanarak Videoları Doğal Dile Çevirmek, arXiv: 1412.4729.

Microsoft

Yingwei Pan, Tao Mei, Ting Yao, Houqiang Li, Yong Rui, Ortak Modelleme Gömme ve Köprü Video ve Diline Çeviri, arXiv: 1505.01861.

Utah / UML / Berkeley

Subhashini Venugopalan, Marcus Rohrbach, Jeff Donahue, Raymond Mooney, Trevor Darrell, Kate Saenko, Sequence to Sequence - Video to Text, arXiv: 1505.00487.

Montreal Üniversitesi / Sherbrooke

Li Yao, Atousa Torabi, Kyunghyun Cho, Nicolas Ballas, Christopher Pal, Hugo Larochelle, Aaron Courville, Zamansal Yapıyı Kullanarak Videoların Açıklanması, arXiv: 1502.08029

MPI / Berkeley

Anna Rohrbach, Marcus Rohrbach, Bernt Schiele, The Long-Short Story of Movie Description, arXiv: 1506.01698

Toronto Üniversitesi / MIT

Yukun Zhu, Ryan Kiros, Richard Zemel, Ruslan Salakhutdinov, Raquel Urtasun, Antonio Torralba, Sanja Fidler, Aligning Books and Movies: Towards Story-like Visual Explanations by Movie Watching Books Books, arXiv: 1506.06724

Montreal Üniversitesi

Kyunghyun Cho, Aaron Courville, Yoshua Bengio, Dikkat Temelli Kodlayıcı-Kod Çözücü Ağlarını Kullanarak Multimedya İçeriğini Tanımlama, arXiv: 1507.01053

TAU / Güney Kaliforniya Üniversitesi

Dotan Kaufman, Gil Levi, Tal Hassner, Lior Wolf, Video Ek Açıklama ve Özetleme için Geçici Mozaikleme, arXiv: 1612.06950.

Görüntü oluşturma

Evrişimli / tekrarlayan ağ

Kağıt: PixelCNN Kod Çözücülerle Koşullu Görüntü Oluşturma "

Yazar: Aäron van den Oord, Nal Kalchbrenner, Oriol Vinyals, Lasse Espeholt, Alex Graves, Koray Kavukcuoğlu

Makale: Evrişimli Sinir Ağları ile Sandalye Oluşturmayı Öğrenmek

Yazar: Alexey Dosovitskiy, Jost Tobias Springenberg, Thomas Brox

Yayınlandı: CVPR, 2015.

Kağıt: ÇİZİM: Görüntü Oluşturma İçin Tekrarlayan Bir Sinir Ağı

Yazar: Karol Gregor, Ivo Danihelka, Alex Graves, Danilo Jimenez Rezende, Daan Wierstra

Yayınlandı: ICML, 2015.

Yüzleşme Ağı

Makale: Generative Adversarial Networks

Yazar: Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio

Yayınlandı: NIPS, 2014.

Makale: Bir Laplacian Düşman Ağları Piramidi kullanan Derin Üretken Görüntü Modelleri (Laplacian Düşman Ağları Piramidi kullanan Derin Üretken Görüntü Modelleri)

Yazarlar: Emily Denton, Soumith Chintala, Arthur Szlam, Rob Fergus

Yayınlandı: NIPS, 2015.

Kağıt: Üretken modellerin değerlendirilmesine ilişkin bir not

Yazar: Lucas Theis, Aäron van den Oord, Matthias Bethge

Yayınlanma tarihi: ICLR 2016.

Kağıt: Değişken Olarak Otomatik Kodlanmış Derin Gauss Süreçleri (Değişken Olarak Otomatik Kodlanmış Derin Gauss Süreçleri)

Yazar: Zhenwen Dai, Andreas Damianou, Javier Gonzalez, Neil Lawrence

Yayınlanma tarihi: ICLR 2016.

Tez: Dikkat mekanizmasını kullanarak Başlıklardan Dikkat Çekerek Görüntü Oluşturma

Yazar: Elman Mansimov, Emilio Parisotto, Jimmy Ba, Ruslan Salakhutdinov

Yayınlanma Tarihi: ICLR 2016

Makale: Kategorik Üretken Çekişmeli Ağlar ile Denetimsiz ve Yarı Denetimli Öğrenme

Yazar: Jost Tobias Springenberg

Yayınlanma Tarihi: ICLR 2016

Makale: Bir Düşmanla Temsilleri Sansürlemek

Yazar: Harrison Edwards, Amos Storkey

Yayınlanma Tarihi: ICLR 2016

Kağıt: Sanal Tartışmalı Eğitim ile Dağıtımsal Düzeltme

Yazar: Takeru Miyato, Shin-ichi Maeda, Masanori Koyama, Ken Nakae, Shin Ishii

Yayınlanma Tarihi: ICLR 2016

Kağıt: Doğal Görüntü Manifoldunda Üretken Görsel Manipülasyon

Yazar: Zhu Junyan, Philipp Krahenbuhl, Eli Shechtman ve Alexei A. Efros

Yayınlanma tarihi: ECCV 2016.

Bildiri: Derin Evrişimli Üretken Çekişmeli Ağlar ile Denetimsiz Temsil Öğrenimi

Yazar: Alec Radford, Luke Metz, Soumith Chintala

Yayınlanma Tarihi: ICLR 2016

soru cevap

Resim: (Stanislaw Antol, Aishwarya Agrawal, Jiasen Lu, Margaret Mitchell, Dhruv Batra, C. Lawrence Zitnick, Devi Parikh, VQA: Görsel Soru Cevaplama, CVPR, 2015 SUNw: Sahne Anlama atölyesi)

Virginia Üniversitesi / Microsoft Araştırmaları

Bildiri: VQA: Görsel Soru Cevaplama, CVPR, 2015 SUNw: Sahne Anlama atölyesi.

Yazar: Stanislaw Antol, Aishwarya Agrawal, Jiasen Lu, Margaret Mitchell, Dhruv Batra, C. Lawrence Zitnick, Devi Parikh

MPI / Berkeley

Bildiri: Nöronlarınıza Sorun: Görüntüler Hakkındaki Soruları Yanıtlamaya Nöral Temelli Bir Yaklaşım

Yazarlar: Mateusz Malinowski, Marcus Rohrbach, Mario Fritz,

Sürüm: arXiv: 1505.01121.

Toronto

Bildiri: Görüntü Soru Cevaplama: Görsel Anlamsal Gömme Modeli ve Yeni Veri Kümesi

Yazarlar: Mengye Ren, Ryan Kiros, Richard Zemel

Yayın tarihi: arXiv: 1505.02074 / ICML 2015 derin öğrenme atölyesi.

Baidu / Kaliforniya Üniversitesi, Los Angeles

Yazar: Hauyuan Gao, Junhua Mao, Jie Zhou, Zhiheng Huang, Lei Wang, Xu Wei

Kağıt: Bir Makineyle mi Konuşuyorsunuz? Çok Dilli Görüntü için Veri Kümesi ve Yöntemleri Soru Cevaplama

Yayın tarihi: arXiv: 1505.05612.

POBTEK (Güney Kore)

Kağıt: Dinamik Parametre Tahmini ile Evrişimli Sinir Ağını Kullanarak Görüntü Soru Cevaplama

Yazar: Hyeonwoo Noh, Paul Hongsuck Seo ve Bohyung Han

Yayın tarihi: arXiv: 1511.05765

CMU / Microsoft Araştırması

Kağıt: Resimli Soru Cevaplama için Yığınlanmış Dikkat Ağları

Yazar: Yang, Z., He, X., Gao, J., Deng, L. ve Smola, A. (2015)

Yayın tarihi: arXiv: 1511.02274.

MetaMind

Bildiri: Görsel ve Metinsel Soru Cevaplama için Dinamik Bellek Ağları

Yazar: Xiong, Caiming, Stephen Merity ve Richard Socher

Yayın tarihi: arXiv: 1603.01417 (2016).

Seul Ulusal Üniversitesi + NAVER

Bildiri: Görsel Kalite Güvencesi için Çok Modlu Artık Öğrenme

Yazar: Jin-Hwa Kim, Sang-Woo Lee, Dong-Hyun Kwak, Min-Oh Heo, Jeonghee Kim, Jung-Woo Ha, Byoung-Tak Zhang

Yayın tarihi: arXiv: 1606: 01455

UC Berkeley + Sony

Makale: Görsel Soru Cevaplama ve Görsel Topraklama için Çok Modlu Kompakt Bilineer Havuzlama

Yazarlar: Akira Fukui, Dong Huk Park, Daylen Yang, Anna Rohrbach, Trevor Darrell ve Marcus Rohrbach

Yayın tarihi: arXiv: 1606.01847

Postech

Belge: MYK için Ortak Kayıp Minimizasyonu ile Tekrarlayan Cevaplama Birimlerinin Eğitimi

Yazar: Hyeonwoo Noh ve Bohyung Han

Yayın tarihi: arXiv: 1606.03647

Seul Ulusal Üniversitesi + NAVER

Kağıt: Düşük Sıralı Bilineer Havuzlama için Hadamard Ürünü

Yazar: Jin-Hwa Kim, Kyoung Woon On, Jeonghee Kim, Jung-Woo Ha, Byoung-Tak Zhan

Yayın tarihi: arXiv: 1610.04325.

Görsel dikkat ve belirginlik

Bay-CNN

Kağıt: Evrişimli Sinir Ağlarını Kullanarak Göz Fiksasyonlarını Tahmin Etme

Yazar: Nian Liu, Junwei Han, Dingwen Zhang, Shifeng Wen, Tianming Liu

Yayınlandı: CVPR, 2015.

Öğrenim noktalarının sürekli aranması

Yazar: Yer İşaretleri için Sıralı Aramayı Öğrenme

Makaleler: Saurabh Singh, Derek Hoiem, David Forsyth

Yayınlandı: CVPR, 2015.

Çoklu nesne tanıma için görsel dikkat mekanizması

Kağıt: Görsel Dikkatle Çoklu Nesne Tanıma

Yazar: Jimmy Lei Ba, Volodymyr Mnih, Koray Kavukcuoğlu,

Yayınlandı: ICLR, 2015.

Tekrarlayan görsel dikkat mekanizması modeli

Yazar: Volodymyr Mnih, Nicolas Heess, Alex Graves, Koray Kavukcuoğlu

Makale: Tekrarlayan Görsel Dikkat Modelleri

Yayınlandı: NIPS, 2014.

Düşük düzey görme

Süper çözünürlük

Yinelemeli Görüntü Yeniden Yapılandırma

Sven Behnke: Yinelemeli Görüntü Yeniden Yapılandırmayı Öğrenmek, IJCAI, 2001.
Sven Behnke: Sinirsel Soyutlama Piramidinde Yinelemeli Görüntü Yeniden Yapılandırmayı Öğrenme International Journal of Computational Intelligence and Applications, cilt 1, no. 4, s. 427-438, 2001.

Süper Çözünürlük (SRCNN)

Chao Dong, Chen Change Loy, Kaiming He, Xiaoou Tang, Görüntü Süper Çözünürlüğü için Derin Evrişimli Ağ Öğrenme, ECCV, 2014.
Chao Dong, Chen Change Loy, Kaiming He, Xiaoou Tang, Derin Evrişimli Ağları Kullanan Görüntü Süper Çözünürlük, arXiv: 1501.00092.

Çok Derin Süper Çözünürlük

Jiwon Kim, Jung Kwon Lee, Kyoung Mu Lee, Çok Derin Evrişimli Ağlar Kullanarak Doğru Görüntü Süper Çözünürlüğü, arXiv: 1511.04587, 2015.

Derinden Yinelemeli Evrişimli Ağ

Jiwon Kim, Jung Kwon Lee, Kyoung Mu Lee, Görüntü Süper Çözünürlük için Derin Özyinelemeli Evrişim Ağı, arXiv: 1511.04491, 2015.

Casade-Seyrek-Kodlama-Ağı

Zhaowen Wang, Ding Liu, Wei Han, Jianchao Yang ve Thomas S. Huang, Deep Networks for Image Super-Resolution with Sparse Prior. ICCV, 2015.

Süper Çözünürlük için Algısal Kayıplar

Justin Johnson, Alexandre Alahi, Li Fei-Fei, Gerçek Zamanlı Stil Aktarımı ve Süper Çözünürlük için Algısal Kayıplar, arXiv: 1603.08155, 2016.

SRGAN

Christian Ledig, Lucas Theis, Ferenc Huszar, Jose Caballero, Andrew Cunningham, Alejandro Acosta, Andrew Aitken, Alykhan Tejani, Johannes Totz, Zehan Wang, Wenzhe Shi, Generative Adversarial Network Kullanarak Foto-Gerçekçi Tek Görüntü Süper Çözünürlük, arXiv: 1609.04802 v3, 2016.

diğer uygulamalar

Optik Akış (FlowNet)

Philipp Fischer, Alexey Dosovitskiy, Eddy Ilg, Philip Häusser, Caner Hazırbaş, Vladimir Golkov, Patrick van der Smagt, Daniel Cremers, Thomas Brox, FlowNet: Evrişimli Ağlarla Optik Akışı Öğrenme, arXiv: 1504.06852.

Sıkıştırma Artefaktlarının Azaltılması

Chao Dong, Yubin Deng, Chen Change Loy, Xiaoou Tang, Compression Artifacts Reduction by a Deep Convolutional Network, arXiv: 1504.06993.

Bulanıklığı Giderme

Christian J. Schuler, Michael Hirsch, Stefan Harmeling, Bernhard Schölkopf, Learning to Deblur, arXiv: 1406.7444
Jian Sun, Wenfei Cao, Zongben Xu, Jean Ponce, Tekdüze Olmayan Hareket Bulanıklığını Giderme için Evrişimli Sinir Ağını Öğrenme, CVPR, 2015

Görüntü Ters Evrişimi

Li Xu, Jimmy SJ. Ren, Ce Liu, Jiaya Jia, Görüntü Ters Evrişimi için Derin Evrişimli Sinir Ağı, NIPS, 2014.

Derin Kenara Duyarlı Filtre

Li Xu, Jimmy SJ. Ren, Qiong Yan, Renjie Liao, Jiaya Jia, Deep Edge-Aware Filters, ICML, 2015.

Stereo Eşleştirme Maliyetini Evrişimli Sinir Ağı ile Hesaplama

Jure bontar, Yann LeCun, Stereo Eşleştirme Maliyetini Evrişimli Sinir Ağı ile Hesaplamak, CVPR, 2015.

Renkli Görüntü Renklendirme Richard Zhang, Phillip Isola, Alexei A. Efros, ECCV, 2016
Inpainting ile Özellik Öğrenimi

Deepak Pathak, Philipp Krahenbuhl, Jeff Donahue, Trevor Darrell, Alexei A. Efros, Context Encoders: Feature Learning by Inpainting, CVPR, 2016

Kenar algılama

Bütünsel Olarak Yuvalanmış Kenar Algılama

Saining Xie, Zhuowen Tu, Bütünsel Olarak Yuvalanmış Kenar Algılama, arXiv: 1504.06375.

DeepEdge

Gedas Bertasius, Jianbo Shi, Lorenzo Torresani, DeepEdge: Yukarıdan Aşağıya Kontur Tespiti için Çok Ölçekli Bifurcated Derin Ağ, CVPR, 2015.

DeepContour

Wei Shen, Xinggang Wang, Yan Wang, Xiang Bai, Zhijiang Zhang, DeepContour: Kontur Tespiti için Pozitif Paylaşım Kaybı ile Öğrenilen Derin Evrişimsel Özellik, CVPR, 2015.

Anlamsal bölümleme

Resim kaynağı: BoxSup kağıdı

SEC: Çekme, Genişletme ve Kısıtlama

Alexander Kolesnikov, Christoph Lampert, Seed, Expand and Constrain: Three Principles for Weakly-Supervised Image Segmentation, ECCV, 2016.

Adelaide

Guosheng Lin, Chunhua Shen, Ian Reid, Anton van dan Hengel, Semantik segmentasyon için derin yapılandırılmış modellerin parçalı etkili eğitimi, arXiv: 1504.01013. (VOC2012'de 1. sırada)
Guosheng Lin, Chunhua Shen, Ian Reid, Anton van den Hengel, Message Passing Inference'taki Mesajları Derinlemesine Öğrenmek, arXiv: 1508.02108. (VOC2012'de 4. sırada)

Derin Ayrıştırma Ağı (DPN)

Ziwei Liu, Xiaoxiao Li, Ping Luo, Chen Change Loy, Xiaoou Tang, Derin Ayrıştırma Ağı aracılığıyla Anlamsal Görüntü Segmentasyonu, arXiv: 1509.02634 / ICCV 2015 (VOC 2012'de 2. sırada)

CentraleSuperBoundaries, INRIA

Iasonas Kokkinos, Derin Öğrenmeyi Kullanarak Sınır Algılamada İnsanları Aşan, arXiv: 1411.07386 (VOC 2012'de 4. sırada)

BoxSup

Jifeng Dai, Kaiming He, Jian Sun, BoxSup: Anlamsal Segmentasyon için Evrişimli Ağları Denetlemek için Sınırlayıcı Kutuları Kullanmak, arXiv: 1503.01640. (VOC2012'de 6. sırada)

POBTEK

Hyeonwoo Noh, Seunghoon Hong, Bohyung Han, Learning Deconvolution Network for Semantic Segmentation, arXiv: 1505.04366. (VOC2012'de 7. sırada)
Seunghoon Hong, Hyeonwoo Noh, Bohyung Han, Yarı Denetimli Anlamsal Segmentasyon için Ayrılmış Derin Sinir Ağı, arXiv: 1506.04924.
Seunghoon Hong, Junhyuk Oh, Bohyung Han veHonglak Lee, Derin Evrişimli Sinir Ağı ile Anlamsal Segmentasyon için Aktarılabilir Bilgiyi Öğrenme, arXiv: 1512.07928

Tekrarlayan Sinir Ağları Olarak Koşullu Rastgele Alanlar

Shuai Zheng, Sadeep Jayasumana, Bernardino Romera-Paredes, Vibhav Vineet, Zhizhong Su, Dalong Du, Chang Huang, Philip H. S. Torr, Conditional Random Fields as Recurrent Neural Networks, arXiv: 1502.03240. (VOC2012'de 8. sırada)

DeepLab

Liang-Chieh Chen, George Papandreou, Kevin Murphy, Alan L. Yuille, Anlamsal görüntü segmentasyonu için bir DCNN'nin zayıf ve yarı denetimli öğrenimi, arXiv: 1502.02734. (VOC2012'de 9. sırada)

Uzaklaştır

Mohammadreza Mostajabi, Payman Yadollahpour, Gregory Shakhnarovich, Uzaklaştırma Özellikli İleri Beslemeli Anlamsal Segmentasyon, CVPR, 2015

Eklem Kalibrasyonu

Holger Caesar, Jasper Uijlings, Vittorio Ferrari, Anlamsal Segmentasyon için Ortak Kalibrasyon, arXiv: 1507.01581.

Anlamsal Bölümleme için Tam Evrişimli Ağlar

Jonathan Long, Evan Shelhamer, Trevor Darrell, Semantik Segmentasyon için Tam Evrişimli Ağlar, CVPR, 2015.

Hypercolumn

Bharath Hariharan, Pablo Arbelaez, Ross Girshick, Jitendra Malik, Hypercolumns for Object Segmentation and Fine-Grained Localization, CVPR, 2015.

Derin Hiyerarşik Ayrıştırma

Abhishek Sharma, Oncel Tuzel, David W. Jacobs, Semantik Segmentasyon için Derin Hiyerarşik Ayrıştırma, CVPR, 2015.

Sahne Etiketleme için Hiyerarşik Özellikleri Öğrenme

Clement Farabet, Camille Couprie, Laurent Najman, Yann LeCun, Çok Ölçekli Özellik Öğrenimiyle Sahne Ayrıştırma, Saflık Ağaçları ve Optimal Kapaklar, ICML, 2012.
Clement Farabet, Camille Couprie, Laurent Najman, Yann LeCun, Sahne Etiketleme için Hiyerarşik Özellikleri Öğrenme, PAMI, 2013.

Cambridge Üniversitesi

Vijay Badrinarayanan, Alex Kendall ve Roberto Cipolla "SegNet: Görüntü Segmentasyonu için Derin Evrişimli Kodlayıcı-Kod Çözücü Mimarisi." ArXiv ön baskı arXiv: 1511.00561, 2015.

Alex Kendall, Vijay Badrinarayanan ve Roberto Cipolla "Bayesian SegNet: Sahne Anlama için Derin Evrişimli Kodlayıcı-Kod Çözücü Mimarilerinde Model Belirsizliği." ArXiv ön baskı arXiv: 1511.02680, 2015.
Princeton

Fisher Yu, Vladlen Koltun, "Genişletilmiş Evrişimlerle Çok Ölçekli Bağlam Birleştirme", ICLR 2016

Washington Üniversitesi, Allen AI

Hamid Izadinia, Fereshteh Sadeghi, Santosh Kumar Divvala, Yejin Choi, Ali Farhadi, "Segment-Phrase Table for Semantic Segmentation, Visual Entailment and Paraphrasing", ICCV, 2015

INRIA

Iasonas Kokkinos, "Derin Öğrenmeyi Kullanarak Sınır Tespitinin Sınırlarını Puslamak", ICLR 2016

UCSB

Niloufar Pourian, S. Karthikeyan ve B.S. Manjunath, "Görüntü parçalarının topluluklarını öğrenerek zayıf denetimli grafik tabanlı semantik bölümleme", ICCV, 2015

Diğer kaynaklar

kurs

Derinlik Görüşü

CS231n: Görsel Tanıma için Evrişimli Sinir Ağları

ELEG 5040: Sinyal İşlemede İleri Konular (Derin Öğrenmeye Giriş)

Daha ayrıntılı kurs önerileri

CS224d: Doğal Dil İşleme için Derin Öğrenme

Ayda 1500 cep harçlığı harcayan profesyonel bir oyuncu olan Wuli Song Long, yan komşudur.

Hepsi otomatik başlatma ve durdurma konusunda şikayet ediyor, üreticiler neden hala bunu yapmakta ısrar ediyor?