g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Okumalısınız! TOP10 Generative Adversarial Network GAN Paper (bağlantılı)

Kaynak: Xinzhiyuan

Bu makale yaklaşık 2200 kelimedir , 7 dakika için önerilen okuma .

Bu makaledeki seçili makaleler, GAN teknolojisinin temellerini anlamanıza yardımcı olmak için GAN'a okuması kolay bir giriş sağlar.

Generative Adversarial Networks (GAN), derin öğrenmedeki en ilginç ve popüler uygulamalardan biridir. Bu makale GAN ile ilgili 10 makaleyi listeliyor. Bu makaleler size GAN'a iyi bir giriş sağlayacak ve en ileri teknolojinin temelini anlamanıza yardımcı olacaktır.

Bu makalede seçilen 10 GAN makalesi şunları içerir:

DCGAN'lar

GAN'ların Eğitimi için Geliştirilmiş Teknikler

Koşullu GAN'lar

Aşamalı Olarak Büyüyen GAN'lar

BigGAN

StyleGAN

CycleGAN

Pix2Pix

StackGAN

Üretken Çekişmeli Ağlar

DCGAN'lar - Radford ve diğerleri (2015)

GAN yolculuğunuza DCGAN kağıdı ile başlamanızı öneririm. Bu makale, evrişimli katmanların GAN ile nasıl kullanılabileceğini gösterir ve bunun için bir dizi mimari kılavuz sağlar. Bu makale ayrıca GAN özelliklerinin görselleştirilmesini, gizli alan enterpolasyonunu, sınıflandırıcıları eğitmek için ayırıcı özelliklerin kullanımını ve değerlendirme sonuçlarını tartışmaktadır. Tüm bu sorular kaçınılmaz olarak GAN araştırmanızda görünecektir.

Kısacası, DCGAN kağıdı mutlaka okunması gereken bir GAN kağıdıdır, çünkü mimariyi çok net bir şekilde tanımlamaktadır, bu nedenle bir kodla başlamak ve GAN için bir sezgi geliştirmeye başlamak kolaydır.

DCGAN modeli: evrişimli katmanları yukarı örnekleyen jeneratör mimarisi kağıt: Derin Evrişimli Üretken Çekişmeli Ağlar ile Denetimsiz Temsil Öğrenimi Alec Radford, Luke Metz, Soumith Chintalahhttps: //arxiv.org/abs/1511.0643 Geliştirilmiş GAN eğitim teknikleri - Salimans ve diğerleri (2016)

Bu makale (yazarlar arasında Ian Goodfellow da bulunmaktadır), yukarıda bahsedilen DCGAN makalesinde listelenen mimari yönergelere dayalı bir dizi öneri sunmaktadır. Bu makale, GAN istikrarsızlığıyla ilgili en iyi varsayımları anlamanıza yardımcı olacaktır. Ek olarak, bu makale ayrıca özellik eşleştirme, mini parti tanıma, geçmiş ortalama, tek taraflı etiket düzeltme ve sanal parti standardizasyonu dahil olmak üzere DCGAN eğitimini stabilize etmek için birçok başka makine sağlar. Basit bir DCGAN uygulaması oluşturmak için bu teknikleri kullanmak iyi bir egzersizdir ve GAN'ı daha derinlemesine anlamaya yardımcı olur.

kağıt: GAN'ların Eğitimi için Geliştirilmiş Teknikler Tim Salimans, Ian Goodfellow, Wojciech Zaremba, Vicki Cheung, Alec Radford, Xi Chenhttps: //arxiv.org/abs/1606.0349 Koşullu GAN'lar - Mirza ve Osindero (2014)

Bu çok iyi bir kağıt ve sorunsuz okuyor. Koşullu GAN (Koşullu GAN), en gelişmiş GAN'lardan biridir. Rapor, GAN eğitimini daha istikrarlı hale getirmek için verilerin sınıf etiketlerinin nasıl entegre edileceğini göstermektedir. GAN'ı ayarlamak için önceden bilgi kullanma kavramı, sonraki GAN araştırmasında yinelenen bir konudur ve özellikle resimden resme veya metinden resme odaklanan makaleler için önemlidir.

Koşullu GAN mimarisi: Rastgele gürültü vektörü z'ye ek olarak, sınıf etiketleri y, ağın girişi olarak birbirine bağlanır. kağıt: Koşullu Üretken Çekişmeli Ağlar Mehdi Mirza, Simon Osinderohttps: //arxiv.org/abs/1411.178 Aşamalı Olarak Büyüyen GAN'lar Karras ve diğerleri (2017)

Aşamalı Büyüyen GAN (PG-GAN) harika sonuçlara ve GAN sorunlarına yaratıcı bir yaklaşıma sahiptir, bu nedenle aynı zamanda okunması gereken bir belgedir.

Bu GAN belgesi, NVIDIA Research'ten gelmektedir. GAN'ı, kademeli olarak artan bir GAN ağı (PG-GAN olarak adlandırılır) ve başarmak için dikkatle işlenmiş bir CelebA-HQ veri seti kullanarak giderek artan bir şekilde eğitmeyi önermektedir. Etkisi, görüntü oluşturmak için harika. Yazar, bu yöntemin sadece eğitimi sabitlemekle kalmadığını, aynı zamanda GAN tarafından üretilen görüntülerin de şimdiye kadarki en iyi kalite olduğunu söyledi.

Temel fikri, jeneratörleri ve ayırıcıları kademeli olarak artırmaktır: düşük çözünürlükten başlayarak, eğitim ilerledikçe, daha ince ve daha ince ayrıntıları modellemek için yeni katmanlar eklenir. "Aşamalı Büyüme", önce 4x4 ağ eğitimi, ardından 8x8 ağı eğitme ve ardından artarak sonunda 1024x1024'e ulaşmayı ifade eder. Bu sadece eğitim hızını artırmakla kalmaz, aynı zamanda eğitim hızını büyük ölçüde dengeler ve oluşturulan görüntü kalitesi çok yüksektir.

GAN'ın çok ölçekli mimarisi aşamalı olarak büyüyen model, 4 × 4'ten 1024 × 1024'e kademeli olarak yükseliyor kağıt: İyileştirilmiş Kalite, Kararlılık ve Varyasyon için GAN'ların Aşamalı Büyümesi Tero Karras, Timo Aila, Samuli Laine, Jaakko Lehtinenhttps: //arxiv.org/abs/1710.1019 BigGAN - Brock ve diğerleri (2019)

BigGAN modeli, ImageNet'e dayalı en yüksek görüntü kalitesine sahip modellerden biridir. Bu modelin yerel bir makinede uygulanması zordur ve BigGAN, Öz Dikkat, Spektral Normalleştirme ve projeksiyon ayırıcılı cGAN gibi birçok bileşene sahiptir.Bu bileşenler, ilgili belgelerinde daha iyi açıklanmıştır. Bununla birlikte, bu makale mevcut son teknoloji temel makaleleri oluşturan fikirlere iyi bir genel bakış sağlar, bu nedenle okumaya değer.

BigGAN tarafından oluşturulan görüntüler kağıt: Yüksek Doğruluklu Doğal Görüntü Sentezi için Büyük Ölçekli GAN EğitimiAndrew Brock, Jeff Donahue, Karen Simonyanhttps: //arxiv.org/abs/1809.1109 StyleGAN - Karras ve diğerleri (2019)

StyleGAN modelinin, özellikle gizli alan kontrolünün kullanımı konusunda en gelişmiş model olduğu söylenebilir. Bu model, gizli uzay vektörü z'yi kontrol etmek için nöral stil transferinde uyarlanabilir örnek standardizasyonu (AdaIN) adı verilen bir mekanizmadan yararlanır. Haritalama ağı ve AdaIN koşullarının tüm jeneratör modelindeki dağılımı, bir StyleGAN'ı kendi başınıza uygulamayı zorlaştırır, ancak yine de iyi bir kağıttır ve birçok ilginç fikir içerir.

StyleGAN mimarisi, potansiyel mekansal kontrole izin verir kağıt: Üretken Çekişmeli Ağlar için Tarza Dayalı Üretici Mimarisi Tero Karras, Samuli Laine, Timo Aila https://arxiv.org/abs/1812.04948 CycleGAN - Zhu ve diğerleri (2017)

CycleGAN'ın makalesi yukarıda listelenen altı makaleden farklıdır çünkü rastgele vektörlerin görüntü sentezi problemini değil, görüntüden görüntüye dönüştürme sorununu tartışır. CycleGAN, eşleştirilmiş eğitim örnekleri olmadan görüntüden görüntüye dönüştürme durumunu daha spesifik olarak ele alır. Bununla birlikte, Döngü-Tutarlılık kaybı formülünün zarafeti ve GAN eğitiminin nasıl stabilize edileceğinin aydınlanması nedeniyle, bu iyi bir makale. CycleGAN, at görüntülerini zebralara dönüştürmek gibi süper çözünürlük, stil dönüştürme gibi birçok harika uygulamaya sahiptir.

Cycle Consistency Loss'un arkasındaki ana fikir, bir cümlenin Fransızcadan İngilizceye çevrilmesi ve ardından tekrar Fransızcaya çevrilmesi, orjinali ile aynı cümle olması gerekir. kağıt: Döngüsel Tutarlı Karşıt Ağlar Kullanılarak Eşleştirilmemiş Resimden Resme Çeviri Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efroshttps: //arxiv.org/abs/1703.1059 Pix2Pix - Isola ve diğerleri (2016)

Pix2Pix, görüntüden görüntüye dönüştürme için başka bir GAN modelidir. Çerçeve, eşleştirilmiş eğitim örneklerini kullanır ve GAN modelinde çeşitli farklı konfigürasyonları kullanır. Bu makaleyi okurken en ilginç kısmın PatchGAN hakkındaki tartışma olduğunu düşünüyorum. PatchGAN, görüntünün tamamına bakmak yerine görüntünün 70 × 70 alanını gözlemleyerek bunların gerçek mi yoksa sahte mi olduğuna karar veriyor. Model ayrıca ilginç bir U-Net tarzı jeneratör mimarisi ve jeneratör modelinde ResNet stili atlama bağlantılarının kullanımını gösterir. Pix2Pix, eskizleri gerçekçi fotoğraflara dönüştürmek gibi birçok harika uygulamaya sahiptir.

Eşleştirilmiş eğitim örneklerini kullanarak Görüntüden Görüntüye dönüştürme kağıt: Koşullu Karşıt Ağlarla Görüntüden Görüntüye Çeviri Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efroshttps: //arxiv.org/abs/1611.0700 StackGAN - Zhang ve diğerleri (2017)

StackGAN'ın kağıdı, bu listedeki önceki kağıtlardan çok farklı. En çok Koşullu GAN ve Aşamalı Olarak Büyüyen GAN'lara benzer. StackGAN modelinin çalışma prensibi Aşamalı Büyüyen GAN'lara benzer çünkü birden çok ölçekte çalışabilir. StackGAN, ilk olarak 64 × 64 çözünürlüğe sahip bir görüntü çıkarır ve ardından bunu 256 × 256 çözünürlüğe sahip bir görüntü oluşturmak için öncelikli bilgi olarak kullanır.

StackGAN, doğal dil metninden görüntüler oluşturmaktır. Bu, görsel özellikleri yakalamak için metin yerleştirmeyi değiştirerek elde edilir. Bu çok ilginç bir makale StyleGAN'da gösterilen gizli alan kontrolü, StackGAN'da tanımlanan doğal dil arayüzü ile birleştirilirse, çok şaşırtıcı olacaktır.

Metin yerleştirmeye dayalı çok ölçekli StackGAN mimarisinin arkasındaki fikir kağıt: StackGAN: Yığılmış Üretken Karşıt Ağlar ile Metinden Foto-gerçekçi Görüntü Sentezine Han Zhang, Tao Xu, Hongsheng Li, Shaoting Zhang, Xiaogang Wang, Xiaolei Huang, Dimitris Metaxashttps: //arxiv.org/abs/1612.0324 Generative Adversarial Networks - Goodfellow ve diğerleri (2014)

Ian Goodfellow'un orijinal GAN makalesi, GAN okuyan herkesin okuması gereken bir kitap. Bu makale GAN çerçevesini tanımlar ve "doymamış" kayıp işlevini tartışır. Makale ayrıca, son yıllarda GAN makalelerinde sıklıkla görülen bir kanıt olan optimal ayırt edicinin türetilmesini de veriyor. Makale ayrıca GAN'ın MNIST, TFD ve CIFAR-10 görüntü veri setleri üzerindeki etkinliğini deneysel olarak doğruladı.

kağıt: Üretken Çekişmeli Ağlar Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengiohttps: //arxiv.org/abs/1406.266

Orijinal bağlantı:

https://towardsdatascience.com/must-read-papers-on-gans-b665bbae3317

Editör: Huang Jiyan redaksiyonu: Lin Yilin - Bitiş -

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.

Size veri bilimi öğrenimiyle ilgili 12 önemli ipucu gönderin (bağlantılar)

Bu Alman kamu görevlilerinin maaşı, bakalım kaç tane tahmin edebiliyor musun?