DCGAN: Gerçek fotoğrafları eşleştirmek için yüz sentez görüntüsünü tamamlayan, ağa karşı derin evrişimli üretimin denetimsiz öğrenimi

Xinzhiyuan Derlemesi

Bilgisayar görüşü, özellikle yüz tanıma ve oluşturma, son dönemlerdeki sıcak noktadır. Github kullanıcısı saikatbsk, görüntü tamamlama için bir yüzleşme ağı oluşturmak için derin evrişimi kullanan bir proje yaptı ve çok iyi sonuçlar elde etti.

Sağ üst köşe orijinal görüntüdür ve sağ alt köşe ise sistemin tamamlanmasının sonucudur

Saikatbsk tarafından kullanılan yöntem hala bir çatışmalı ağ GAN'ı oluşturma gücünü kullanıyor. Tartışmalı eğitim ilk olarak Ian Goodfellow tarafından NIPS-2014 belgesinde önerildi. Çekişmeli eğitim aynı anda iki sinir ağını eğitebilir. Birincisi, D (Y) ile gösterilen ayırıcıdır Ayırıcı girdi alır (bir görüntü gibi) ve Y görüntüsünün "doğal" olup olmadığını gösteren bir skaler çıktı verir. D (Y) çıktısı, softmax fonksiyonu kullanılarak olasılığa dönüştürülebilir. 1 olasılığı yanlış bir görüntüdür ve 0 olasılığı, ayrımcının bu görüntüyü "gerçek" olarak tanımladığını gösterir.

İkinci sinir ağı, G (Z) ile temsil edilen bir jeneratördür; burada Z genellikle basit bir dağılımdan (Gaussian gibi) rastgele örneklenen bir vektördür. Üreticinin işlevi, sahte görüntüler üretmek ve ayırıcıyı D (Y) doğru olasılığı çıktılayacak şekilde eğitmektir.

Eğitim sürecinde, D gerçek bir görüntü alacak ve doğru olasılığı çıkarmak için parametreleri ayarlayacaktır. Ardından D, jeneratör G tarafından oluşturulan bir görüntü alacaktır. Ayırıcı D, çıktıyı D (G (Z)) büyük (önceden tanımlanmış fonksiyonun gradyanını takiben) yapmak için parametrelerini yeniden ayarlar. Bununla birlikte, G (Z), ayrımcı D'yi "aldatmak" için daha doğal ve gerçekçi görüntüler üretme konusunda kendisini eğitmeye devam edecektir. Yöntem, üretilen her örnek için Dw.r.t Y gradyanı kullanılarak elde edilir.

Yazar saikatbsk, ağı eğitmek için Hintli aktörlerin görüntülerini içeren bir veri kümesi kullanıyor. Aşağıdaki şekil, ağı 100.000 adımlık yüksek performanslı bir GPU üzerinde eğitildikten sonra jeneratör tarafından oluşturulan bazı yüzleri göstermektedir. Etki gerçekten ortalamadır:

Ancak son eğitim sonuçlarını verdi:

Sonucun oldukça iyi olduğu görülmektedir. Yazar, belirli yöntemi ve kodu mümkün olan en kısa sürede açıklayacağını belirtti.

Ek olarak, bu saikatbsk ayrıca Pokémon görüntüleri oluşturmaya çalıştı:

DCGAN: Derin Evrişimli Üretken Çekişmeli Ağların Denetimsiz Öğrenimi

Saikatbsk'ın tanıtımından, kullandığı yöntemin DCGAN'ı ödünç alması gerektiği görülmektedir. Xinzhiyuan, daha önce DCGAN hakkında da haber yapmıştı, hadi bu güçlü yöntemi gözden geçirelim.

Alec Radford, Luke Metz, Soumith Chintala, önerdikleri DCGAN'ı Github'da ayrıntılı olarak tanıttılar ve birkaç çizim gösterdiler. Aşağıdaki şekil 5 aşamalı (epoch) eğitimden sonra sistem tarafından oluşturulan yatak odası görüntüsünü göstermektedir. Birden fazla örnekte doku tekrarlanmasının yetersiz oturtma belirtilerine yol açtığı görülebilir.

5 eğitim aşamasından sonra oluşturulan yatak odası görüntüsü

Aşağıdaki şekil, bir eğitim aşamasından sonra oluşturulan yatak odası görüntüsünü göstermektedir. Yazara göre, teoride, bu model eğitim örneklerini hatırlamayı öğrenebilir, ancak eğitim sırasında küçük bir öğrenme oranı ve küçük toplu stokastik gradyan iniş (SGD) kullandıkları göz önüne alındığında, bu aslında Olası değil.

Yazarlar Alec Radford, Luke Metz ve Soumith Chintala, bildikleri kadarıyla, SGD kullanmanın ve küçük bir öğrenme oranının, eğitim modelinin yalnızca bir aşaması aracılığıyla örnekleri ezberleyebileceğine dair hiçbir gerçek kanıt olmadığını söyledi.

1 eğitim aşamasından sonra oluşturulan yatak odası görüntüsü

  • Bildiri: Derin Evrişimli Üretken Çekişmeli Ağların Denetimsiz Temsili Öğrenimi

Özet

Son yıllarda, denetimli öğrenme için evrişimli sinir ağlarının (CNN) kullanımı bilgisayarla görme alanında yaygın olarak kullanılmaktadır. Bunun aksine, denetimsiz öğrenme için CNN kullanmak daha az ilgi gördü. Bu çalışmada, CNN'in denetimli ve denetimsiz öğrenmedeki başarısı arasındaki boşluğu kapatmaya yardımcı olmayı umuyoruz. Deep Convolutional Generative Adversarial Networks (DCGAN) adında bir CNN sınıfı öneriyoruz DCGAN'ın belirli mimari sınırlamaları var Makale, DCGAN'ın denetimsiz öğrenme için büyük potansiyelini gösteriyor. Çeşitli görüntü veri setleri üzerine eğitim vererek, kağıtta ikna edici kanıtlar verdik, derin evrişimli düşman ağımızın, jeneratör ve ayırıcıdaki nesne parçalarından sahnelere kadar öğrendiğini kanıtladık. (Sahneler) hiyerarşik karakterizasyon. Ek olarak, öğrenilen özellikleri yeni görevler için kullandık - genel bir resim temsili olarak uygulanabilirliğini gösterdik.

İnsan yüzüne ilişkin hesaplamalar, aşağıdaki resim Tüm bilgisayar oluşturuldu :

  • DCGAN kağıt adresi: https://arxiv.org/pdf/1511.06434.pdf

  • DCGAN Github adresi: https://github.com/Newmu/dcgan_code

  • Görüntü (yüz) tamamlama projesi Github adresi: https://github.com/saikatbsk/ImageCompletion-DCGAN/blob/master/Readme.md

Xinzhiyuan İşe Alım

Pozisyon: Hesap Direktörü

Yıllık maaş: 300.000-600.000 (Maaş + ikramiye)

İş yeri: Pekin-Haidian Bölgesi

Departman: Müşteri Departmanı

Raporlama nesnesi: COO

Astların Sayısı: 8

Çalışma hayatı: 5 yıl

Dil: İngilizce + Mandarin

Eğitim gereksinimleri: tam zamanlı lisans eğitimi

iş tanımı:

  • Yapay zekayı sevin, belirli bir kaynak ağına ve sektörde etkiye sahip olun;

  • Müşterilerin pazarlama veya iletişim hedeflerine ulaşmaları için medya ilişkileri stratejileri ve halkla ilişkiler faaliyetleri geliştirmek;

  • Projelerin zamanında ve bütçe dahilinde tamamlanabilmesi için halkla ilişkiler projelerinin planlanması ve uygulanmasının denetlenmesinden sorumludur;

  • Müşteri kaynaklarını aktif olarak genişletin, şirket işini geliştirin ve mevcut müşterilerle yakın iş teması ve iletişimi sürdürmek;

  • Müşteri hizmetleri ekibini denetleyin, yönetin ve değerlendirin ve şirketin müşteri hizmetleri kalitesini kapsamlı bir şekilde iyileştirin;

  • Bilim ve mühendislik geçmişi tercih edilir ve tanınmış şirketler veya tanınmış medya kuruluşlarında iş deneyimi tercih edilir.

  • Başvuru e-postası: jobs@aiera.com.cn

    HR WeChat: 13552313024

    Xinzhiyuan, yüksek ideallere sahip insanları görüşmeye davet ediyor, daha fazla işe alım pozisyonu için lütfen tıklayın Xinzhiyuan İşe Alım Görünüm.

    Otomobil fuarından sonraki ilk yeni otomobil dalgasının ardından Tucson, Correga ve diğerleri pazara geliyor!
    önceki
    50 milyar ABD dolarından fazla değerleme ile 800.000 girişimci, Cheng Wei şöyle dedi: şirketler arasındaki rekabet evrimsel güçtür
    Sonraki
    Bu iyi alışkanlıkları geliştirin, arabanız en az 10 yıl sürebilir!
    Peter Thielin 3 benzersiz düşünme şekli
    Moganshan Net Red B & B'de 600+ yaşayabilir! Zhuhai Kaplıcası'ndaki özel kaplıcaya dalın ve dünyanın her yerinde yemek yiyin!
    Şiir Şiir Şarabı Şiiri, Çağlar boyunca sizinle pişirin
    Courtois'in kemik karşıtı çocuğu hayranlarda büyük bir memnuniyetsizliğe neden oldu: Messi delinmeyi hak ediyor!
    Bir sonraki "Tencent" veya "Alibaba" 'ya yatırım yapma fırsatını nasıl kaçırmazsınız?
    Lütfen bu gece arkadaş çevrenizi Çin askerlerine bırakın.
    Çin'in en büyük IoT inovasyon ve girişimcilik platformu "Uygulama için AI": GMIC 2017 IngDan AI Endüstri Uygulama Zirvesi yarın başlıyor
    Lang Yongchun: Geleneksel işletmeleri güçlendirmek ve B2B e-ticaretin 4 temel noktasını keşfetmek için verileri kullanın
    3. Ping Çin "Üç Mikro" Yarışması Ödül Töreni Xiamen'de Düzenlendi: Halkın Güvenliğini Korumak İçin Destansı İlahiyi Söyle
    ICLR 2017 Özelliği: Google ve Facebook'un mükemmel performans envanteri
    Chiang Mai'de 72 saat Otantik şehir yürüyüşü, beklenmedik sürprizleri keşfetmenizi sağlayacak!
    To Top