Tamamen mi kısmi mi? Ali CVPR kağıdı, bir GAN modeli oluşturmak için yeni bir geometrik açı kullanıyor

Leifeng.com AI teknolojisi inceleme notu: Bu makale, Alibaba Dharma Akademisi'nin Makine Zekası Teknoloji Laboratuvarı Hua Xiansheng ekibi ve UCF Profesörü Qi Guojun liderliğindeki UCF MAPLE Laboratuvarı tarafından tamamlandı. CVPR 2018'e poster kağıdı olarak dahil edildi.

Akademik gelişim ve kurumsal faaliyetler açısından, Alibaba Dharma Akademisi'nin Makine Zekası Teknoloji Laboratuvarı, Leifeng.com akademik kanalı AI Technology Review altında "AI Etki Faktörü" veritabanı projesinde iyi performans gösterdi. Laboratuvar, SQuAD ve KITTI yarışmalarında birinciliği kazandı.Son zamanlarda, AAAI 2018'de Dharma Akademisi'nin Makine Zekası Teknoloji Laboratuvarı'ndan toplam 4 makale kabul edildi. CVPR 2018'de birçok makale de olağanüstü sonuçlarla kabul edildi.

Aşağıda, makaleye bir giriştir:

GAN, başlangıcından bu yana birçok ilgili çalışmayı kendine çekmiş ve teori, algoritma ve uygulamalarda birçok önemli atılım yapmıştır. Yeni bir geometrik açıdan kullanmaya çalıştık kısmi Bakış açısı, önceki klasik GAN modeline benzer bir yöntem oluşturmaktır. Bütüncül yaklaşım Yarı denetimli makine öğreniminde Laplace-Beltrami operatörü ile bağlantı kurmak için farklı teoriler ve modeller kullanılır, böylece artık geleneksel grafik modeli (Grafik) yöntemiyle sınırlı değildir ve az sayıda etiketli örnekle derin öğrenme modellerini eğitmek için kullanılır. Mükemmel performans elde etti; aynı zamanda, farklı açılara, pozlara ve stillere sahip yeni görüntüler elde etmek için yerel bir koordinat sisteminde belirli bir görüntüyü düzenlemek ve değiştirmek için Yerelleştirilmiş GAN'ın (LGAN) nasıl kullanılacağını da gösterdik; Akış teğet vektörlerinin bağımsızlığı açısından GAN'ın mod çöküşü problemi nasıl açıklanır ve çözülür.

Bu çalışma UCF Profesörü Qi Guojun tarafından yönetilmektedir. AKÇAAĞAÇ Laboratuvar ( MA çene P kurulum ve LE Arning) ve Alibaba'dan Dr. Hua Xiansheng liderliğindeki şehir beyin makine vizyon araştırma grubu ve CVPR 2018'de yayınlanacak.

Kağıt adresi: https://arxiv.org/abs/1711.06020

GAN ve yarı denetimli makine öğrenimi arasındaki ilişki, grafik modellerine göre

Veri oluşturmak için kullanılan GAN'a ek olarak, çok önemli bir rolün olduğuna inanıyoruz: İlk defa, veri akış modellerini (manifold) temsil etmek ve tanımlamak için kullanılabilecek ideal bir araca sahibiz. Önceden, akış modellerini ifade etmek istersek, genellikle bir grafik modeli (Grafik) kullanırdık. Grafik modelinde, verilerin doğrudan benzerliğini temsil etmek için veri noktalarını ve kenarlarını temsil etmek için düğümler kullanırız. Graph ile veri noktasındaki fonksiyon değişikliğini nicel olarak hesaplayabiliriz. Örneğin, sınıflandırma probleminde ilgilendiğimiz fonksiyon sınıflandırma fonksiyonu, çıktı ise veri noktasının etiketidir. Grafiğe dayalı akış modeliyle, bir sınıflandırma modeli oluşturabiliriz: çıkardığı sınıflandırma etiketi, benzer örneklerde en küçük değişikliğe sahiptir. Bu, grafiklere dayalı yarı denetimli yöntemlerin temel hipotezi olan pürüzsüzlük hipotezidir.

Yukarıda: Grafik tabanlı akış modeli gösterimi ve yarı denetimli sınıflandırma.

Bu grafik tabanlı yarı denetimli yöntem büyük bir başarı elde etmiş olsa da, eksiklikleri de açıktır. Veri noktalarının sayısı çok fazla olduğunda, böyle bir Grafik oluşturmanın maliyeti çok yüksek olacaktır. Bu sorunu çözmek için Graph bize iyi bir temel sağlıyor. Eğitim yoluyla elde edilen jeneratör G (z) aslında çok iyi bir akış modelidir. Burada z, akış örüntüsü üzerindeki parametre koordinatıdır, z'yi sürekli değiştirerek, yüksek boyutlu uzayda bir akış örüntü yapısı çizebiliriz.

Böyle bir akış modeli ve açıklaması G ile, veri akış modeli üzerinde çeşitli geometrik yapıları inceleyebiliriz. Örneğin, teğet vektör uzayı ve eğrilik daha sonra akış modelinde ve fonksiyonun her teğet vektör boyunca nasıl değiştiğinde tanımlanır. Burada GAN yarı denetimli öğrenmeyle bağlantılıdır. Geçmişte, sınıflandırma fonksiyonunun değişimini incelemek için Graph'in ayrı sonucunu kullandık ve bu değişikliği en aza indirerek düzgünlük hipotezini elde ettik.

Şimdi, akış modelinin doğrudan parametreleştirilmiş açıklaması G (z) ile, akış modelindeki bir işlevin (sınıflandırma problemindeki sınıflandırıcı gibi) değişimini doğrudan tanımlayabilir ve ardından bu parametreye dayalı bir akış oluşturabiliriz. Grafik tabanlı akış modeline güvenmek yerine yarı denetimli sınıflandırma teorisi yazın.

Spesifik olarak, yarı denetimli grafik akış modelinde, eğitim için genellikle Laplacian matrisini kullanıyoruz; şimdi, parametreleştirilmiş akış modeli ile, yarı denetimli eğitim elde etmek için doğrudan Laplace-Beltrami operatörünü tanımlayabiliriz. Aşağıda bu yönteme dayalı olarak bazı veri setlerinde elde edilen sonuçlar verilmiştir. Daha fazla sonuç için lütfen "Küresel ve Yerelleştirilmiş Üretken Çekişmeli Ağlar" başlıklı makalemize bakın.

Yukarıdaki tablo: SVHN, CIFAR-10 ve CIFAR-100 üzerinde yarı denetimli öğrenme etkisi.

GAN'ı incelemek için küresel veya yerel koordinatlar mı kullanıyorsunuz?

Burada daha ayrıntılı bir soru var. Olağan GAN modeli, global bir parametrik model elde eder: tüm akış modelini parametrelendirmek için yalnızca bir z değişkenimiz vardır. Aslında matematikte bu tür genel parametreleştirme yoktur, örneğin, tüm küreyi kapsayacak bir parametre koordinatı kullanamayız. Şu anda, çoğu zaman birkaç yerel koordinat sistemi aracılığıyla tüm akış modelini kaplamak zorundayız.

Aynı zamanda, yerel bir koordinat sistemi kullanmanın daha pratik bir başka avantajı da, bir hedef veri noktası x verdikten sonra, küresel koordinat sistemi G (z), karşılık gelen bir parametre koordinatını z bilmemizi gerektirmesidir; ve yerel koordinat sistemini kullandıktan sonra, Karşılık gelen z'ye gitmek için ters bir problemi çözmek yerine, akış örüntüsü etrafındaki geometrik yapıyı incelemek için x'e yakın bir yerel koordinat sistemi G (x, z) kurabiliriz. Bu, akış modelindeki farklı veri noktalarıyla başa çıkmamızı büyük ölçüde kolaylaştırır.

Yukarıda: akış düzeninin yerel parametreleştirilmiş temsili.

Bu düşünce çizgisi boyunca, bir dizi problemi incelemek için parametreleştirilmiş yerel koordinatları ve temsil ettiği akış modelini kullanabiliriz.

  • 1. Karşılaştırmalı teori araştırması, yerel eğrilik, Riemann metriği gibi bu yerel parametre temsilleriyle bir dizi Riemann akış modelinin matematiksel yapısının nasıl tanımlanacağına ve akış modeli boyunca jeodezik ve toplamın nasıl hesaplanacağına odaklanabilir. İki veri noktası arasındaki jeodezik mesafe.

  • 2. Uygulama perspektifinden, bir x görüntüsü verildiğinde, yerel temsil G (x, z) çeşitli düzenleme işlemlerini yapabilir veya kendi yerel alanındaki görüntünün çeşitli niteliklerini kontrol edebilir, bu da bize yardımcı olabilir. İstenilen görüntüyü oluşturun Örneğin; farklı açılardan yüzler, insan duruşları, nesneler ve hatta farklı stillere ve farklı duygulara sahip görüntüler vb. Bunun güvenlik, içerik üretimi, sanal gerçeklik ve diğer alanlarda geniş uygulama olanakları vardır.

Çalışma Modu geometrik bir perspektiften çöküyor

Elbette, geometri ve akış parametreleştirme perspektifinden, mod çökmesi sorunu gibi daha derin bir GAN anlayışı verilebilir. GAN ile ilgili araştırmada, mod çöküşü geniş çapta ilgilenilen bir sorundur. Bu sorunu farklı açılardan inceleyen ve çözen birçok ilgili makale var.

Localized GAN tarafından ortaya konan geometrik yönteme dayanarak, akış modelinin lokalize çöküşü perspektifinden görebiliriz. GAN'ın mod çökmesini açıklayın ve önleyin . Spesifik olarak, z verildiğinde, z değiştiğinde, karşılık gelen G (z) değişmez, bu durumda GAN'ın bir mod çökmesi vardır, yani sürekli değişen örnekler üretemez. Geometrik bir bakış açısından bu fenomen, karşılık gelen akış modelinin artık bu yerel noktada farklı teğet vektör yönleri boyunca değişmemesidir. Diğer bir deyişle, tüm teğet vektörler artık birbirinden bağımsız değildir - bazı teğet vektörler ya kaybolur ya da birbirleriyle doğrusal olarak ilişkilendirilir, bu da akış modelinin boyutunda yerel bir kusurla (boyut yetersizliği) sonuçlanır.

Bu sorunu çözmek için en basit şey, bu yerel boyutsallık kusurundan kaçınmak için akış modelinin teğet vektörüne bir Ortonormal kısıtlama ekleyebilmemizdir. Aşağıdaki şekil CelebA veri setinde elde edilen sonuçtur. Farklı teğet vektörlere ortogonalleştirme kısıtlamaları ekleyerek, farklı parametre yönlerinde farklı değişiklikleri başarılı bir şekilde elde edebileceğimiz görülebilir.

Yukarıda: Verilen giriş görüntüsünün yerel koordinat sisteminde yüzün farklı niteliklerini düzenleyin.

Teğet vektör üzerinde ortogonalizasyon kısıtlamasını yerel bir GAN perspektifinden türetmemize ve uygulamamıza rağmen, belirtmek gerekir. Bu fikir ve yöntem aynı zamanda geleneksel genel GAN modeline de uygulanabilir. İlgili iniş gradyanını elde etmek için her eğitim verisi örneğine veya bir grubun bir alt kümesine bu kısıtlamayı eklerken yalnızca genel GAN modelini eğitmemiz gerekir. Genel GAN modeli de eğitilebilir; bu yön geleceğe yol açabilir Alakalı iş.

Alıntılar: Küçük ekran süper amiral gemisi ZUK Z2 beyaz standart versiyon tasfiye satışı 1,249 yuan
önceki
Londra'da "Bohemian Rhapsody" prömiyeri
Sonraki
Lei Jun, Xiao Ai öğrencilerinin aktivasyonunu 100 milyonu kırmak ve IKEA ile stratejik işbirliğine başlamak için duyurdu
Great Wall üst düzey marka WEY, gelecek yıl piyasaya sürülecek ilk SUV'yi piyasaya sürdü
Bir zamanlar internet şirketlerinin kara atı, Xiaomi gibi şirketlerin güçlü bir rakibi haline geldi, ancak şimdi düştü
Samsung'un katlanabilir telefonu ortaya çıktı: harika görünüm, MWC 2017'de piyasaya sürülecek
Klasik ayakkabı Stan Smith'in yeni bir kıyafeti mi var? En iyi deri kutsama dokusu dolu!
Pinyou Interactive, AI iş karar verme sürecini tamamen dönüştürür ve pazarlama bulutu karar verme platformu MIP'yi başlatır
Kaplumbağa, Tianxiu? Unutma, Luo Xin Weibo'da aşkını duyurdu! Netizenler aradı: Neden anlayamıyorum?
Öne çıkmak için güzelliğe güvenmek mi? SAIC MG ZS statik deneyimi
JD yeni bir hizmet sunuyor: iPhone 7 kiralama, ayda 228 yuan gibi düşük bir fiyattan başlıyor
Cav Empt x SHOWstudio x MACHINE-A, retro elektronik serisinin yeni ürünlerini birlikte getiriyor!
Şarap yapımının başlangıcı arabalar üretmeye başladı ve araba imalatının başlangıcı şarap satmaya başladı .. "Changan" sınır ötesi kırmızı şarap satışının ardında: Güven nereden geliyor?
8086 işlemcisinin 40. yıl dönümü için Intel, anmak için "şaşırtıcı" frekansa sahip sınırlı sayıda bir CPU çıkardı
To Top