Düşman ağı GAN'ın daha yüksek kalitede metin oluşturması nasıl sağlanır? LeakGAN göründü ve şöyle dedi: "Karşılaşma sırasında bir casusa ihtiyacınız olabilir!"

Leifeng.com AI Teknolojisi Yorumu: Üretken rakip ağ GAN'larının ortaya çıkmasından bu yana, bu ve varyantları görüntü oluşturma görevlerinde etkinliklerini sayısız kez kanıtladı ve giderek daha fazla araştırmacıyı çekmeye devam ediyorlar. GAN eğitiminin kontrol edilebilirliğini ve kararlılığını geliştirmek için araştırmaya katılın.

Başlangıçta, kusurlardan biri nedeniyle GAN'lar metin oluşturmada etkili bir şekilde uygulanamıyordu. Ekibin daha önce yayınlanan SeqGAN'ı sayesinde, GAN'lar metin oluşturmada mümkündür, ancak performansları görüntü oluşturma görevlerinde olduğu kadar belirgin değildir. Temel sorunlardan biri, G'nin ayırıcı D'den aldığı geri bildirimin, özellikle metin uzun olduğunda metin oluşturma kalitesini güncellemek ve iyileştirmek için G'ye etkili bir şekilde rehberlik edecek çok az bilgi içermesidir.

Bu, şu soruyu doğurur: Eğer ayrımcının jeneratöre daha fazla bilgi vermesine izin verilirse, uzun cümleler oluşturma görevinde jeneratörün performansını etkili bir şekilde artırabilir mi? Profesör Yong Yu, Yardımcı Doçent Zhang Weinan ve Shanghai Jiaotong Üniversitesi öğrencileri, Guo Jiaxian, Lu Sidi, Cai Han ve UCL Bilgisayar Bilimleri Bölümü'nden Profesör Wang Jun, "Sızan Bilgilerle Tartışmalı Eğitim Yoluyla Uzun Metin Üretimi" başlıklı makaleyi birlikte tamamladılar (bilgi sızıntısı olan rakip eğitim öğrencileri aracılığıyla) Growing Text'de), robot soru cevaplama, otomatik haber oluşturma ve ağa karşı makine çevirisi gibi uygulamalarda yaygın olarak kullanılan uzun cümlelerin metin oluşturma problemini incelediler, cevabı buldular ve etkili yöntemler önerdiler. Olasılıklar sağlar.

Generative Adversarial Networks (GAN'lar), orijinal olarak görüntüler gibi sürekli veriler oluşturmak için tasarlandı. Grup tarafından önerilen SeqGAN gibi modeller, bazı potansiyel sonuçları göstererek, karşıt ağ metinlerinin oluşturulması olasılığını sağlayabilen, bölümlere ayrılmış sıralı ayrık verileri işleyebilir. İngilizce metin doğal olarak kelimelere bölündüğünden, kelime kelime metin oluşturma görevi sıralı bir karar süreci olarak modellenebilir.Her adım için mevcut durum, oluşturulan kelimedir ve davranış, üretilecek kelimedir. , G üretici ağı, mevcut durumu davranışın uzamsal dağılımına eşleyen rastgele bir stratejidir. Tüm cümle metni oluşturulduğunda, oluşturulan cümle D ayrımcısına gönderilecektir. Eğitimden sonra, gerçek metni oluşturulan metinden ayırt edebilir ve ayrımın sonucu G için bir ödül olarak kullanılacaktır. Güncellenmiştir.

SeqGAN'dan sonra, araştırmacılar GAN'ları ve bunların varyantlarını metin oluşturmak için kullanmanın birçok yöntemini önerdiler. Bununla birlikte, bu araştırma sonuçları genellikle oluşturulan metnin daha kısa olduğu (örneğin, 20 kelime içinde) ve daha zor olan uzun metin oluşturma konusunda çok fazla araştırma yapılmadığı durumla sınırlıdır. Haber raporlarının ve ürün açıklamalarının otomatik olarak oluşturulması gibi pratik görevlerde, uzun metin üretme yeteneği vazgeçilmezdir. Sıra kararına dayalı mevcut metin oluşturma yönteminin büyük bir eksiği vardır, yani D ayırıcıdan gelen olasılıklı skaler geri bildirim sinyali seyrektir, çünkü metin G tarafından birden fazla eylem turunda kelime kelime üretilmesine rağmen, yalnızca Tüm cümle oluşturulduktan sonra, G, D'den geri bildirim sinyalini alabilir. Dahası, G'nin stratejisini D'nin rehberliğinde güncellemesi gerekiyordu, ancak D'nin metnin tamamı hakkındaki geribildirimi skaler bir niceliktir ve bilgi miktarı son derece sınırlıdır ve süreçte sözdizimsel yapıyı ve metin anlambilimini korumak yeterli değildir, bu nedenle olamaz G'nin güncellemeyi öğrenmesine etkili bir şekilde yardımcı olun.

Bir yandan, ayırıcı D'den gelen bilgi miktarını artırmak için, son ayırıcı geribildirim değerinin ötesinde daha fazla rehberlik bilgisi sağlamalıdır.Ne de olsa D, kara kutu değil, bilinen bir yapıya sahip eğitimli bir CNN ağıdır. D'nin daha fazla bilgi vermesi tamamen mümkündür. Öte yandan, D'den gelen rehberlik bilgileri hala azdır.Bu sorunu hafifletmek için yazarlar, metin oluşturmanın hiyerarşik yapısını kullanmayı düşündüler, yani gerçek metin örnekleri, anlamsal yapı ve konuşmanın bir kısmı gibi dil seviyelerine dayanmaktadır. Yazılmış. Tüm metin oluşturma görevini hiyerarşik bir yapıya göre birden çok alt göreve ayırarak, model daha kolay öğrenebilir.

Bu yazıda, yazarlar yukarıdaki fikirlerin yanı sıra LeakGAN adlı bir model yapısı öne sürdüler ve aynı anda yetersiz geribildirim bilgisi ve seyrek geribildirim gibi iki problemi ele aldılar. LeakGAN, ayırıcı D'nin jeneratör G'ye daha fazla bilgi sağlamasının yeni bir yoludur.

Şekilde gösterildiği gibi, D'den sızan yüksek boyutlu bilgileri kullanmak için yazarlar, DeepMind tarafından ICML2017'de yayınlanan FeUdal Ağına başvurarak üst düzey bir Yönetici modülü ve düşük düzeyli bir hiyerarşik jeneratör G tasarlamak için başvuruda bulunur. Çalışan modülü. Yönetici modülü, bilgi aracısı olarak görev yapan bir LSTM ağıdır. Yeni bir kelime oluşturmanın her turunda, Yönetici modülü, D'nin CNN ağındaki özellik haritası gibi, ayırt edici D'den yüksek boyutlu özellik temsilleri alacak ve ardından Yönetici modülü, bu bilgiyi bir yol gösterici hedef (hedef) oluşturmak için kullanacaktır. , Mevcut İşçi modülüne göre hareket etmek. D ve G'nin rolleri başlangıçta düşmanca olduğundan, D'deki bilgiler yalnızca kendi içinde tutulmalıdır; ancak şimdi D'deki bazı bilgiler bir casus gibi G'ye "sızdırıldı", bu nedenle yazarlar onu adlandırdı LeakGAN.

Daha sonra, Yönetici modülü hedef yerleştirmeyi oluşturduğunda, İşçi modülü halihazırda üretilen kelimeyi başka bir LSTM ağıyla kodlar ve ardından LSTM'nin çıktısını, Yönetici tarafından entegre edilebilmesini ve yönlendirilebilmesini sağlamak için hedef yerleştirme ile birleştirir. Ve mevcut durum, uygun bir yeni kelime oluşturmak için. Bu süreç aracılığıyla, D'den gelen geri bildirim bilgileri, yalnızca tüm cümle oluşturulduktan sonraki yargı sonucunun skaleridir, aynı zamanda cümlenin oluşturulması sırasında hedef gömme vektörü aracılığıyla birçok bilgi ve rehberlik sağlar. G Performansınızı artırın.

Yazarlara göre bu, bilgi sızdırarak jeneratörleri daha iyi eğitmek için ilk GAN çerçevesidir ve uzun metin oluşturma sorununu çözmek için hiyerarşik pekiştirmeli öğrenme ile birleştirilmiştir.

Yazarın tasarımına göre, oluşturucudaki Yönetici modülü özellik vektörünü D'den alır, hedef yerleştirmeyi oluşturur ve İşçi modülü yeni sözcükler oluşturmak için mevcut cümleyi ve hedefi birleştirir. Tüm süreç farklılaştırılabilir, bu nedenle REINFROCE gibi strateji gradyan algoritması olabilir G'yi eğitmek için doğrudan uçtan uca kullanılır. Bununla birlikte, Yönetici modülü ve Çalışan modülünün, FeUdal Ağındaki uygulama gibi, anlamlı özellikleri belirlemek için kendi görevlerine odaklanması beklendiğinden, Yönetici modülü ve Çalışan modülü ayrı ayrı eğitilir ve Yönetici modülü tanımlayabilmelidir. İşlemcinin özellik alanında daha değerli bir yön öngörülüyor ve İşçi modülü bu yönde hareket ederse bir ödül alacak. Eğitim sırasında, Yönetici modülü ve Çalışan modülü de her biri sabitlendiğinde ve diğeri güncellendiğinde dönüşümlü olarak güncellenir.

Ek olarak, yazarlar, D'nin G'den çok daha güçlü olduğu zaman gradyan kaybolması sorunu gibi genel GAN eğitimine eğilimli problemlerle başa çıkmak için dikkatli bir şekilde eğitim yöntemleri tasarladı. RankGAN'daki sıralama yönteminden esinlenerek, D'nin geribildirim boyutunu ayarlamak için basit ve verimli, sıralamaya dayalı bir "Bootstrapped Yeniden Ölçeklendirilmiş Etkinleştirme" yöntemi önerdiler. Bu dönüşümden sonra, her bir mini grup tarafından elde edilen geri bildirimlerin beklentisi ve farkı sabit hale gelecektir.Bu yöntem, bir değer dengeleyiciye eşdeğerdir ve bu, algoritma değere çok duyarlı olduğunda çok yardımcı olabilir; ayrıca, Bir sıralama yöntemi olarak, modelin yakınsamasını hızlandıran gradyan kaybolması sorununu da önleyebilir.

Yazarlar ayrıca mod çöküşü sorununu önlemek için Interleaved Training yöntemini benimsemiştir.Yani, her zamanki gibi yakınsamaya kadar çatışmalı eğitim yerine ön eğitimden sonra, denetimli eğitim ve eğitim Tartışmalı eğitim alternatifleri. Bu yaklaşımın önemi, modelin kötü yerel minimumlardan kaçınmasına ve modelin çökmesini önlemesine yardımcı olmaktır. Öte yandan, eklenen denetimli öğrenme eğitimi, model davranışının denetimli öğrenmenin sonucundan çok fazla sapmasını önlemek için üretken modelin örtük bir düzenlemesidir.

Eğitim eğrisi şekilde gösterilmiştir LeakGAN'ın negatif log olasılığının önceki yönteme göre çok daha hızlı düştüğü, metin uzunluğu 40 olduğunda, önceki yöntemin yakınsaması bile zordur.

Yazarlar, üretilen verilere ve gerçek verilere dayanarak birçok deney yaptı. Oluşturulan verilere dayalı deneylerde, LeakGAN, 20 ila 40 kelimelik metin dizilerinde önceki modellere göre önemli ölçüde daha düşük bir negatif log olasılığı elde etti. (Tablo 1)

Yazarlar, gerçek verilere dayalı deneylerde sırasıyla uzun, orta ve kısa metinler olarak EMNLP 2017 WMT haberlerini, COCO resim açıklamalarını ve Çin şiirini seçerken, LeakGAN da en yüksek BLEU puanını elde etti. (Tablo 2, 3, 4)

İnsan Turing testinde LeakGAN, önceki modellere göre önemli iyileştirmeler de elde etti. (tablo 5)

Yazarlar ayrıca Yönetici modülü ile Çalışan modülü arasındaki etkileşim üzerine derinlemesine bir çalışma yaptılar.Sonuçlar, LeakGAN'ın, noktalama, zaman ve uzunluk gibi cümle yapısını açıkça vermeden cümle yapısını örtük olarak öğrenebileceğini gösteriyor. sonek.

Aşağıda, bu model tarafından oluşturulan bir metin örneği ile önceki çalışma arasında bir karşılaştırma verilmiştir:

Araştırmanın spesifik detayları orijinal makale https://arxiv.org/abs/1709.08624'te bulunabilir.Kağıt, eğitim sürecinde verileri tanıtan, çok sayıda üretilen cümle sağlayan ve model kodunu sağlayan zengin bir eke sahiptir.

Ek olarak, makalenin yazarlarından Zhang Weinan'ı, bu makalenin sonuçlarını açıklamak için halka açık bir ders vermek ve metin oluşturmak için GAN'ların kullanımına ilişkin daha fazla araştırma vermek üzere Leifeng.com'a davet ettik.

Zhang Weinan şu anda Şanghay Jiaotong Üniversitesi Bilgisayar Bilimleri Bölümü ve John Hopcroft Araştırma Merkezi'nde yardımcı doçent olarak görev yapmaktadır.Araştırma yönü makine öğrenimi ve veri madenciliği problemlerindeki uygulamalarıdır. Şangay Jiao Tong Üniversitesi Bilgisayar Bilimleri Bölümü ACM sınıfından 2011 yılında mezun oldu ve 2016 yılında University College London Bilgisayar Bilimleri Bölümü'nden doktora derecesini aldı. Araştırma sonuçları dünya çapında akademik konferanslarda ve dergilerde 5'i ilk yazarlar olmak üzere 50 makale yayınladı. ACM Uluslararası Veri Bilimi Konferansı KDD'de yayınlanan; 2016 yılında Microsoft Research tarafından "Global SIGKDD En İyi 20 Bilimsel Araştırma Yıldızı", 2017 yılında ACM International Information Retrieval Conference SİGİR tarafından En İyi Makale Adaylığı ödülüne layık görülmüştür. KDD-Cup kullanıcı kişiselleştirilmiş öneri yarışmasında küresel üçüncülüğü ve küresel büyük veri gerçek zamanlı teklif algoritması yarışmasında son şampiyonu kazandı. Kişisel araştırma ana sayfası:

Açık ders saati 28 Eylül Perşembe günü saat 20: 00'dir. İlgilenen okuyucular kaydolmak için kodu tarayabilir, kaçırmayın!

Lei Feng.com AI Technology Review Compilation makalesinin ilgili içeriği, bu makaleye ek düzeltmeleri için Yardımcı Doçent Zhang Weinan ve Profesör Wang Jun'a teşekkürler.

Yoğun şehir test sürüşünde bu turuncu dokunuş Dongfeng Fengshen AX5
önceki
Hem izlemek hem de oynamak, bu yerel orijinal ebeveyn-çocuk müzikali çocukları mutlu ediyor
Sonraki
Daha fazla eş mi? "LoveR" 6 kadın kahramanlar ve sistem bilgilerinin ifşa edilmesi
Bir araba satın almak birkaç gün daha bekleyebilir. Bu "Yılın Yeni Otomobili" SUV'ler satışa sunulmak üzere!
Dönerken neden debriyaja basmam gerekiyor?
Yeni Parçacık Sürüsü Algoritmasına Dayalı Yüksek Verimli VIENNA Doğrultucu Araştırması
Oscar adayı "Boğanın Maceraları" 100 milyon gişeyi aştı
Arabalar neden Tibet'te tüm Toyota Land Cruiser'larda çalışıyor? Land Rover BMW yerine mi?
Enerji Depolama Linkli Güç Elektroniği Transformatörünün Güç Kalitesi Araştırması
Kardeş Tom çaresiz durumda! Shooting Mission Impossible 6 yaralı ağır çekim videoya maruz kaldı, ayak bileğinin hala yaralandığını ortaya çıkardı
Baidu SVAIL, iki yönlü dikkat akışından 24,7 kat daha hızlı olan etkili bir soru yanıtlama modeli GNR'yi başlattı
855 + 12 + 44 = iQOO olağanüstü amiral gemisi cep telefonu değerlendirmesi
[Sektörün etkin noktası] Tencent Ma Huateng: 5G ve AI, endüstriyel İnternetin gelişimini teşvik ediyor (tam konuşma ile)
James Franco, cinsel taciz iddiaları nedeniyle Oscar tarafından nakavt edildi ve ayrıca Vanity Fair'in kapağından çıkarıldı.
To Top