Hiyerarşik özyinelemeli ağlarda sıra etiketleme için aktarım öğrenimi
Dikkat sinir ağının sıra etiketleme modelindeki özellikler
İki yönlü LSTM-CNN'lere dayalı olarak adlandırılmış varlık tanıma
İki yönlü LSTM-CNNs-CRF aracılığıyla uçtan uca sekans etiketleme
Daha iyi nesne temsili, dünyanın saf görüntülerden daha iyi yeniden inşası
Kağıt adı: HİYERARŞİK TEKRARLANAN AĞLARLA SIRALI ETİKETLEME İÇİN TRANSFER ÖĞRENME
Yazar: Zhilin Yang / Ruslan Salakhutdinov
Düzenlenme zamanı: 2017/3/18
Kağıt bağlantısı: https://paper.yanxishe.com/review/10864?from=leiphonecolumn_paperreview0214
Temel sorun: Geleneksel makine öğreniminde özelliklerin manuel olarak oluşturulması sorununu çözmek için, burada sinir ağları genellikle sıralı etiketleme problemlerinde kullanılır, ancak sinir ağları genellikle çok fazla veri gerektirir, bu yüzden şimdi bir durumla karşı karşıyayız Veri miktarı yetersiz olduğunda bu sorunu nasıl çözebiliriz?
İnovasyon: Bilgisayar vizyonunda, yetersiz veri ile karşılaştığımızda, genellikle aktarımla öğrenme yöntemlerini kullanırız. Bu makale ayrıca, daha az ek açıklama ile hedefleri iyileştirmek için zengin açıklamalı kaynak görevlerinin kullanıldığı aktarım öğrenme yöntemlerini de keşfedecektir. Görev performansı
Araştırmanın önemi: Bu şekilde, eğitilmiş model parametreleri ve mimarisi taşınabilir ve iyi sonuçlar elde edilebilir.Aslında, nlp'de önemli ön eğitim modellerinin yükselişi, bu yönün uygulanabilirliğini bir dereceye kadar kanıtlamaktadır. .
Kağıt adı: Sinirsel Sıra Etiketleme Modellerinde Karakterlere Katılma
Yazar: Marek Rei / Gamal K.O. Crichton / Sampo Pyysalo
Yayın zamanı: 2016/11/14
Kağıt bağlantısı: https://paper.yanxishe.com/review/10863?from=leiphonecolumn_paperreview0214
Önerilen neden
Temel problem: Sıralı etiketleme problemiyle ilgilenilmesi gereken bir problem var Bu problem, bir cümlede görünen kelimeler yabancı kelimeler olduğunda, o zaman bu sefer problemler olacaktır. Bu tür bir kelimeye OOV problemi denir
İnovasyon noktası: İnovasyon noktası bu problemi çözmektir.İlk olarak, kelimelerin OOV problemleri vardır, ancak karakterlerin OOV problemleri yoktur.Karakter seviyesinde bilgi burada tanıtılmaktadır. Daha sonra klasik dikkat + RNN + CEF kombinasyon yöntemi kullanılarak dikkat mekanizması tanıtıldı, böylece kelime seviyesi ve karakter seviyesi vektörleri birleştirilerek OVV olmayan kelimenin karakter vektörü kelime vektörüne benzer.
Araştırmanın önemi: Birçok veri setinde iyi sonuçlar elde edilmiştir ve bu modelin daha az parametresi vardır.
Kağıt adı: Çift Yönlü LSTM-CNN'lerle Adlandırılmış Varlık Tanıma
Yazar: Jason P.C. Chiu / Eric Nichols
Yayınlanma zamanı: 2016/7/19
Kağıt bağlantısı: https://paper.yanxishe.com/review/10862?from=leiphonecolumn_paperreview0214
Önerilen neden
Temel sorun: Bu makale, nlp'de çok zorlu bir görev olan adlandırılmış varlık tanıma görevini çözmektedir. Geleneksel makine öğrenimi yöntemlerinin manuel yöntemler kullanması gerekir, ancak bu yöntem iyi değildir.
Yenilik: Bu makale derin öğrenme yöntemini kullanır.Geleneksel derin öğrenme yönteminin aksine, burada çift yönlü bir LSTM ve CNN hibrit mimarisi kullanarak kelime düzeyinde ve karakter düzeyinde özellikleri otomatik olarak algılayabilen yeni bir sinir ağı yapısı oluşturulmuştur. Çoğu özellik mühendisliği ihtiyacını ortadan kaldırır. Ek olarak, bu makale sinir ağındaki kısmi sözlük eşleştirmesini kodlamak için bu yöntemi kullanan ve daha iyi sonuçlar elde edebilen yeni bir yöntem önermektedir.
Araştırmanın önemi: Deneyler, bu modelin mevcut modelden daha etkili olduğunu ve birden çok veri kümesinde en iyi sonuçları elde ettiğini göstermektedir.
Kağıt adı: Çift Yönlü LSTM-CNNs-CRF ile Uçtan Uca Sekans Etiketleme
Yazar: Xuezhe Ma / Eduard Hovy
Yayın zamanı: 2016/5/29
Kağıt bağlantısı: https://paper.yanxishe.com/review/10861?from=leiphonecolumn_paperreview0214
Temel sorun: Bu makalenin özü, nlp alanındaki adlandırılmış varlık tanıma sorununu çözmektir.
İnovasyon: Daha önce yaygın olarak kullanılan model LSRM + CRF'dir Bu makale, uçtan uca bir sinir ağı modeli oluşturur ve yerel bilgileri iyi idare edebilen CNN yapısını sunar.
Araştırmanın önemi: Bu modelin etkisi, önceki modelin etkisini aşıyor.
Bildiri Başlığı: Yapılandırılmış Dünya Modellerinin Karşıt Öğrenimi
Yazar: Thomas Kipf / Elise van der Pol / Max Welling
Düzenlenme zamanı: 2019/9/26
Kağıt bağlantısı: https://paper.yanxishe.com/review/10860?from=leiphonecolumn_paperreview0214
İnsanlar dünyadaki nesneleri, nesneler, seviyeler vb. Arasındaki ilişkiyi gözlerin gözlemlediği görsel sinyallerden anlayabilir ve geri yükleyebilir.Bu, insan bilişsel yeteneğinin önemli bir parçasıdır ve hala makine öğrenimi, derin öğrenme ve hesaplamalı görme ile karşı karşıyadır. Büyük bir zorluk (yapılandırılmış dünya modelini orijinal piksel girişinden geri yükleyin).
Bu makalede, Virginia Üniversitesi'nin yazarları, birleşik bir yapı ile çevrenin temsilini öğrenmek için bir kontrast yöntemi kullanan, kontrast eğitimine dayalı yapılandırılmış bir dünya modeli C-SWM önerdiler. Çıkarılan ortamdaki nesneleri yalnızca orijinal pikselleri doğrudan denetim olmaksızın gözlemleyerek keşfedebilir.
Yazarlar, modelin performansını, basit bir Atari oyunu ve çok nesneli bir fiziksel simülasyon ortamı dahil olmak üzere birden çok bağımsız ve kontrol edilebilir nesne içeren etkileşimli bir ortamda değerlendirdiler. Deneyler, bu modelin önceki piksel tabanlı yeniden yapılandırma modellerinin birçok eksikliğinin üstesinden gelebileceğini ve aynı zamanda yüksek düzeyde yapılandırılmış bir ortamda benzer temsil modellerinden daha iyi performans gösterdiğini göstermektedir.Aynı zamanda öğrendiği nesne tabanlı temsil hala yorumlanabilir. Cinsel.
Bu yazının yöntemi pratik ve etkilidir, eleştirmenler tarafından büyük övgüler almış ve ICLR2020 tarafından sözlü bir rapor kağıdı olarak kabul edilmiştir.
AI Araştırma Enstitüsü, yapay zeka gençlerinin çoğuna daha iyi hizmet verebilmek için resmi olarak yeni bir "Tez" bölümü başlattı ve tezleri, önerileri, yorumları ve yorumları sıralayan makaleler aracılığıyla yapay zeka öğrencilerini ve gençleri bir araya getirmek için "ilgi çekici noktalar" olarak kullanmayı umdu ve kod yeniden üretildi. Yurtiçinde ve yurtdışında en son araştırma sonuçlarının incelenmesi, tartışılması ve yayınlanması için bir buluşma yeri olmaya ve mükemmel bilimsel araştırmaların daha geniş çapta yayılmasına ve tanınmasına izin vermeye kararlıdır.
Akademisyenleri sevenlerin, makale yazarlarından oluşan ekibimize katılmanızı umuyoruz.
Alabilirsiniz
1. Adınızın yazdığı bir makale sizi en göz kamaştırıcı akademik yıldız yapacak
2. Zengin ücret
3. AI ünlü şirketleri, konferans bileti avantajları, özel çevre birimleri vb.
Bildiri yazarı ekibine katılmak için ihtiyacınız olan:
1. Favori makalelerinizi araştırma kulübü üyelerinin çoğuna önerin
2. Tez yorumu yazın
AI Araştırma Enstitüsü'nün yarı zamanlı makale yazarı ekibine katılmaya hazırsanız, operasyon kadının WeChat hesabını ekleyebilir ve "Yarı zamanlı makale yazarı" notunu yazabilirsiniz.
Lei Feng Ağı Lei Feng Ağı Lei Feng Ağı