"ACL 2017 Seven Highlights" Pekin Üniversitesi, Tsinghua Üniversitesi, Çin Bilimler Akademisi, Fudan Üniversitesi'nden 5 seçkin makale

1 Xinzhiyuan raporu

Hesaplamalı Dilbilim Derneği (ACL), dünyanın her yerinden üyeleriyle dünyanın en etkili ve dinamik uluslararası akademik kuruluşlarından biridir. ACL konferansı, çok çeşitli doğal dil hesaplama yöntemlerini ve çeşitli araştırma alanlarını kapsayan hesaplamalı dilbilim alanında en önde gelen konferanstır. ACL 2017, ana konferanslara ek olarak, diğer önemli konferanslar gibi seminerler, özel raporlar, seminerler ve sunumlar da içermektedir. 55. Uluslararası Hesaplamalı Dilbilim Derneği (ACL) Yıllık Konferansı 31 Temmuz - 5 Ağustos, Pekin saatinde Vancouver, Kanada'da düzenlenecektir (yerel saat Pekin saatinden 18 saat sonradır).

Kabul edilen makaleler: IE QA metin madenciliği uygulamaları en yüksek oranı oluşturur

Bu konferans 1.419 gönderi aldı (829 uzun makale ve 590 kısa makale) ve 1.318 makale (751 uzun makale ve 567 kısa makale) incelemeye gönderildi. Sonunda, 302 makale (195 uzun makale ve 107 kısa makale) kabul edildi ve kabul oranı% 22.91 idi, kabaca öncekilerle aynı.

Gönderileri tasnif etme sürecinde, bazı çok ilginç durumları da yansıtan çok ilginç figürler bulabiliriz.

1. Gönderim zamanı

Uzun makalelerin gönderimi için zaman çizelgesi: Son başvuru tarihinin son 24 saatinde, başvuruların sayısı keskin bir şekilde arttı.

Bu tabloyu gören ACL 2017 program başkanı Regina Barzilay, ACL 2017 komitesinin son teslim tarihi yaklaşık 24 saat olduğunda çok endişelendiğini, çünkü o sırada yalnızca 342 başvuru alındığını ve bu sefer çok fazla kişinin davet edildiği görülüyordu. Gözden geçirenler. Ancak çok geçmeden kalpleri rahatladı - son teslim tarihinin son 24 saatinde başvuruların sayısı keskin bir şekilde arttı. Barzilay yardım edemez ama iç çeker, görünüşe göre erteleme (ya da daha iyisi mükemmellik arayışı) ACL araştırma topluluğunda derin bir şekilde kök salmıştır ...

2. Gönderim için popüler alt alanlar

İlk 10 alt alana bir göz atalım.

Yukarıdaki resim, gönderimlerin sayısına dayalı bir pasta grafiğidir. Görülebileceği gibi,

  • Toplam gönderi sayısının% 23,4'ünü oluşturan 308 gönderi (192 uzun makale ve 116 kısa makale) ile ilk sırada yer alan "bilgi çıkarma, alma, soru ve cevap, belge analizi ve doğal dil işleme uygulamaları"

  • İkincisi, 159 katkı (100 uzun makale ve 59 kısa makale) ile anlambilimdir ve% 12,1'i oluşturmaktadır.

  • Üçüncüsü, 108 katkı (60 uzun makale ve 48 kısa makale) ile makine çevirisi olup,% 8,2'dir

  • Makine öğrenimi, 93 gönderimle (55 uzun ve 38 kısa) dördüncü sırada yer alarak% 7,01'e karşılık geliyor

Aşağıda, her bir alt alan için, beklenen gönderim sayısını listeleyen belirli gönderim sayısı verilmiştir (ilk sütun, altta yeşildir ve kırmızı sayı, alandaki beklenmedik büyümeyi temsil etmektedir).

keşfedilebilir Bu yılki ACL gönderimlerinde "İletişim ve Etkileşimli Sistem" in popülerliği % 59,7'den fazla artışla , Bu, Amazon Echo ve Google Home gibi akıllı hoparlör ürünlerinin ısınmasıyla ilgili olabilir. İkincisi ise% 41,9 artışla Vision Robots Grounding. Makine öğrenimi% 34,4 ile üçüncü sırada yer aldı.

Organizasyon komitesi, 2017 ve 2014 yıllarındaki başvuruları karşılaştırdı (aşağıya bakınız). Fark sadece 3 yıldır ACL 2017'de 5. sırada yer alan özetleme ve oluşturma, ACL 2014'te ilk 10'a bile girmedi.

3. Belgeleri alın

302 bildiri aldı (195 uzun bildiri ve 107 kısa bildiri). onların arasında, Her bir alt alanın durumu kabaca başvurularınki ile aynıdır.Ayrıca IE QA metin madenciliği uygulamalarında birinci, anlambilim ve makine çevirisinde ikinci ve üçüncü sırada yer almaktadır. . Sosyal medya gazeteleri, kabul edilen makale sayısında dördüncü sırada yer aldı.

  • Biyotıp: 3 makale (% 0,99)

  • Bilişsel modelleme ve psikodilbilim: 4 makale (% 1.32)

  • Diyalog interaktif sistemi: 16 makale (% 5,30)

  • Metinsel Edimbilim: 16 makale (% 5,30)

  • Özet oluşturma: 20 makale (% 6,62)

  • IE QA metin madenciliği uygulamaları: 56 makale (% 18,54)

  • Makine öğrenimi: 19 makale (% 6,29)

  • Makine çevirisi: 27 makale (% 8,94)

  • Multidisipliner makaleler: 10 (% 3,31)

  • Çok dilli makaleler: 9 bildiri (% 2,98)

  • Fonolojik morfolojik kelime segmentasyonu: 8 makale (% 2,65)

  • Kaynak Değerlendirmesi: 11 makale (% 3,64)

  • Anlambilim: 39 makale (% 12.91)

  • Sosyal medya: 22 (% 7,28)

  • Seslendirme: 3 makale (% 0,99)

  • Gruplama Sözdizimi Ayrıştırma Etiketleme: 20 makale (% 6,62)

  • Robot Vision Foundation: 7 makale (% 2,32)

  • Duygu analizi ve fikir madenciliği: 17 makale (% 5,63)

ACL 2017 ayrıca 21 TACL belgesine ve 21 yazılım demosuna sahiptir.

Yukarıdaki sonuçlar sezgisel olarak ifade edilebilir:

Kabul edilen bildiri sayısı: Mavi, uzun metinleri ve yeşil kısa metinleri temsil eder. (Kırmızı ve mor, sırasıyla TACL'de yayınlanan yazılım demolarını ve makaleleri temsil etmektedir.) Kabul edilen makale sayısında IE QA metin madenciliği uygulamalarının ilk sırada, ardından anlambilim ve üçüncü sırada (uzun ve kısa metinlerin toplam sayısı) makine çevirisi olduğu görülmektedir.

Seminerler, seminerler: makine öğrenimi ve derin öğrenme mutlak anahtar kelimelerdir

ACL 2017'de ilk kez düzenlenen "Nöral Makine Çevirisi" ve "İnternet Dilini Kötüye Kullanma" gibi atölyelerin yanı sıra 21. İskandinav Hesaplamalı Dilbilim Konferansı ve 10 yıldan daha eski olan 11. Dilbilimsel Ek Açıklama dahil olmak üzere toplam 32 atölye çalışması bulunuyor. atölye.

Resmi web sitesinde yayınlanan en son bilgilere göre, ACL 2017, 4'ü makine öğrenimi ve derin öğrenme başlıklı 6 öğreticiye sahiptir. Bunlar: Çok modlu makine öğrenimi: dil, vizyon ve konuşmayı entegre etme, sem Anlamsal kompozisyonda derin öğrenme , Diyalog sistemlerinde derin öğrenme, Çok kelimeli ifade ve eşdizimde derin öğrenme, makine öğrenimi ve derin öğrenme dalgasının hesaplamalı dilbilimde, özellikle de derin öğrenmede ortaya çıktığını görebiliriz.

ACL 2017'de ayrıca 23 Öğrenci Araştırma Atölyesi bulunmaktadır.Buradaki içerik, dağıtılmış temsilden Dikkat ve Twitter emojilerine kadar çok kapsamlıdır, ancak bunların çoğu makine öğreniminden veya derin öğrenmeden de bahsetmektedir.

Açılış konuşması

ACL 2017'de biri kısmi teori ve biri kısmi uygulama olmak üzere iki davetli görüşme vardır.

Oturum 1: Noah Smith (Washington Üniversitesi)

Hesaplamalı dilbilim ve doğal dil işleme toplulukları, şimdi temsili öğrenmede bir artış yaşıyor. Temsili öğrenmeyi doğal dil modellerinde kullanmanın yeni yollarını tanıtacağım. Veriye dayalı bir modelin her zaman varsayımsal bir teoriye sahip olduğu unutulmamalıdır (iyi bir teori olması gerekmez). Temsili öğrenmeyi içeren dil modellerine dile uygun tümevarımsal önyargının faydalarını göstereceğim. Bu tür sapmalar genellikle modelde yer alan ve verilere uygulanan muhakeme algoritmaları veya dil analizi ile sınırlı olan varsayımlar olarak ortaya çıkar. Aslında, onlarca yıllık dilbilimsel araştırma (hesaplamalı dilbilim dahil) şimdi tümevarımlı sapmaları bulmamızı sağladı ve yeni model, daha önce kullanılamayan sapma biçimlerini keşfetmemize ve dilbilimde yeni keşifler üretmemize izin verebilir. . Yeni belge modeline ve anlamsal yapıya odaklanacağım.Ayrıca soyut, yeniden kullanılabilir bileşenler ve bunların varsayımlarını (uygulamalardan çok) vurgulayacağım.

Oyun 2: Mirella Lapata (Edinburgh Üniversitesi)

Son yıllarda insanlar, doğal dilde metin işlemek ve oluşturmak için çok sayıda bilgi işlem aracı geliştirdiler. İnternet araması, soru-cevap, duygu analizi ve özellikle makine çevirisi gibi birçoğu yaygın olarak tanındı. İnternetin popülaritesi bu işlemi daha da geliştirebilir ve uygulaması yalnızca farklı diller arasında (örneğin, İngilizce'den Fransızcaya) çeviri için değil, aynı zamanda aynı dil arasında, farklı modlar arasında veya farklı veri formatları arasında da kullanılabilir. Çeviri gerçekleştirin. Çoğu arama aracı metin verileri üzerinde çalıştığından, ağdaki sözlü olmayan veriler (videolar, resimler, kaynak kodu gibi) dizine eklenemez veya aranamaz.

Bu sunumda, kişisel ve bilgisayar elektronik verileri daha erişilebilir hale getirmek için geliştirilmesi gereken yeni çeviri modelini tartışacağım. Üç örneğe odaklanacağım, metin basitleştirme, kaynak kodu oluşturma ve film özeti oluşturma. Farklı modellerin genel ifadesine rehberlik etmek ve bunlar ile doğal dil arasında nasıl çeviri yapılacağını öğrenmek için derin öğrenmedeki en son gelişmelerin nasıl genişletileceğini açıklayacağım.

Çin Anakarasındaki 5 seçkin makale: Tsinghua Üniversitesi, Peking Üniversitesi, Fudan Üniversitesi, Otomasyon Enstitüsü, Çin Bilimler Akademisi

Bu yılın başlarında, ACL 2017, 22 makale içeren seçkin makaleler yayınladı. Bunların arasında ilk yazarlardan altısı Çinli. Bunların arasından dördü Çin anakarasından ve biri Tsinghua Üniversitesi, Peking Üniversitesi, Fudan Üniversitesi ve Çin Bilimler Akademisi Otomasyon Enstitüsü tarafından seçildi.

Aşağıdakiler, her bir olağanüstü makalenin ACL 2017'de sunulduğu zamana göre düzenlenmiştir:

Bildiri: Nöral Makine Çevirisini Görselleştirme ve Anlama

Yazar: Ding Yanzhuo, Liu Yang, Luan Bo-hwan, Sun Maosong (Tsinghua Üniversitesi)

Makale: Tartışmalı Sorunlar Üzerine Çeşitli Destekleyici Argümanları Anlamak ve Tespit Etmek

Yazar: Xinyu Hua ve Lu Wang (Northeastern Üniversitesi)

Tez: Metin Düzeyinde Söylem Analizi İçin İki Aşamalı Ayrıştırma Yöntemi (Metin Düzeyinde Söylem Analizi için İki Aşamalı Ayrıştırma Yöntemi)

Yazar: Yizhong Wang, Sujian Li ve Houfeng Wang (Peking)

Bildiri: Grafik Tabanlı Dikkatli Sinir Modeli ile Soyut Doküman Özetleme (Grafik Tabanlı Dikkatli Sinir Modeli ile Soyut Doküman Özetleme)

Yazar: Jiwei Tan, Xiaojun Wan ve Jianguo Xiao (Peking)

Tez: Yeni bir etiketleme şeması yoluyla Yeni Bir Etiketleme Şemasına Dayalı Varlıkların ve İlişkilerin Ortak Çıkarımı (Yeni Bir Etiketleme Şemasına Dayalı Varlıkların ve İlişkilerin Ortak Çıkarımı)

Yazar: Suncong Zheng, Feng Wang, Hongyun Bao, Yuexing Hao, Peng Zhou ve Bo Xu (Çin Bilimler Akademisi Otomasyon Enstitüsü)

Makale: İsimlendirilmiş Varlık Tanıma ve Bahsetme Algılama için Yerel Tespit Yaklaşımı

Yazar: Mingbin Xu, Hui Jiang ve Sedtawut Watcharawittayakul (York Üniversitesi, Kanada)

Makale: Çince Kelime Segmentasyonu için Tartışmalı Çok Kriterli Öğrenme

Yazar: Chen Chi, ekran, Qiuxi Peng, Huang Jing Xuan (Fudan Üniversitesi)

Başkan ekibi: Çinli bilim adamları 18 alanın 9'unda dağıtılıyor

ACL 2017'nin konferans başkanı Pennsylvania Üniversitesi'nden Chris Callison-Burch'dur ve iki program başkanı, yukarıda bahsedilen Regina Barzilay (MIT) ve Singapur Ulusal Üniversitesi'nden (NUS) Profesör Min-Yen Kan'dır.

Kağıdın yaşam ve ölüm gücü temelde etki alanı başkanının elinde olduğundan, ACL 2017 etki alanı başkanına bakmak için bir bölüm kullanacağız. Bu konferansta 18 alt alana dağılmış 61 saha başkanı bulunmaktadır ve her alandaki başkan sayısı temelde başvuru sayısı ile eşleşmektedir. Bunların arasında Çinli akademisyenler aşağıdaki 9 alt alanda dağılmıştır ve Çin anakarasından birçok bilim insanı vardır.

  • Söylem ve Pragmatik: Yangfeng Ji, Li Sujian (Pekin Üniversitesi)

  • Bilgi Çıkarma ve NLP Uygulamaları: Chia-Hui Chang, Jing Jiang, Liu Kang (Otomasyon Enstitüsü, Çin Bilimler Akademisi), Liu Tieyan (MSRA)

  • Makine Öğrenimi: William Wang

  • Makine Çevirisi: Liu Yang (Tsinghua Üniversitesi), Minh-Thang Luong, Mi Haitao (Bilgisayar Teknolojisi Enstitüsü, Çin Bilimler Akademisi), Xiong Deyi (Suzhou Üniversitesi)

  • Duygu Analizi ve Fikir Madenciliği: Lun-Wei Ku

  • Sosyal medya: Liu Zhiyuan (Tsinghua Üniversitesi) Shimei Pan

  • Konuşma: Chia-ying Lee

  • Özetleme ve Üretme: Wenjie Li (The Hong Kong Polytechnic University)

  • Etiketleme, Parçalama, Sözdizimi ve Ayrıştırma: Yue Zhang, Zhao Hai (Şangay Jiaotong Üniversitesi)

Bilişsel modelleme ve psikodilbilim, diyalog ve etkileşimli sistemler gibi diğer alt alanlar Çinli başkan olmadan listelenmemiştir.

Sponsorlar: BAT'ın yanı sıra Huawei, Sogou ve Toutiao bir araya geldi

Konferansın sponsorları bir ölçüde endüstri ile olan bağı yansıtıyor ve akademik başarıların endüstriyel dönüşümü de ondan görülebiliyor. ACL 2017'nin sponsor sayısı henüz sona eren CVPR 2017 kadar büyük olmasa da, bugün Google, Amazon, Facebook, Microsoft, IBM, yerli BAT, Huawei, Sogou ve Toutiao gibi yabancı devleri listelemek hala çok ağır. - Ve Çinli şirketler (özellikle BAT) bunda önemli bir yer işgal etti.

7 platin sponsor var:

Altın sponsor:

Gümüş sponsor:

Bronz sponsor:

Destek Birimleri:

Özel oturum: Bu ACL, önceden basılmış makaleler için bir inceleme politikası oluşturacaktır

Bu konferans ayrıca, ikinci gün öğle saatlerinde çift kör incelemeyi ve ArXiv'in önceden basılmış versiyonunun ilgili konularını tartışmak için özel bir "meta konferans" oturumu açtı.

Birçok çalışma, çalışmanın nesnel değeri aynı kaldığında, tek kör incelemenin hakemlerin belirli araştırmacı türlerine karşı daha önyargılı olmasına neden olacağını göstermiştir. Bu nedenle, tüm ACL toplantıları ve çoğu seminer çift kör inceleme sistemi kullanır. ArXiv'in temsil ettiği çevrimiçi ön baskı sunucularının popülaritesi, çift kör inceleme sürecini bir ölçüde tehdit ediyor. Bu ACL, önceden basılmış sürüm için bir politikayı açıkça tartışacaktır. Sadece bu değil, konferans aynı zamanda ArXiv'in kullanımını da araştırdı.

"Ön Baskı Yayınlama ve İnceleme ACL Anketi Raporu" raporuna göre, anket Haziran 2017'de gerçekleştirildi ve 623 tam yanıt alındı. Görüşülen kişilerin büyük çoğunluğu (% 93) mevcut veya eski ACL üyeleridir ve örneklem, derneğin toplam üye sayısının yaklaşık% 20'sini oluşturmaktadır ve bölge, cinsiyet ve akademik geçmiş açısından temsilcilerdir.

Yanıtlayan kompozisyon (soldan sağa) : Coğrafya, cinsiyet ve rol. % 17'si Asya-Pasifik bölgesinden,% 36 Amerika'da;% 72'si erkek;% 28'i profesör ve% 32'si lisansüstü öğrencilerdir.

Sonuçlar gösteriyor ki, Ankete katılanların yaklaşık yarısı (% 53) araştırma makalelerini barındırmak için nadiren veya hiç bir ön baskı sunucusu kullanmıyor ve neredeyse beşte biri (% 22) bunu sıklıkla veya her zaman yapıyor.

Önceden basılmış sunuculara makale koymak istemeyen yazarlar, çoğunlukla konferanslarda veya dergilerde yayınlamayı planladıkları ve çift kör bir inceleme sistemi sağlamak istediklerinden kaynaklanmaktadır. Ve genellikle ön baskı sunucularına araştırma makaleleri koyan yazarlar, İnsanların% 28'i bildirim almadan önce yükleme yapma eğilimindedir ve diğer% 43'ü yüklemeden önce makalenin kabul edilmesini beklemeye isteklidir. . Bildiri almadan önce makale yükleyenler, esas olarak araştırmalarını tanıtmak isterler ya da makalenin yayınının (ilk yayın) zaman noktasını öğrenmek isterler.

Önceden basılmış makalelerin okunup okunmayacağına gelince, sonuçlar şunu göstermektedir: Ankete katılanların büyük çoğunluğu (% 86) bazen okumakta ve birkaçı (% 54) bazen alıntı yapmaktadır. Matbu makalelere atıf yapma eğiliminde olmayanlar neredeyse oybirliğiyle, yayınlanmış makalelere (varsa) atıf yapmayı tercih edeceklerini ve aynı zamanda önceden basılmış versiyonun hakem tarafından değerlendirilmediğine inandıklarını ve bu nedenle güvenilirliğini sorguladıklarını belirttiler.

Son olarak, gelecekteki ACL toplantıları için önceden basılmış makaleleri gözden geçirme politikası sorulduğunda, katılımcıların büyük çoğunluğu (% 88) ACL toplantılarındaki çift kör incelemelerin çok önemli olduğuna inanıyordu. Bu kişilerin yaklaşık% 75'i (toplam katılımcıların% 65'i) çift kör incelemenin ön baskı gönderebilmekten daha önemli olduğuna inanıyor. Yalnızca birkaç kişi (% 9) ön baskı yayınlamanın çift kör incelemeden daha önemli olduğunu düşünüyor.

Özetle, birçok görüşmeci, çift kör incelemenin çok önemli olduğunu ve önceden basılmış versiyonun akademik alışverişleri ve yaygınlaştırmayı da hızlandırdığını söyledi. Görüşülen pek çok kişi, baskı öncesi ve çift kör inceleme arasındaki çatışmayı çözmenin en iyi yolunun, yazarlığı baskı öncesi sunucudan geçici olarak engellemek olduğuna inanmaktadır (diğer yönler değişmeden kalır).

Pek çok katılımcı, kağıt incelemesinin kalitesindeki düşüşle ilgili endişelerini de dile getirdi.

Daha fazla anket bilgisi için lütfen raporu görüntüleyin: https://www.aclweb.org/portal/sites/default/files/SurveyReport2017.pdf

ACL 2017, en iyi makaleyi ve Yaşam Boyu Başarı Ödülü'nü ve diğer ödüllü bilgileri 3 Ağustos Pekin'de açıklayacak. Daha fazla bilgi edinmek için lütfen Xinzhiyuan'ın takip raporunu takip edin.

Çin yemek çubuklarını gerçekten anlıyor musunuz?
önceki
2.0T + 4WD + 250.000 iniş! Bu dört SUV'den hangisi daha çok tercih edilmeye değer?
Sonraki
Cumartesi günü SIPG'ye meydan okumak için Şangay'ı ziyaret eden Yan Junling, Luneng'i kim atacak?
2019 · Çin Polisi İstek Listesi
Çinli alıcılardan veya çekilmeden sonra Kanadalı ekonomistler: Kanada 68 yılın en büyük resesyonuna girebilir
24 hayvan ilk kez kar gördü, ifadeleri parladı!
Bir otomobil 4S mağazası ile 5S mağazası arasındaki fark nedir? 5S mağazalarının bakımı, 4S mağazalarından daha mı pahalı?
"Önerilen kitap" DeepMind Hassabis sinirbilimi çılgınca destekledi, başlamak için hangi kitapları okumam gerekiyor?
Yardımcı polis memuru Zhao Xiaoyun, yoğun karlı bir günde trafik kazasında ölen evsizleri kurtardı ve yoldaşları iyi gidiyor!
Vietnamlı çiftçiler "Waterloo" ile karşılaştı, Vietnam üretimi şok edici, ekonomik mucize eski haline geri dönebilir
Bu zorlu arazi yolları erkeklerin "sevgilileridir" ve kötü yol zorbaları olarak bilinirler
Kutup ışıklarının altındaki "vaşağın ayağı", Dünya'daki en uzay benzeri yer olabilir ...
Küçük demlik çay, üç buçuk yılda çay endüstrisinin bir numarası haline geldi.
Polis 110 ve kitlelerin hepsi güvenlik görevlisi Bu kamu güvenlik organları, güvenliği sağlamak için "Akçaağaç Köprüsü deneyimini" geliştirdiler.
To Top