2018 ML ve NLP konferans kağıtları: Zhou Ming, Zhang Tong ve Sun Maosong parlak verilere sahip

Leifeng.com AI Teknolojisi Yorumu: Cambridge Üniversitesi'nde kıdemli araştırmacı olan Marek Rei, 2018'in sonunda makine öğrenimi ve doğal dil işleme alanında yayınlanan makalelerin istatistiklerini bir kez daha güncelledi ve bu sefer ACL, EMNLP, NAACL'yi seçti. EACL, COLING, TACL, CL, CoNLL, NeurIPS, ICML, ICLR ve AAAI dahil olmak üzere 12 büyük konferans / derginin istatistikleri Yayınlanan makale sayısı konferans, yazar, ilk yazar ve organizasyon olmak üzere dört boyuta göre sıralanmıştır. . Leifeng.com AI Technology Review aşağıdaki gibi derlenmiştir.

Bu yıl, makine öğrenimi ve doğal dil işleme alanında geçen yıl yayınlanan makalelerin istatistiklerini güncelleme zamanı. Bu iki alan hala hızla gelişiyor ve hem yayınlanan makale sayısı hem de katılımcı sayısı geçmiş yılların rekorlarını kırdı. Bu yıl akademik konferanstaki en heyecan verici olay "NeurIPS konferans biletleri 11 dakikada tükendi". Bu yazıda, belirli bir konferansta yazarlar veya kuruluşlar tarafından yayınlanan makale sayısını gösteren bu verilere dayalı ayrıntılı istatistikler sunacağım.

2018'de şu konferanslardan / dergilerden veri topladım: ACL, EMNLP, NAACL, EACL, COLING, TACL, CL, CoNLL, NeurIPS, ICML, ICLR ve AAAI. Bu seçim, makine öğrenimi ve dil teknolojisi alanında yayınlanan en iyi bilinen ve en yüksek dereceli konferansları kapsayacak. Geçen yıla kıyasla, SemEval'i ağırlıklı olarak paylaşılan görevlerle ilgili makalelere odaklandığı için kaldırdım ve bu alandaki makalelerin yayın verilerini diğer konferanslarda saymadım. Aynı zamanda en iyi konferanslardan biri olan ancak geçmiş sıralamalarda gözden kaçan AAAI'yi de ekledim. NeurIPS (eski adıyla NIPS) 2018'de yeniden adlandırıldı. Adın tutarlılığını korumak için burada en son adı kullanacağım.

Bu analiz, yıllar içinde geliştirdiğim bir dizi senaryo aracılığıyla otomatik olarak yapılıyor. Bildiri listesi, yazarın adının genellikle bulunduğu çevrimiçi konferans bildirilerinden alınır. Kuruluşun adının doğrudan PDF'den çıkarılması gerekir, bu da önemli miktarda gürültüye neden olabilir. Çeşitli farklı isimleri kontrol etmek ve gruplamak için çeşitli yöntemler geliştirdim, ancak metinde kalan herhangi bir hata bulursanız lütfen bana bildirin.

Bu makale son yıllarda en çok makale yayınlayan araştırmacılar ve kuruluşlara odaklanmakla birlikte, yayınlanan makale sayısının bir alanın izlemesi veya övmesi gereken bir şey olduğunu düşünmediğimi belirtmek isterim. Aşağıdaki şekilde gösterildiği gibi, bu alan giderek daha popüler hale geliyor ve kağıt sayısındaki hızlı artışa, eşit olmayan kağıt kalitesi eşlik ediyor. Çığır açan bir makale yazmak, kolayca unutulabilecek 10 tam makale yayınlamaktan daha iyidir. Bu makale, araştırmacılar, kuruluşlar ve çeşitli konferanslarda yayınlanan makalelerinin durumu hakkında daha net ve daha yüksek bir bakış açısı edinmeyi amaçlamaktadır.İyi fikirlere sahip yeni araştırmacılara ilham verebilir.

Yayınlanan konferans bildirilerinin sıralaması

Öncelikle 2012-2018 döneminde tüm konferanslarda yayınlanan makale sayısına bir göz atalım. Çoğu makine öğrenimi konferansında yayınlanan makale sayısı artmaya devam etti, bunların arasında AAAI ve NeurIPS 1.000 makaleyi aştı; EMNLP ve NAACL tarafından yayınlanan makale sayısı da önceki yıllara göre önemli ölçüde arttı; ACL ve COLING tarafından yayınlanan makale sayısı önceki yıllara benzer; EACL bu yıl yapılmadı; TACL ve CL tarafından yayınlanan makale sayısı uzun yıllar nispeten sabit kaldı.

(Not: Şekilde yayınlanan makale sayısının sıfır olduğu nokta, konferansın o yıl yapılmadığını gösterir.)

Yazarların makaleleri sıralaması

Ardından, 2018'de bu konferanslarda en çok makale yayınlayan yazarlara bir göz atalım. Bunlar arasında şaşırtıcı sayıda makaleye sahip üç yazar var, 22. Bunlar Ming Zhou (Microsoft), Graham Neubig (Carnegie Mellon Üniversitesi) ve Sergey Levine (UC Berkeley). Ardından Zhang Tong (Tencent AI, kısa süre önce istifa etti), Sun Maosong (Tsinghua Üniversitesi) ve Iryna Gurevych (Darmstadt Teknoloji Üniversitesi). Aralarında Zhang Tong 21 makale ve Sun Maosong yayınladı. Ve Iryna Gurevych'in her biri 20 makale yayınladı.

2012-2018'de yayınlanan toplam makale sayısına bakıldığında, Chris Dyer (DeepMind) 97 makale ile listenin başında yer almaya devam ediyor. Zhou Ming (Microsoft), Yoshua Bengio (Montreal Üniversitesi), Zhang Yue (West Lake Üniversitesi) ve Noah A. Smith (Washington Üniversitesi) tarafından sırasıyla 90, 84, 80 ve 79 makale yayınlandı. Nesne. Yazarların çoğu, belirli bir alandaki konferanslar için açık bir tercihe sahiptir - ya NLP alanındaki konferansları ya da ana makine öğrenimi alanındaki konferansları tercih ederler Belki de sadece Percy Liang bir istisnadır. Her iki alana da tarafsızdır.

Her yazarın farklı yıllarda yayınladığı makale sayısını da görüntüleyebiliriz. Zhang Yue (West Lake Üniversitesi) ve Zhou Ming (Microsoft) de yetişmiş olsa da, diğer yazarlarla karşılaştırıldığında Chris Dyer tarafından 2015 ve 2016'da yayınlanan makale sayısı dikkat çekicidir.

İlk yazarın yayınlanan makalelerinin sıralaması

Ardından, ilk yazarla ilgili istatistiklere bir göz atın. Yukarıda belirtilen yazarların çoğu ekip liderleridir ve genellikle ilk yazar, gerçekte yürüten, deneyler yapan ve makalenin çoğunu yazan kişidir. Bu yazarların en iyisi, Ph.D.'nin üçüncü yılında olan ve 2018'de ilk yazar olarak birçok önemli konferansta 10 mükemmel makale yayınlayan Yi Tay'dır (Nanyang Teknoloji Üniversitesi). Bundan sonra, Microsoft Research'ten Zhu Zeyuan, ilk yazar olarak 6 makale yayınladı. Mikel Artetxe, Jiatao Gu (Hong Kong Üniversitesi), Dinghan Shen (Duke Üniversitesi) ve Nathan Kallus'un (Cornell Üniversitesi) ardından ilk yazar olarak 5 makale yayınladılar.

2012-2018'de yayınlanan toplam makale sayısına bakıldığında Li Jiwei (Shannon Technology) 22 adet tek bölümlük makale yayınladı. Zhu Zeyuan (Microsoft), Young-Bum Kim (Amazon), Ryan Cotterell (Cambridge Üniversitesi) ve Ivan Vuli (Cambridge Üniversitesi) takip edildi ve aralarında Zhu Zeyuan ilk yazar, Young-Bum Kim, Ryan olarak 18 bildiri yayınladı. Cotterell ve Ivan Vuli'in her ikisinin de 17 makalesi var.

Kuruluş tarafından yayınlanan makalelerin sıralaması

Ardından, organizasyonla ilgili istatistiklere bakın. CMU, önceki iki yılda olduğu gibi 2018'de de NLP ve Core ML olmak üzere iki alanda yayınlanan aynı sayıda makale ile listenin başında yer aldı. Google ve Microsoft hala sektör liderleridir ve onu Tsinghua Üniversitesi, Stanford Üniversitesi, Peking Üniversitesi, MIT ve Berkeley Üniversitesi izlemektedir.

Bu sıralamada Çinin listedeki kuruluşları arasında Tsinghua Üniversitesi, Pekin Üniversitesi, Çin Bilimler Akademisi, Çin Bilimler Akademisi, Şangay Jiaotong Üniversitesi ve Hong Kong Çin Üniversitesi yer alıyor. Tsinghua Üniversitesi dördüncü sırada, Pekin Üniversitesi altıncı sırada ve Çin Bilimler Akademisi Üniversitesi Dokuzuncu sırada, Çin Bilimler Akademisi on birinci, Şangay Jiaotong Üniversitesi ve Hong Kong Çin Üniversitesi sırasıyla on altıncı ve yirmi dördüncü sırada yer aldı.

2012'den 2018'e kadar organizasyonların sıralamasına bir kez daha bakalım ve durum benzer. CMU, Microsoft ve Google sırasıyla ikinci ve üçüncü sıraları işgal ederken hala en üst sırada yer alıyor. Princeton Üniversitesi, Fransız Ulusal Bilgi ve Otomasyon Enstitüsü (INRIA) ve Duke Üniversitesi, dikkatlerini ana makine öğrenimi alanına odaklıyor gibi görünüyor ve NLP alanında neredeyse hiç makale yayınlamadılar. Bunların aksine Tsinghua, Çin Bilimler Akademisi ve Edinburgh Üniversitesi dil uygulamalarına odaklanmış ve NeurIPS / ICML konferanslarında çok sayıda makale yayınlamıştır.

Aşağıdaki şekildeki zaman çizelgesinden, CMU'nun yıllar boyunca çok sayıda kağıt çıktısını sürdürdüğünü ve kağıt çıktısı sayısının artmaya devam ettiğini görebiliriz. Google ve Microsoft şiddetli bir şekilde rekabet ediyor, ancak Google'ın üstün olduğu görülüyor. Tsinghua Üniversitesi, Peking Üniversitesi ve diğer Çin üniversiteleri şu anda hızla kağıt ihraç ediyor.

Konu sınıflandırması

Son olarak yazarları ve kuruluşları konularına göre sınıflandırdım. Belirli bir yazar / kuruluşla ilgili tüm makaleleri topladım, küçük harfe dönüştürüp tokenize ettim, LDA ile işledim ve bu kağıtları t-SNE ile görselleştirdim. En üst sıradaki kağıtların karakter varlıklarının görselleştirilmesi çok iyidir ve kağıt içeriklerinin resimdeki diğer kağıtlarla benzerliğini gösterir.

Yukarıdakiler, bu yıl makine öğrenimi ve doğal dil işleme alanında yayınlanan makalelerin istatistikleri ve sıralamalarıdır. Makalede herhangi bir hata bulursanız veya gelecek yılın makalesi için herhangi bir öneriniz varsa, mesaj bırakarak veya e-posta göndererek bana bildirin.

Yoluyla: Lei Feng Net AI Technology Review Compilation Lei Feng Net

Koreli netizenler, teppanyaki gibi görünen Vickers derisini yapıyor, ancak netizenler tarafından çok seviliyor
önceki
70.000'den başlayan bu ultra yüksek konfigürasyonlu SUV'lar, ilk otomobil olmaya en uygun olanlar!
Sonraki
"İkinci Nesil Peri": "Beyaz Yılan" ın modern versiyonu!
Ultra yüksek çözünürlüklü görüntü kalitesi oluşturmak için Tencent ve OPPO "King of Glory"
"Büyükannenin evi", "şef kesme tahtası üzerinde yürür ve paspası mutfak lavabosunda yıkarken" ortaya çıktı, kurucu özür diledi
OPPO Find X bugün tekrar indirimde, netizenler arıyor: Satın alamıyorum
Bugünün köpek mamasının ikinci mermisi, fabrika müdürünün kız arkadaşı INS fotoğrafları, ancak netizenler ayakkabılara odaklanıyor
Mercedes-Benz X-Class pikap bu yılın ikinci yarısında duyuruldu veya piyasaya sürüldü
Samsung S105G Resim Turu: Xiaobian, size gerçek 5G cep telefonunu göstermek için Kimchi ülkesine gidiyor
Li Ye, Ulusal Enerji İdaresi: Otomobil şirketlerini şarj hizmetlerine katılmaya ve gelecekte şarj altyapısı standart sistemini iyileştirmeye teşvik edin Elektrikli Araçlar Derneği 2019
Dongfeng Fengshen A9, 1.6T modeller ekleyebilir, fiyatın düşmesi bekleniyor
Hiçbir yerde kaybetmeyin! New York Comic Con'da birçok cosplay tanrısı var!
"Önceki 3": Görevlinin izlemesi için en uygun film
5G İnternet Ticari Ace Silah: Millimetre dalgalarını yerelde açıklamanın önemi nedir?
To Top