NIP'ler gibi en iyi AI konferanslarının etkisini görselleştirin: Makalelerin yaklaşık% 20'si hiç alıntı yapılmadı

1 Yeni Zhiyuan derlemesi

İki anahtar kavram

Alıntı akışı: Yukarıda Renkli fan şekli, belirli bir alandaki (ortadaki gri nokta) konferanslardan ve bu alanda atıfta bulunulan en iyi 25 konferans veya dergideki toplam alıntı sayısını özetler. Soldan sağa: Makine öğrenimi alanında NIPS, programlama dili tasarımı ve uygulaması alanında PLDI ve web araması ve veri madenciliği alanında WSDM.

Tüm Atıf akışı:

Atıfta hayatta kalma: Yukarıdaki şekilde, doğrusal bir eğilime sahip turuncu noktalar, atıfta kalma oranlarını, yani yayınlandıktan sonra en az X yıl veya daha uzun süre içinde en az bir kez alıntı yapılan bir konferans makalesini temsil eder. İsim Jacob Eisenstein tarafından icat edildi. Soldan sağa: Doğal dil işlemede ACL, programlama dili tasarımı ve uygulamasında PLDI, hesaplamalı biyolojide ISMB.

Citation hayatta kalma hakkında daha fazla bilgi edinin:

Aşağıda bu araştırmanın motivasyonu, yöntemi ve uygulaması açıklanmaktadır. Ayrıntılı alıntı tablosu bu sayfada bulunabilir:

Araştırma motivasyonu

  • Bir konferansın akademik etkisi nereden geliyor? Bir konferansta bir makale yayınladıysanız, bir konferansa katıldıysanız veya akademik konferanslar etrafında bir araştırma topluluğuna girmek üzereyseniz, bu topluluğun entelektüel mirasının ne olduğunu merak edebilirsiniz.

  • Akademik çevrelerin kolektif hafızasında kaç makale hatırlanıyor? Ne kadar süre hatırlanacak? Şu konuda hararetli bir tartışma vardı: İki yıl içinde gazetelerin% 80'i unutulacak mı? Spoiler uyarısı: Bu, araştırmamıza dahil olan konferansların çoğu için doğru değil, ancak Makalelerin yaklaşık% 20'si hiç alıntı yapılmıyor .

  • Son birkaç yılda alıntı davranışı örüntüsü değişti mi? Spoiler uyarısı: Evet, özellikle 2005 veya 2006'dan sonra adlandırabiliriz " Akademik arama etkisi ".

Yukarıdakiler, bu araştırmayı yapmak için motivasyonumuzdur.

Veriler ve yöntemler

Veri kaynağımız Microsoft Academic Graph (MAG), özellikle de Şubat 2007'de yayınlanan sürümdür. Makaleleri yere göre gruplandırıyoruz ve alıntı yapılan ve alıntı yapılan tüm kağıtları işaretlemek için MAG kullanıyoruz. Analiz süresi esas olarak 2015'in sonundan 2016'ya kadardır. Veri işleme, grafik oluşturma ve rapor oluşturma kodu bu havuzda paylaşılır: https://github.com/lexingxie/academic-graph

Bul

  • Çoğu konferansta, alıntı yapılan yazıların oranı (yani, yayından sonra en az bir kez alıntı yapılan) yaklaşık% 80'dir. Örneğin, SIGMOD% 81, SIGIR% 78 ve NIPS% 83'tür. İstisnalar var: SIGGRAPH% 47 ve CRYPTO% 89'dur.

  • Makale 20 yıl veya daha uzun süre yayınlandıktan sonra, tüm makalelerdeki alıntılanan makalelerin oranı% 10 (NAACL),% 20 (OOPSLA),% 40 (ACL) ve% 60 (CRYPTO) arasında değişmektedir. Bu istatistik, konferansın tarihiyle oldukça ilişkilidir - çoğu konferans sadece 20 yaşın üzerindedir ve 20 yıl önce (yani, 1995'ten önce) yayınlanan makale sayısı oldukça azdır. Aşırı bir örnek ISIT'dir. 1973'te iki makale vardı ve 1991'e kadar bir daha yayınlanmadı.

  • Kolektif akademik hafızanın uzun kuyruğu: Çoğu konferans için, en iyi 25 konferansın% 60 ~% 70 + bu konferansta veya diğer konferans bildirilerinde belirtilmiştir, ancak toplam referans veya alıntı sayısı yaklaşık 1000 ~ 2000'dir.

  • Akademik arama etkisi (akademik arama etkisi): 2005 veya 2006'dan sonra eski makalelerin alıntıları daha da arttı. Bunun nedeni, akademik arama motorlarının daha popüler hale gelmesi ve eski makaleleri bulmayı kolaylaştırması olabilir.

Örnek: NIPS (1987-2015) konferans atıf modeli verileri ve diyagramları

veri:

  • 29 yıllık tarih (1987-2015), toplam 6483 makale.

  • Kaynaklarda toplam 38246 kez yer almış ve her bildiri ortalama 5,9 kez kaynaklara dahil edilmiştir.

-1498 farklı referans kaynağı, ilk 25% 64'ü oluşturdu

  • Toplam 131.082 alıntı, makale başına ortalama 20.22 alıntı

-3275 farklı alıntı kaynağı, ilk 25'in% 57'si

-Atıfta kalma oranı: Cari yılda 0,83; 10 yılda 0,60; 20 yılda 0,32

Solda, NIPS konferans belgelerindeki alıntı yapılan ve alıntılanan makalelerin bir ekran görüntüsü var. (Ayrıntılar için Şekil 4'e bakın.) Sağdaki hayatta kalma oranı, yayından x yıl sonra hala aktif / alıntı yapılan makalelerin oranını temsil etmektedir. (Ayrıntılar için Şekil 10'a bakın)

Bu sayfadaki diğer simgeler kabaca birkaç kategoriye ayrılabilir:

  • Şekil 1-Şekil 3: Makalenin temel verileri, kaynak olarak listelendiği sayı ve atıf sayısı.

  • Şekil 4 ila 5, bu yıllardaki tüm alıntıları özetler, alıntılar (gelen alıntılar, konferans belgesinde belirtilen belgeler) ve giden alıntılar (giden alıntılar, diğer kaynaklardan bildiriler tarafından alıntılanan konferanstan bildiriler) olarak sınıflandırılır.

  • Şekil 5 ve 6, alıntıları ve alıntıları yıllara göre ayırmaktadır.

  • Şekil 7 ve 8, o yıl NIPS konferansında atıfta bulunulan referansları açıklamaktadır. Çoğu konferans için, bir "Google Akademik" etkisi vardır, bu da eski makalelerin daha sık alıntılandığı anlamına gelir.

  • Şekil 9-11, "en az x yıl geçmesine rağmen hala kaç bildiriye atıf yapıldığını" ve hangi makalelere hiç atıf yapılmadığını araştırıyor.

Şekil 1: Genel kağıt verileri. Solda her yıl yayınlanan makale sayısı; sağda ise her yıl yayınlanan ortalama makale sayısı referans ve alıntı olarak listelenmiştir.

Şekil 2: Genel referans verileri. Solda her yıl yayınlanan ve referans olarak listelenen toplam makale sayısı; sağda ise referans olarak listelenen NIPS tarafından yayınlanan makale sayısıdır.

Şekil 3: Genel alıntı verileri. Solda her yıl yayınlanan ve atıf olarak listelenen toplam makale sayısı; sağda ise atıf olarak listelenen NIPS tarafından yayınlanan makale sayısıdır.

Şekil 4: top-k'nin gelen / giden referansları. Düğüm rengi: alıntı oranı (giden fikirler, kırmızı) - referans (gelen fikirler, mavi). Düğüm boyutu: Herhangi bir yöndeki toplam alıntı ve referans sayısı. Mavi kenarın kalınlığı, belirli bir toplantıdan ayrılan referans sayısı ile belirlenir; kırmızı kenarın kalınlığı, verilen toplantıya akan referansların sayısı ile belirlenir. Düğümler, gelen / giden referans yoluyla soldan sağa sıralanır.

Şekil 5: Top-k'nin gelen / giden referansları. (Çubuk grafik, yukarıdaki hayran grafiğindeki bilgileri farklı şekillerde sunar)

Şekil 6: Referansın ısı haritası. Yayın yılına (yatay eksen) ve referans yerine (dikey eksen) göre alt bölümlere ayırın.

Şekil 7: Başvurulan ısı haritası. Yayın yılına (yatay eksen) ve alıntı yerine (dikey eksen) göre alt bölümlere ayırın.

Şekil 8: Referans yaşın kutu grafiği (y eksenindeki alttaki, yaşın büyük olduğunu gösterir), yayın yılına (x ekseni) göre ayrılmış.

Şekil 9: Makalenin yayınlandığı yıla (yatay eksen) ve referansın yayınlandığı yıla (dikey eksen) göre ayrılmış referansların ısı haritası.

Şekil 10: Doğrusal regresyon ile kapsanan, yayından en az x yıl sonra alıntı yapılan makalelerin oranı.

Şekil 11: Yıl başına atıfta bulunulan makale sayısının ısı haritası, yayın yılına (yatay eksen) ve atıf yılına (dikey eksen) bölünmüştür.

Şekil 12: Belirli bir yılda yayınlanan ve daha sonra alıntı yapılan makalelerin ısı haritası. Yayın yılına (yatay eksen) ve alıntı yılına (dikey eksen) göre bölünmüştür.

özet

Birkaç çizelge, uzun bir tartışmadan daha iyi olabilir. Umarım bu araştırma okuyuculara bu akademik konferanslar hakkında yararlı bilgiler sağlayabilir, yeni bir konferansı anlamanıza veya bir konferansın genellemesini ve etkisini anlamanıza yardımcı olabilir.

Bu, kağıt için başka bir etki ölçütü olacak mı? Olabilir. Etki faktörü, haritalama, Google bilgin sıralaması vb. Gibi yaygın olarak kullanılan birçok ölçüm vardır. Hiçbir ölçü mükemmel değildir, ancak başka bir bakış açısına bakmak kesinlikle faydalıdır.

Orijinal:

İş ayrıntılarını görüntülemek için orijinal metni okumak için tıklayın ve katılmanızı dört gözle bekleyin ~

Nordic Canada değil! En sevdiğiniz insanlarla gelmek için uygun olan Çin'deki bu yerde gizemli aurorayı görebilirsiniz.
önceki
Polis kardeş kendini sıkıştırdı! Affet beni ama küstahça gülümsedi ...
Sonraki
Buffett tahliyede başı çekti, Çinli alıcılar peşin sattı ve Fed tarafından basılan saadet zinciri ifşa olabilir.
"AI VS İnsana" Doktorların büyük bir PK'si var: Yapay Zeka dört galibiyet, üç beraberlik ve bir mağlubiyetle başı çekiyor
Harvardın en popüler kişilik psikolojisi dersi: Kendinize sınır koymazsanız, hayatın daha fazla olasılığı olacaktır
Lüks bir araba sürmekle lüks bir araba sürmek arasındaki fark nedir? Eski sürücü: Kimlikte büyük bir fark var
Ningbo'da seyahat ederken mutlaka yenmesi gereken lezzetlerin en iyi listesi Çeşitli egzotik atıştırmalıklar ve yerel spesiyaliteler!
Kanadalı iflasların sayısı hızla arttı. 55 milyar dolar silindikten sonra, Kanadalı çiftçilerin gelirinin% 40'ı kaybedilebilir
Ali halkı neden fazla mesai yapmak istiyor?
169.800'den! Yakıt tasarruflu, çok güçlü ortak girişim SUV modelleri, bu 4 model görülmeye değer!
"Derinlik" Çin'in en iyi AI Laboratuvarı ziyareti: Toutiao, Xunfei, Ali, Tencent ve Yaoban ne yapıyor
Kötü çevrimiçi kumarhanelerde yer alan eğlenceli "Prodigal Terminal". Kumarla uğraşan yaklaşık 400 kişi var ...
Kendinizin daha iyi bir versiyonu olmak gerçekten bu kadar zor mu?
İran resmen yuanın ABD dolarının yerini alacağını açıkladı ve İran ham petrolü için yeni alıcılar var ve işler hareket ediyor
To Top