Kaynaklar Kodlu Makaleler: AI alanındaki en iyi veri arama yapısı

Belgeleri ve ilgili kaynak kodunu bulmak için Kod İçeren Yapıt Belgeleri en son sürümü piyasaya sürdü Uygulama alanından belirli göreve ve uygulama koduna kadar istediğiniz SOTA uygulamasını tek adımda bulmak için grafik arabirimi kullanabilirsiniz. Web sitesi geliştiricisine göre, 966 makine öğrenimi görevi, 515 değerlendirme sıralaması (ve mevcut en iyi sonuçlar), 8625 makale (kaynak kodlu) ve 704 veri seti içeriyor.

Web sitesi adresi: https://paperswithcode.com/sota

Kodlu Makalelere Giriş

Kodlu Kağıtlar Reddit kullanıcısı rstoj tarafından geliştirilmiştir ve ücretsiz ve açık kaynak makine öğrenimi kağıt kaynakları, kodlar ve değerlendirme sıralaması sağlamayı amaçlamaktadır. Şu anda, web sitesi kod ile kağıt arasındaki otomatik bağlantıyı tamamladı ve makaledeki değerlendirme verilerinin otomatik olarak çıkarılmasını inceliyor.

Bu web sitesi, ArXiv'deki en son makine öğrenimi belgelerini GitHub'daki kodla (TensorFlow / PyTorch / MXNet, vb.) Eşler. Kullanıcılar başlık ve anahtar kelimelere göre arama yapabilir veya popülerliğe ve GitHub koleksiyonlarının sayısına göre "sıcak araştırmayı" sıralayabilir.

Papers With Code web sitesinde yer alan tüm içeriğin düzenlenebilir ve versiyonlu olduğu anlaşılmaktadır. Kullanıcılar iyi görevler ve en iyi sonuçları bulabilir ve hatta daha önce bilmedikleri bazı araştırma özlerini keşfedebilirler. Geliştirici ayrıca tüm veri setini açık kaynaklı.

Veri indirme

  • Bildiri Özeti: https://paperswithcode.com/media/about/papers-with-abstracts.json.gz
  • Kağıt ve kod arasındaki bağlantı: https://paperswithcode.com/media/about/links-between-papers-and-code.json.gz
  • Değerlendirme afişi: https://paperswithcode.com/media/about/evaluation-tables.json.gz

veri kaynağı

Verilerin çoğu, geliştiricilerin kağıt ek açıklamalarından gelir. Geliştiriciler, makine öğrenimi görevlerinin geniş kapsamını sağlamak için 60.000'den fazla makalenin başlığını analiz etti ("Görev Y için Yöntem X" olarak adlandırılır). Ek olarak, geliştirici, 2018'in son çeyreğinde 1600 arXiv kağıt özetlerindeki görevlere ve veri setlerine manuel olarak açıklama ekledi.

Geliştirici ayrıca aşağıdaki öğelerin verilerini de takip etti:

  • NLP ilerlemesi: https://github.com/sebastianruder/NLP-progress
  • EFF AI ölçümleri: https://github.com/AI-metrics/AI-metrics
  • SQuAD: https://rajpurkar.github.io/SQuAD-explorer/
  • RedditSota: https://github.com/RedditSota/state-of-the-art-result-for-machine-learning-problems

Veri alma ve içe aktarma kodu da açık kaynak kodludur, ayrıntılar için bkz: paperwithcode / sota-extractor.

Kapsam kategorisi

Papers With Code web sitesi, çok çeşitli makine öğrenimi görevlerini kapsar. Şu anda 966 makine öğrenimi görevi, 515 değerlendirme sıralaması (ve mevcut en iyi sonuçlar), 8625 makale (kaynak kodlu) ve 704 veri seti içerir; bunlardan yalnızca bilgisayar vizyonu 552 kadar görev kapsanmaktadır. Bu makine öğrenimi görevleri özellikle şu şekilde sınıflandırılır: bilgisayarla görme, doğal dil işleme, tıbbi tedavi, yöntem (Metodoloji), konuşma, oyunlar, grafikler, zamanlama, ses, robotik, müzik, akıl yürütme, bilgisayar kodu, bilgi tabanı, yüzleşme vb.

Resim kaynağı: https://paperswithcode.com/sota

Ayrıca bu web sitesinde "Trend Olan Araştırmalar", "En Son Araştırmalar" ve "En Çok Okunan Makaleler" görüntülenebilir. Her kategorinin altında listelenen öğeler şunları içerir: makale başlığı, kurum, yayın tarihi, özet, görev sınıflandırması ve diğer bilgiler.

kullanım

Şimdi, bu ML SOTA tarayıcısının nasıl kullanılacağına bir göz atalım.

Yukarıdaki sayfa yerine ana sayfayı girerseniz, yukarıdaki arayüzü görmek için orijinal ana sayfadaki arama kutusunun yanındaki Son teknoloji ürünü gözat'ı tıklamanız yeterlidir.

Örnek olarak bilgisayar vizyonunda Anlamsal Segmentasyon görevini ele alalım. Son teknoloji ürünü gözat ana sayfa görünümünden, anlamsal bölümleme görevinin 9 sıralama ve 299 makale içerdiğini doğrudan görebilirsiniz.

Bu 9 liderlik tablosunu tıkladıktan sonra görebilirsiniz. Ancak 9 rakamı doğru görünmüyor, unutun, önemli değil. 5 veri seti için SOTA kağıtlarını görebiliriz, her satırda veri seti adı, SOTA model adı, kağıt, kaynak kodu vb. Listelenir. Örneğin, ilk satır, PASCAL VOC 2012 veri setindeki mevcut en iyi modelin DeepLabv3 + (Xception-JFT) olduğunu ve kaynak kağıdın "Anlamsal Görüntü Segmentasyonu için Atrous Ayrılabilir Evrişimli Kodlayıcı-Kod Çözücü" olduğunu gösterir. Sıralamayla ilgili daha fazla ayrıntı görmek için "Tümünü gör" seçeneğine tıklayın, ilk satırda "Tümünü gör" seçeneğine tıklarız.

Aşağıdaki şekilde gösterildiği gibi, "Tümünü gör" seçeneğine tıkladıktan sonra sayfa, aşağıdaki şekilde gösterildiği gibi PASCAL VOC 2012 veri setindeki sıralamanın ayrıntılı bilgilerine atlar, şekildeki yeşil noktalar önceki SOTA kağıtlarıdır ve şekildeki kesik çizgi trend grafiğini temsil eder , Gri noktalar daha zayıf performansa sahip diğer kağıtları gösterir. Yukarıdaki şekildeki "Trend" sütunundaki küçük resim, her liderlik tablosunun SOTA trend çizelgesidir. İlgili model ve performans bilgileri fare ile şekildeki noktaya tıklanarak görüntülenebilir.Doğrudan kağıt detayları sayfasına gitmek için tıklayın (Kodlu Kağıtlar sayfası).

Trend grafiğinin altında, değerlendirme göstergelerine göre en büyüğünden en küçüğüne doğru sıralanmış eksiksiz bir veri tablosu vardır. DeepLabv3 + (Xception-JFT), anlamsal bölümleme görevinde ilk sırada yer alır ve Ortalama IoU puanı% 89,0'dur.

Daha sonra, modelin kağıt başlığı, özet, arXiv bağlantısı ve en önemlisi Kodlu Kağıtlar en ilginç olanı Kodlu Kağıtlar sayfasına ulaşmak için DeepLabv3 + (Xception-JFT) satırındaki köprüye tıklıyoruz. Yer doğrudan uygulama kodunun GitHub bağlantısını sağlar, birden fazla vardır. DeepLabv3 + (Xception-JFT) sayfasında 15'e kadar uygulama sağlanmıştır.Bu uygulamalar GitHub koleksiyonlarına göre sıralanır ve hangi çerçeve uygulamalarının temel alındığını gösterir.

Sonunda istediğini buldun mu? Zevk alın......

Kod uygulama listesinin altında, bu modelin diğer görevlerdeki sıralaması ve performansı da gösterilir. Aşağıdaki tablodan da görebileceğiniz gibi,

DeepLabv3 + (Xception-JFT) ayrıca Şehir Manzaraları'ndaki mevcut en iyi Ortalama IoU'nun% 82.1'ini elde etti.

Bu noktada Kodlu Kağıtların işlevleri neredeyse tanıtılmıştır. Bazı sürprizlere bakalım. Tüm veri setlerinin sıralama sayfasının alt kısmında, çok özenli alt görev sınıflandırmaları olduğunu da görebilirsiniz. Yani, anlamsal bölümleme sayfasında, gerçek zamanlı anlamsal bölümleme, sahne bölümleme ve zayıf denetimli bölümleme gibi anlamsal bölümleme ile ilgili diğer alt görevlerin sıralamasını da görebilirsiniz. Görüntüleyebileceğiniz bilgi türü yukarıdaki örnekle aynıdır, bu yüzden burada tekrar etmeyeceğim.

Kaynak: Heart of the Machine

İmzalayacağım tahmin et! Bu klasik futbol atışlarının kimin başyapıtları olduğunu görün!
önceki
Fotoğrafçının gizlediği gizli yer! İnsanların% 90'ı Çin'deki ormanda bu unutulmuş şehri hiç duymamış
Sonraki
Büyük bir modern Çin vakasının kaydı: "8 Eylül 1998" Yongjia Shangtang bombalama vakası tespit edildi
Işıkların Üstünde Hoşçakal, Kışla
İnternet ünlüleriyle ilişki kurmak iyi bir şey değil
Yıldızlararası geçiş, güvenilir mi?
Çin'deki en zor 7 yol, bazıları 50 yıl sürdü, hepsi güzel
Gaziler, unutmayacağız
Neden şarkı söylemesi sana bu kadar rahatsız edici geliyor?
Hangzhou 3h yaz için yerel küçük Güneydoğu Asya'ya geldi! Ülkedeki en büyük ateşböcekleri denizi bir peri masalı kadar güzel
Diyabeti tek nefeste anlayın
Algılama Sonar teknolojisinin ilkesi ve uygulaması
Denizin ve gökyüzünün aynasını özel olarak saklayan bu gizli ada aslında Fujian'da, ancak insanların sadece% 1'i biliyor
Golan Tepeleri'ni engellemek için İsrail ve Trump'a ne oldu?
To Top