Xinzhiyuan Derlemesi
Kaynak: paperwithcode.com
Editör: Xiao Qin
Xin Zhiyuan Rehberi Papers with Code web sitesi, ArXiv'deki en son makine öğrenimi makalelerini GitHub'daki kodla ilişkilendirir. Bu proje yaklaşık 50.000 makale ve 10.000 GitHub deposunu dizine ekler. Başlığa ve anahtar kelimelere göre arama yapabilir veya ML topluluğundaki en son trendleri takip etmek için popülerliğe ve GitHub yıldızlarının sayısına göre "sıcak araştırmayı" sıralayabilirsiniz.
Web sitesi adresi: https://paperswithcode.com
Bir makale okurken doğal olarak makalede önerilen algoritmaya ve model uygulama koduna bakmak istiyoruz. Bununla birlikte, makine öğrenimi alanının iyi bir açık kaynak geleneği olmasına rağmen, yeni algoritmalar öneren en son makalelerde, algoritma kodunu gerçekten ifşa eden çok fazla yoktur ve ilgili kağıt için ilgili kod tabanını bulmak kolay değildir.
Geçen yıl AAAI konferansında, Norveçli bir bilgisayar bilimcisi bir anketin sonuçlarını bildirdi: Son birkaç yılda yayınlanan en iyi AI konferans makalelerinde önerilen 400 algoritma arasında, yalnızca % 6 Araştırmacılardan algoritma kodunu açıkladı. Ek olarak, insanların yalnızca üçte biri test algoritmalarının verilerini paylaştı ve yalnızca yarısı "sözde kodu" paylaştı.
KREDİLER: (GRAFİK) E. EL / BİLİM; (DATA) GÜNDERSEN VE KJENSMO, YAPAY ZEKA GELİŞTİRME DERNEĞİ 2018
Şimdi, kağıdın kodunu bulmak için bir "artefakt" var. Reddit kullanıcısı rstoj, ArXiv'deki en son makine öğrenimi belgelerini GitHub'daki (TensorFlow / PyTorch / MXNet / vb.) Kodla eşlemek için bir web sitesi oluşturdu. Başlığa ve anahtar kelimelere göre arama yapabilir veya popülerliğe ve GitHub yıldızlarının sayısına göre sıralayabilirsiniz " Popüler araştırma ". Bu web sitesi, makine öğrenimi topluluğundaki en son trendleri takip etmenize olanak tanır.
Web sitesi adresi: https://paperswithcode.com/
Bu proje, yaklaşık 50.000 makale (son 5 yılda arxiv'de yayınlanan makaleler) ve 10.000 GitHub deposunu indekslemektedir. Web sitesi yeni açıldı ve işlev hala bir şekilde tek. Yazar, gelecekte etiket indeksleme, medya makaleleri ve öğreticiler gibi işlevler ekleyeceğini söyledi. İşte GitHub'daki yıldız sayısına göre sıralanan İlk 10 araştırma, hadi bir göz atalım!
1. Caffe: hızlı, açık kaynaklı bir derin öğrenme çerçevesi
yıldız: 24.596
Kod: https://github.com/BVLC/caffe
Caffe, tasarlarken ifade, hız ve modülerliği dikkate alan derin bir öğrenme çerçevesidir. Bu popüler bilgisayar vizyonu çerçevesi, Berkeley AI Research (BAIR) ve topluluğa katkıda bulunanlar tarafından geliştirilmiştir. Jia Yangqing bu projeyi Dr. UC Berkeley sırasında yarattı. Caffe, akademik araştırma projeleri, başlangıç prototipleri ve büyük ölçekli endüstri uygulamaları için güçlü görsel, ses ve multimedya desteği sağlayabilir.
Caffe, genel evrişimli sinir ağlarını ve ticari mimarilerdeki diğer derin modelleri etkili bir şekilde eğitip dağıtabilen, Python ve MATLAB bağlamayı kullanan BSD lisansı altında yayınlanan bir C ++ kitaplığıdır. Caffe, endüstri ve İnternet ölçeğinde medya ihtiyaçlarını karşılamak için CUDA GPU hesaplama kullanır.Tek bir K40 veya Titan GPU'da medya 40 milyondan fazla görüntüyü işleyebilir.
2. Nöral Stil: Sinir Stili Dönüştürme Algoritması
Sanatsal Tarzın Nöral Algoritması
yıldız: 15.840
Kod: https://github.com/jcjohnson/neural-style
Sanatta, özellikle de resimde insanlar, görüntü stilleri aracılığıyla benzersiz görsel deneyimler yaratma becerilerinde ustalaşmışlardır. Bu makalede araştırmacılar, bir görüntünün içeriğini başka bir görüntünün stiliyle birleştirmek için evrişimli bir sinir ağı kullanan bir algoritma önermektedir. Aşağıdakiler, Van Gogh'un "Yıldızlı Gece" nin sanatsal stilini Stanford Üniversitesi kampüsünün gece sahnesine aktarmanın bir etkisidir:
3. Detectron
yıldız: 14.795
Kod: https://github.com/facebookresearch/detectron
Detectron, Facebook AI Research'ün (FAIR) nesne algılama araştırma platformudur. Bu kod tabanı, Mask R-CNN ve RetinaNet gibi popüler algoritmalar da dahil olmak üzere en son nesne algılama algoritmalarının birçok uygulamasını içerir.
4. Kelime vektörlerini zenginleştirmek için alt kelime bilgilerini kullanın
Kelime Vektörlerini Alt Kelime Bilgileriyle Zenginleştirme
yıldız: 14.565
Kod: https://github.com/facebookresearch/fastText
Büyük bir etiketlenmemiş külliyat üzerinde eğitilmiş sürekli kelime temsilleri, birçok doğal dil işleme görevi için yararlıdır. Bir vektör gösterimi her bir karakter n-gram ile ilişkilendirilir; kelimeler bu vektör temsillerinin toplamı olarak temsil edilir.
5. FastText.zip: Sıkıştırılmış metin sınıflandırma modeli
FastText.zip: Metin sınıflandırma modellerini sıkıştırma
Bu, tüm modelin sınırlı bellekte kullanılabilmesi için metin sınıflandırması için kompakt bir mimari oluşturma sorunudur. Hash yönteminden esinlenilen farklı çözümleri düşündükten sonra, ürün miktarına göre kelime düğünlerini saklamak için bir yöntem önerdik.
6. Etkili metin sınıflandırma becerileri paketi
Etkili Metin Sınıflandırması için Bir Çanta Çantası
Bu makale, basit ve etkili bir metin sınıflandırma karşılaştırmasını araştırmaktadır. Deneyler, hızlı metin sınıflandırıcımız fastText'in doğruluk açısından derin öğrenme sınıflandırıcılarıyla karşılaştırılabilir olduğunu ve eğitim ve değerlendirmede birkaç kat daha hızlı olduğunu gösteriyor.
(Not: Yukarıdaki 3 makalenin tümü fastText'in GitHub deposuna bağlıdır)
7. Çok amaçlı pekiştirmeli öğrenme: robot ortamına ve araştırma gereksinimlerine meydan okuma
Çok Amaçlı Takviyeli Öğrenme: Zorlu Robotik Ortamları ve Araştırma Talebi
yıldız: 12.481
Kod: https://github.com/openai/gym
Bu teknik raporun iki amacı vardır: Birincisi, robot kolu ile itme, kaydırma, toplama ve yerleştirme dahil olmak üzere mevcut robot donanımına dayalı bir dizi zorlu sürekli kontrol görevi (OpenAI Gym ile entegre) sunar. . İkinci bölümde, araştırmacılar, çoğu çok amaçlı RL ve Hindsight Experience Replay ile ilgili olan RL algoritmasını geliştirmek için bir dizi özel araştırma fikri öne sürdüler.
8. OpenAI Spor Salonu
OpenAI Gym, pekiştirmeli öğrenme araştırması için bir araç setidir. Gittikçe daha fazla kıyaslama problem seti, ortak bir arayüzün tanıtımı ve insanların sonuçlarını paylaşabileceği ve algoritmaların performansını karşılaştırabileceği bir web sitesi içerir.
9. XGBoost: Ölçeklenebilir ağaç tabanlı bir Boosting sistemi
XGBoost: Ölçeklenebilir Bir Ağaç Güçlendirme Sistemi
yıldız: 12.449
Kod: https://github.com/dmlc/xgboost
Bu yazıda, veri bilimcileri tarafından birçok makine öğrenimi zorluğundaki en son sonuçları elde etmek için yaygın olarak kullanılan XGBoost adlı ölçeklenebilir, uçtan uca bir ağaç güçlendirme sistemini açıklıyoruz. Seyrek veriler için yeni bir seyreklik duyarlı algoritma öneriyoruz.
10. Derin evrişimli ağlar kullanarak süper görüntü çözünürlüğü
Derin Evrişimli Ağları Kullanan Süper Görüntü Çözünürlüğü
yıldız: 11.432
Kod: https://github.com/nagadomi/waifu2x
Harita, giriş olarak düşük çözünürlüklü görüntüleri alan ve yüksek çözünürlüklü görüntüler çıkaran derin bir evrişimli sinir ağı (CNN) olarak temsil edilir. Ayrıca, seyrek kodlamaya dayanan geleneksel SR yönteminin derin evrişimli bir ağ olarak da kabul edilebileceğini kanıtlıyoruz.
Topluluğa katıl
Xinzhiyuan AI teknolojisi + endüstri topluluğunun işe alımında, AI teknolojisi + endüstrisiyle ilgilenen öğrenciler küçük bir WeChat asistanı hesabı ekleyebilirler: aiera2015_3 Gruba katılın; incelemeyi geçtikten sonra sizi gruba katılmaya davet edeceğiz. Topluluğa katıldıktan sonra, grup açıklamalarını değiştirmelisiniz (isim-şirket-pozisyon; profesyonel grup incelemesi katıdır, lütfen anlayın).