AI haftanın en sıcak makalesi | CNN 101'in öğrenme sürümü, minimalist sinir ağı yavaş

Yeniden basıldı: Büyük Veri Özeti

Yazar: Christopher Dossman

Derleme: Junefish, Joey, Yunzhou

Bu makale 2682 Word, önerilen okuma 5 dakika.

Bu makale haftanın en iyi akademik araştırmasını anlatıyor.

Haftanın en iyi akademik araştırması

CNN 101: Evrişimli sinir ağlarının etkileşimli görsel öğrenimi

Araştırmacılar, derin öğrenme modellerindeki karmaşık zorluklarla başa çıkmak için, öğrencilerin evrişimli sinir ağlarını daha iyi anlamalarına ve öğrenmelerine yardımcı olabilecek etkileşimli bir görselleştirme sistemi olan CNN 101'i geliştirdiler.Temel derin öğrenme modeli mimarisi .

Modern web teknolojisi kullanılarak oluşturulan CNN 101, özel bir donanım olmadan kullanıcının web tarayıcısında yerel olarak çalışabilir. Sıkı bir şekilde entegre edilmiş etkileşimli bir görünüm aracılığıyla CNN 101, tek nöron seviyesinde ve katman seviyesinde evrişim, aktivasyon ve havuzlama işlemlerini açıklayarak modelin nasıl çalıştığına dair genel bir bakış ve ayrıntılı açıklama sağlar.

CNN 101, halkın derin öğrenme teknolojisi için eğitim kanallarını daha da genişletiyor. Kullanıcılara derin öğrenme mekanizmalarını öğrenmek ve sinir ağı sezgisi oluşturmak için daha basit bir yol sağlamak için etkileşimli görselleştirme teknolojisini uygular. Ayrıca, karmaşık makine öğrenimi algoritmalarını etkileşimli görselleştirme yoluyla açıklamaya yönelik mevcut araştırma çalışmaları için CNN 101, bunlarla birleştirilebilir.

Yazar ayrıca, kullanıcı tanımlı ve kişiselleştirilmiş öğrenmeyi daha da desteklemek için CNN 101'in işlevlerini genişletmeyi planlıyor. Ayrıca, dünyanın her yerinden öğrencilerin kolayca erişebilmesi için TensorFlow Playground ve GAN Lab'a benzer platformlarda CNN 101'i dağıtmaya ve açık kaynak kodlu hale getirmeye kararlıdırlar.

CNN 101 demo videosu:

https://www.youtube.com/watch?v=g082-zitM7sfeature=youtu.be

orijinal:

https://arxiv.org/abs/2001.02004v1

Aktif insan pozu tahmini için derin pekiştirmeli öğrenme

Pose-Deep Reinforcement Learning (Pose-DRL), yoğun kameralarda çalışan, tamamen eğitilebilir Derin Güçlendirmeli Öğrenmeye (DRL) dayalı aktif bir poz tahmin mimarisidir. Mimari, temel bir monoküler poz sağlamak için uygun bir bakış açısı seçebilir Öngörücü.

Araştırmacılar, modeli değerlendirmek için tek hedef tahmincisi ve çok hedefli tahminciyi kullanır ve her iki durumda da iyi sonuçlar elde edilir. Sistem ayrıca otomatik zaman durdurma durumunu ve videodaki sonraki zaman işleme adımına geçişi de öğrendi.

Araştırmacılar şunları söyledi: "Birden fazla kişiyi içeren karmaşık sahneler için Panoptik çoklu görünüm kurulumunu kullanan kapsamlı deneylerde, modelin poz tahmini için güçlü çoklu görünüm temellerinden önemli ölçüde daha doğru olan bakış açılarını seçmeyi öğrendiğini gösterdik."

Sistem, bir dizi görünüm seçmeyi öğrenir ve güçlü bir çoklu görünüm taban çizgisine kıyasla daha doğru bir poz tahmini üretir. Sonuç sadece akıllı bakış açısı seçiminin avantajlarını göstermekle kalmaz, aynı zamanda "azın daha çok olduğunu" da kanıtlar, yanlış olabilecek çok fazla bakış açısını birleştirmenin kötü sonuçlara yol açacağını.

daha fazla oku:

https://arxiv.org/abs/2001.02024v1

Çok Dilli Nöral Makine Çevirisi Üzerine Kapsamlı Araştırma

Bu makalede, Japonya'daki Osaka Üniversitesi, Japonya Ulusal Bilgi ve İletişim Teknolojileri Enstitüsü ve Hindistan'daki Microsoft Yapay Zeka Enstitüsü'nden araştırmacılar, araştırmacı yapmak için mevcut çok dilli sinir makinesi çevirisi (MNMT) literatürünün derinlemesine bir incelemesini yaptı. Ve uygulayıcılar MNMT'nin beklentileri hakkında daha derin bir anlayışa sahipler.

Merkezin kullanım durumlarına göre MNMT'deki çeşitli teknolojileri basitçe sınıflandırdılar ve bunları kaynak senaryolarına, temel modelleme ilkelerine, temel sorunlara ve zorluklara göre sınıflandırdılar. Ayrıca, birbirlerini olabildiğince karşılaştırarak çeşitli teknolojilerin avantaj ve dezavantajlarını çözmeye çalışırlar ve MNMT'nin gelecekteki gelişme yönünü tartışırlar.

MNMT, son birkaç yılda yükselişe geçti. Pek çok heyecan verici gelişme getirmesine rağmen, daha fazla keşif için hala birçok ilginç yön var.

İlk olarak, bu çalışma, çok yollu, düşük kaynak veya sıfır kaynak (aktarım öğrenme, veri perspektifi ve sıfır atış yöntemleri) ve çok kaynaklı çeviri dahil olmak üzere çok dilli NMT'nin ana senaryoları ile ilgili literatürü kapsar. Bu makale, ana tasarım yöntemlerini ve varyantlarını, ana MNMT problemlerini ve önerilen çözümlerini sistematik olarak derlemektedir.

NMT'ye yeni başlayanlar ve uzmanlar için bu, MNMT araştırmasını teşvik etmek ve hızlandırmak için önemli bir adımdır. MNMT ile ilgilenen herkes bunu bir başlangıç noktası ve yeni fikirlerin kaynağı olarak kullanabilir.

orijinal:

https://arxiv.org/abs/2001.01115v2

Araç takibi ve araç yeniden tanımlama için güçlü ve ölçeklenebilir hızlı sınıflandırıcı kullanılacaktır.

Yakın zamanda yapılan bir çalışma, farklı tıkanmalar, bulanıklıklar ve yönlerle ortamı yakalayan çok ölçekli, çok çözünürlüklü kameralar dahil olmak üzere farklı koşullar altındaki kamera ağlarında video analizi için işbirliğine dayalı bir sınıflandırıcı çerçevesi önermiştir. Bu çerçeveyi öneren araştırmacılar, Amerika Birleşik Devletlerindeki Georgia Teknoloji Enstitüsünden ve Brezilyadaki Sao Paulo Üniversitesinden geldiler ve araçları kontrol etmek için sıfır top öğrenme (ZSL) sistemi uyguladıkları araç izleme ve araç yeniden tanımlama için bir uygulama yöntemi tanımladılar. Otomatik izleme gerçekleştirin.

VeRi-776 ve Cars196'nın değerlendirmesi, grup sınıflandırıcı çerçevesinin güçlü rakip yeteneklere sahip olduğunu ve sürekli değişen video özelliklerine (yeni araç türleri / markalar ve yeni kameralar gibi) genişletilebileceğini göstermektedir. Dahası, mevcut çevrimdışı video analiz yöntemlerinden daha fazla gerçek zamanlı performansa sahiptirler.

Bu araştırma, uçtan uca araç öznitelik çıkarma ve araç tanıma işlemlerini de gerçekleştirebilen araç takibi için yeni bir teknoloji önermektedir. Mevcut en son teknoloji ile karşılaştırıldığında, basit ve güçlü temel modeli belirli bir rekabet avantajına sahiptir ve parametreleri birkaç kat daha azdır. Araştırmacılar, temel modelde 64.4 mAP elde etmek için yaklaşık 12 milyon parametre kullanırken, MTML-OSG'de 100'den fazla parametre kullanırken, ortalama ortalama doğruluğu 62.6'dır (mAP, sıralama ve geri almayı değerlendirmek için kullanılan bir indeks)

Araştırmacılar, parametre sayısını azaltarak ve bunu mevcut yöntemin performansı ile karşılaştırarak, bu çerçevenin bu alanda sektörün en üst seviyesine ulaşabileceği sonucuna varabilirler ki bu da bu yöntemin avantajlarından biridir.

orijinal:

https://arxiv.org/abs/1912.04423v2

Retinal OCT görüntü hastalığı tespitinde Sparse-GAN uygulaması

CNN ve diğer teknolojiler, retinal OCT görüntülerinde lezyonları tespit etmek için bilgisayarla görme teknolojisini ve derin öğrenme yöntemlerini kullanmamıza izin verir. Bununla birlikte, böyle bir yöntem, eğitim için büyük miktarda veri gerektirir ve bu nedenle derin öğrenmenin uygulanması, tıbbi görüntü analizi ile sınırlıdır. Sebebine bakarsak, bir veya birkaç hastalığa sahip bir veri setinden eğitilen derin öğrenme sisteminin diğer eğitim setlerinde ortaya çıkmamış hastalıkları tespit edemediğini görürüz.

Görüntüden Görüntüye GAN'dan esinlenen bu sorunu çözmek için (Not: GAN, "antagonistik sinir ağı" anlamına gelir), araştırmacılar şimdi bu çalışmada tıbbi görüntü işleme için Görüntüden Görüntüye GAN'ın kullanılmasını önermektedir. Anormallik algılama ve yeniden yapılandırılmış görüntünün gizli boşlukla eşleştirilmesi ve görüntü parazitinin etkisini azaltmak için bir kodlayıcı takılması önerilir.

Aynı zamanda, araştırmacılar, görüntü anomalisi tespiti için seyrek kısıt oluşturma yüzleşme ağını (Seyrek-GAN) sunmak için yalnızca normal eğitim verilerini kullanmak üzere potansiyel özelliklerin seyrekliğini normalleştirmeyi de önermektedir.

OCT görüntülemede, sağlıklı deneklerden alınan 3B taramalar, yüzlerce "B-taraması" görüntüsünü hasarsız sağlayabilir. Lezyonu sağlıklı bir denekten alınan anormal bir görüntü olarak ele alırsak, anormallik tespit sistemini eğitmek için lezyon olmadan OCT "B-taramasını" kullanabiliriz.

Sparse-GAN, görüntü seviyesindeki anormallikler yerine uzaydaki potansiyel anormallikleri tahmin edebilir ve ayrıca yeni Sparsity Regularization Net tarafından sınırlandırılmıştır. Halka açık veri kümeleri üzerinde yapılan değerlendirme, performansının sektördeki en son yöntemlerden daha iyi olduğunu göstermektedir.

Diğer bir deyişle, Sparse-GAN, eğitim setinde sadece sağlık verilerinin yeterli olduğu hastalık taraması için kullanılabilir. Bu şekilde veri toplama ve açıklama zorluğu azaltılabilir. Yöntem ayrıca, klinik tanı için lezyonları göstermek için anormal aktivasyon haritalarını da tahmin edebilir.

orijinal:

https://arxiv.org/abs/1911.12527v2

Diğer popüler makaleler

Odanın 3B düzenini tek bir perspektiften yeniden oluşturmanın ilk yöntemi:

https://arxiv.org/abs/2001.02149v1

PaRoT: TensorFlow'a dayalı yeni bir sistem:

https://arxiv.org/abs/2001.02152v1

Yeni, gerçekçi ve dikkat odaklı bir kitle kaynak çözümü:

https://arxiv.org/abs/1912.11238v2

Derin öğrenmeyi daha iyi anlamamıza yardımcı olabilecek ilk teorik sistem:

https://arxiv.org/abs/2001.00939v2

Bilgisayar güvenliği alanında farklı yorumlama yöntemlerini karşılaştırmak ve değerlendirmek için bir standart:

https://arxiv.org/abs/1906.02108v3

veri seti

Veri seti nasıl geldi:

https://arxiv.org/abs/1803.09010v5

Çok sayıda makine öğrenimi veri kümesini aramak ve bunlara göz atmak için VizWiz veri kümesi tarayıcısını kullanın:

https://arxiv.org/abs/1912.09336v1

AI etkinlikleri

AI, Çin'deki yoksulluğun üstesinden gelmemize nasıl yardımcı oldu:

https://time.com/5759428/ai-poverty-china/

Yeni algoritma, en iyi okumayı bulmanıza yardımcı olur:

Tüketicilerle iletişimi geliştirmek için yapay zekayı kullanın:

https://www.forbes.com/sites/forbesagencycouncil/2020/01/08/leveraging-ai-to-enhance-connection-with-consumers-12-techniques-for-marketers/#5fbdbd70cb69

Amerikan şirketleri için Amerika Birleşik Devletleri'nde bir laboratuvar kurmak giderek zorlaşacak:

https://www.wired.com/story/export-controls-threaten-ai-outposts-china/?utm_brand=wiredutm_social-type=earned

MIT, ortaokul öğrencilerine AI etiği ve temel bilgileri öğretmek için yeni AI kursları geliştirir:

-Bitiş-

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.

Stanford'un en son araştırması: analistler ve diğer yüksek ücretli ve yüksek eğitimli pozisyonlar en çok AI'dan etkileniyor
önceki
AutoVis büyük veri görselleştirme tasarım çerçevesi: büyük veri görselleştirmeyi kolaylaştırın
Sonraki
Jeff Dean'in elle yazılmış Google AI 2019 envanteri: önemli açık kaynak algoritmalarını bir araya getiren günde 2 makale
Zhou Zhihua'nın 3 umudu var, Wu Enda ve 9 AI lideri 2020'yi tahmin ediyor
Veri bilimcileri için R neden gerekli bir kurs?
Huawei'in yeni derin öğrenme modeli DeepShift: Çarpma yerine kayma ve olumsuzlama
Python veri görselleştirme: Dağılım grafikleri çizmek ve kullanmak için 5 parça kod, toplamaya değer
Ulusal Bilim ve Teknoloji Ödülleri açıklandı! Tsinghua Üniversitesi, tamamlanan ilk birim olarak ödül sayısında ülkede birinci sırada yer alıyor
0108 Morning Post Jiangsunun yoksulluğu azaltma oranı% 99.99'un üzerinde, sadece 17 kişi kaldı
Sabit bir elektrik ısı kaynağı akışı var ve 20 enerji projesi ay sonundan önce çalışmaya devam edecek
Seyirciler! CSI'da ilk doktora "bulut" savunması için uygun mu? mümkün!
ABD Hastalık Kontrol ve Önleme Merkezlerinin resmi web sitesinde, her eyaletteki tanıların sayısı evet ve hayır oldu
Dünyanın en iyi on bilimsel araştırma kurumunun 2019 Nature Index listesi açıklandı: Çin Bilimler Akademisi, Harvard'ı birinci olmak için geride bıraktı
Büyük veri! 2020 Bahar Şenliği Yolcu Akışı Tahmini ve Analizi burada
To Top