Akademik gençlerin en son araştırma sonuçlarını ve teknolojilerini daha iyi öğrenmelerine yardımcı olmak için, AI Technology Review and Paper Research Institute (paper.yanxishe .com ), çalışma referansınız için yapay zeka ile ilgili en son akademik makaleleri seçmeniz için [Today Paper] sütununu her gün başlattı. Aşağıdakiler bugünün seçili içeriğidir
Nedensel Makine Öğrenimi için Kayıp İşlevi
Alt Görev Bağımlılığının Otonom Çıkarımı ile Meta Pekiştirmeli Öğrenme
Darboğazlı Geniş Sinir Ağları Derin Gauss Süreçleridir
DAWSON: Etki Alanına Uyarlamalı Birkaç Çekim Üretimi Çerçevesi
Çok Ölçekli Özellik Soyutlama ile Kısmen Etiketli Veri Kümeleri Üzerinden Çoklu Organ Segmentasyonu
Tıbbi Görüntü Kaydında Derin Öğrenme: Bir Revie
İlk ani artış koordinatıyla hızlı ve derin nöromorfik öğrenme
Önceden Eğitilmiş Dil Modeli kullanarak Uçtan Uca Adlandırılmış Varlık Tanıma ve İlişki Ayıklama
Yerelleştirilmiş Debiased Makine Öğrenimi: Nicelik İşlem Etkilerinin Etkin Tahmini, Koşullu Risk ve Ötesi Değer
Kağıt adı: Nedensel Makine Öğrenimi için Kayıp Fonksiyonu
Yazar: Yang I-Sheng
Gönderme süresi: 2020/1/2
Makaleye bağlantı: https: //paper.yanxishe .com / inceleme / 8168
Önerilen neden: nedensel makine öğrenimi, tedavinin net etkisini (gerçek iyileşme) tahmin etmekle ilgilidir. Tedavi grubu ve kontrol grubunun verileri göz önüne alındığında, standart bir denetimli öğrenme problemine benzer. Ne yazık ki, verilerde nokta nokta gerçek değerlerin bulunmaması nedeniyle, benzer iyi tanımlanmış kayıp işlevi yoktur. Bu kayıp işlevinin olmaması nedeniyle, modern makine öğrenimindeki birçok ilerleme doğrudan uygulanamaz.
Yazar, bu durumda kayıp fonksiyonunu tanımlamak için, standart regresyon problemindeki ortalama kare hatasına (MSE) eşdeğer olan yeni bir yöntem önermektedir. Kayıp işlevi evrensel olarak uygulanabilir, bu nedenle gerçek artışı tahmin edebilen herhangi bir modelin / stratejinin kalitesini değerlendirmek için genel bir standart sağlar. Yeni tanıma rağmen, en iyi uyumu bulmak için bu kayıp fonksiyonunda doğrudan gradyan inişi gerçekleştirmenin hala mümkün olduğunu kanıtlıyoruz. Bu, meta-öğrenen stratejilerine ihtiyaç duymadan nedensel makine öğrenimi problemlerini çözmek için herhangi bir parametre tabanlı modeli (derin sinir ağları gibi) eğitmek için yeni bir yönteme yol açtı.
Kağıt adı: Alt Görev Bağımlılıklarının Otonom Çıkarımı ile Meta Pekiştirmeli Öğrenme
Yazar: Sohn Sungryull / Woo Hyunjae / Choi Jongwook / Lee Honglak
Gönderme süresi: 2020/1/1
Makaleye bağlantı: https: //paper.yanxishe .com / inceleme / 8167
Öneri nedeni: Yazar, görevin, bir grup alt görevi ve aracı tarafından bilinmeyen korelasyonlarını tanımlayan bir alt görev grafiği ile karakterize edildiği yeni bir anlık görüntü RL problemi önerir ve çözer. Temsilcinin, test aşamasının faydalarını en üst düzeye çıkarmak için uyarlama aşamasının birkaç bölümünde göreve hızlı bir şekilde adapte olması gerekir. Yazar, meta stratejiyi doğrudan öğrenmedi, ancak çevre ile etkileşime girerek görevin potansiyel parametrelerini etkileyen ve potansiyel parametrelere verilen getiriyi en üst düzeye çıkaran alt görev grafik çıkarımına (MSGI) sahip bir meta-öğrenici geliştirdi.
Yazar, öğrenmeyi teşvik etmek için, etkili keşfi teşvik eden üst güven sınırından (UCB) ilham alan doğal bir ödül yöntemi kullanır. Yazarın iki grid dünya alanı ve StarCraft II ortamı üzerindeki deneysel sonuçları, mevcut meta-RL ve hiyerarşik RL yöntemleriyle karşılaştırıldığında, bu yöntemin potansiyel görev parametrelerini doğru bir şekilde çıkarabildiğini ve daha etkili bir şekilde uyarlayabildiğini göstermektedir. .
Kağıt adı: Darboğazlı Geniş Sinir Ağları Derin Gauss Süreçleridir
Yazar: Agrawal Devanshu / Papamarkou Theodore / Hinkle Jacob
Gönderme süresi: 2020/1/3
Kağıt bağlantısı:
https: //paper.yanxishe .com / inceleme / 8169Öneri nedeni: Son zamanlarda, Bayes Sinir Ağlarının (BNN) Gauss Süreçlerine (GP) yakınsadığı kanıtlanmış, çünkü tüm gizli katmanlar sonsuz genişliğe gönderildiği için sinir ağlarının "lütfu" üzerine çok sayıda çalışma yapıldı. Ancak bu sonuçlar, dar kalması için bir veya daha fazla gizli katman gerektiren mimariler için geçerli değildir.
Bu makalede yazar, bazı gizli katmanların ("darboğazlar" olarak adlandırılır) sınırlı bir genişlikte tutulduğu BNN'nin genişlik sınırlamasını ele almaktadır. Sonuç, yazarın "Darboğazlar Sinir Ağı Gauss Süreci" (Darboğazlar NNGP) olarak adlandırdığı bir GP kombinasyonudur. Sezgisel olmasına rağmen, kanıtın inceliği, ağ bileşimi üzerindeki kapsamlı kısıtlamaların aslında kısıtlayıcı GP bileşimi olduğunu göstermektir. Yazar ayrıca teorik olarak tek darboğaz NNGP'yi analiz etti ve darboğazın çok çıktılı ağın çıktıları arasında bir bağımlılığa neden olduğunu ve çıktının sonsuz darboğazdan sonra derinden devam ettiğini ve ağın çekirdeğinin sonsuz darboğazdan sonra ayrımcılığını kaybetmesini engellediğini buldu. , derinlik.
Bildiri Başlığı: DAWSON: A Domain Adaptive Few Shot Generation Framework
Eser sahibi: Liang Wei xi n / Liu Zixuan / Liu Can
Gönderme süresi: 2020/1/2
Kağıt bağlantısı:
https: //paper.yanxishe .com / inceleme / 8 170Önerilen neden: Yüzleşme ağı (GAN) oluşturmak için sıfırdan yeni bir etki alanı eğitmek, çok sayıda eğitim verisi ve birkaç günlük eğitim süresi gerektirir. Yazar, bu amaçla, GAN alanında meta öğrenmeye dayalı uyarlanabilir bir FewShot oluşturma çerçevesi olan DAWSON'u önerdi. Meta-öğrenme GAN'ı uygulamanın temel zorluğu, GAN'ın imkansızlığından dolayı, geliştiricinin gradyanının geliştirme setinde değerlendirilerek elde edilmesidir.
Yazar, bu zorluğu çözmek için, GAN'ın iki aşamalı eğitim prosedürünü meta-öğrenme algoritmasının iki adımlı eğitim prosedürü ile doğal olarak birleştiren başka bir GAN eğitim prosedürü önerdi. DAWSON, çok çeşitli meta-öğrenme algoritmalarını ve mimari değişkenlerle çeşitli GAN'ları destekleyen bir tak-çalıştır çerçevesidir. Yazar, DAWSON'a dayanarak, ilk daha az çekimli müzik üretimi modeli olan MUSIC MATINEE'i de önerdi.
Yazarın deneyleri, MUSIC MATINEE'ın hedef alanda yalnızca düzinelerce şarkıyı kullanarak yeni bir alana hızla adapte olabileceğini gösteriyor. DAWSON'un MNIST veri setindeki dört örnek üzerinden yeni sayılar üretmeyi öğrenebileceğini göstermektedir. Yazar, DAWSON kaynak kodu uygulamasını PyTorch ve Tensorflow'da yayınladı ve iki tür müzik örneği ve şimşek videosu oluşturdu.
Bildiri Başlığı: Çok Ölçekli Özellik Soyutlaması ile Kısmen Etiketli Veri Kümeleri Üzerinden Çok Organlı Segmentasyon
Yazar: Fang Xi / Yan Pingkun
Gönderme süresi: 2020/1/1
Kağıt bağlantısı:
https: //paper.yanxishe .com / inceleme / 8 171Öneri nedeni: Bu makale, yeni bir çok ölçekli derin sinir ağının çoklu organ segmentasyonu için birden çok kısmen etiketli veri kümeleri üzerinde eğitilmesini sağlayan birleşik bir eğitim stratejisi önermektedir. Çok ölçekli bağlam bilgisi, piksel düzeyinde etiket tahmini, yani görüntü bölümleme için etkilidir. Ancak bu önemli bilgiler sadece kısmen mevcut yöntemler tarafından kullanılmaktadır.
Bu makalede yazar, piramit özellik analizini görüntü bölütleme modeline entegre eden, çok ölçekli özellik soyutlaması için yeni bir ağ mimarisi önermektedir. Farklı ölçeklerdeki özelliklerin doğrudan birleştirilmesinden kaynaklanan anlamsal boşluğu kapatmak için, eşit bir evrişim derinliği mekanizması önerilmiştir. Ek olarak, yazar, farklı ölçeklerin çıktılarını iyileştirmek için derinlemesine bir denetim mekanizması oluşturmuştur. Yazar, farklı oranlardaki alt bölüm işlevini tam olarak kullanmak için, çıktıyı otomatik bir şekilde birleştirmek için uyarlanabilir bir ağırlıklandırma katmanı tasarladı. Tüm bu özellikler, etkili özellik çıkarımı için piramit giriş piramidi çıktı ağına entegre edilmiştir. Son olarak, derin bölümleme modellerinin eğitiminde tam açıklamalı verilere olan açlığı azaltmak için, birden çok kısmen etiketlenmiş veri kümesinde bir bölümleme modeli eğitmek için birleşik bir eğitim stratejisi önerilmiştir. Yeni hedef adaptif kayıp ile çoklu organ segmentasyonu gerçekleştirmek. Yazarın yöntemi, BTCV, LiTS, KiTS ve Spleen dahil olmak üzere halka açık dört veri seti üzerinde değerlendirildi ve çok etkileyici bir performans elde etti. Bu çalışmanın kaynak kodu aşağıdaki URL'de herkese açık olarak paylaşılır, böylece diğerleri işi kolayca kopyalayabilir ve tanıtılan mekanizmayı kendi modellerini oluşturmak için kullanabilir.