Today Paper | Yüksek boyutlu duyusal uzay robotu; aktif insan pozu tahmini; derin video süper çözünürlüğü; yaya yeniden tanıma vb.

Akademik gençlerin en yeni araştırma sonuçlarını ve teknolojilerini daha iyi öğrenmelerine yardımcı olmak için, AI Technology Review ve Paper Research Institute (paper.yanxishe.com) [Paper.yanxishe.com) [Paper Today] sütununu başlattı ve her gün sizin için yapay zekanın sınırlarını seçeceğiz. Akademik belgeler, çalışma referansınız içindir. Aşağıdakiler bugünün seçili içeriğidir

içindekiler

  • Nedensel Mozaik: Doğrusal Olmayan ICA ve Topluluk Yöntemi ile Neden-Sonuç Çıkarımı

  • Yüksek Boyutlu Duyusal Uzayların Robot Keşfi için İçsel Motivasyon ve Epizodik Anılar

  • Aktif İnsan Duruşu Tahmini için Derin Güçlendirmeli Öğrenme

  • Kervolutional Sinir Ağları

  • İK Optik Akış Tahminini kullanarak Derin Video Süper Çözünürlüğü

  • Derin Kişilerin Yeniden Tanımlanması için Güçlü Bir Temel ve Toplu Normalleştirme Boynu

  • FACLSTM: Sahne Metin Tanıma için Odaklanmış Dikkatli ConvLSTM

  • Uçtan Uca Eğitilebilir Video Süper Çözünürlük Tabanlı >

  • TableNet: Uçtan uca Tablo algılama ve Taranan Belge Görüntülerinden Tablo veri çıkarma için Derin Öğrenme modeli

  • Karşılıklı Ortalama Öğretim: Denetimsiz Alan Uyarlaması için Sözde Etiket Rafineri

Nedensel Mozaik: Doğrusal olmayan ICA ve entegre yöntemlerle nedensel çıkarım

Kağıt adı: Nedensel Mozaik: Doğrusal Olmayan ICA ve Topluluk Yöntemi ile Neden-Sonuç Çıkarımı

Yazar: Wu Pengzhou / Fukumizu Kenji

Gönderme süresi: 2020/1/7

Kağıt bağlantısı: https://paper.yanxishe.com/review/8418?from=leiphonecolumn_paperreview0109

Önerilen neden: Yazar, iki değişkenli bir ortamda nedenselliği ayırt etme sorununu çözdü. Yazar, doğrusal olmayan bağımsız bileşen analizinin (ICA) en son geliştirmesine dayanarak, eklemeli olmayan gürültüye izin veren parametrik olmayan genel doğrusal olmayan bir nedensel model eğitmiştir. Ek olarak, yazar, doğrusal olmayan hibrit modeller aracılığıyla nedensel çiftleri simüle eden genel bir çerçeve, nedensel mozaik oluşturmuştur.

Yazar, bu yöntemi manuel ve gerçek dünya kıyaslama veri kümelerindeki diğer yeni yöntemlerle karşılaştırır ve yöntemi en son performansı gösterir.

Yüksek boyutlu duyusal uzay robot keşiflerinin içsel motivasyonu ve olaysal hafızası

Bildiri Başlığı: Intrinsic Motivation and Episodik Memories for Robot Exploration of High-Dimensional Sensory Spaces

Yazar: Schillaci Guido / Villalpando Antonio Pico / Hafner Verena Vanessa / Hanappe Peter / Colliaux David / Wintz Timothée

Gönderme süresi: 2020/1/7

Kağıt bağlantısı: https://paper.yanxishe.com/review/8419?from=leiphonecolumn_paperreview0109

Öneri nedeni: Bu makaledeki çalışma, mikro tarım robotlarının görüntü sensörleri için merak odaklı, hedefe yönelik keşif davranışları oluşturabilen bir mimari önermektedir. Derin sinir ağlarının bir kombinasyonu, düşük boyutlu özellikleri öğrenmek için görüntülerden denetimsiz çevrimdışı öğrenme için ve sistemin ters ve ileri hareketlerini temsil etmek için sığ sinir ağları için çevrimiçi öğrenme için kullanılmıştır. öğrenin. Yapay merak sistemi, bir dizi önceden tanımlanmış hedefe ilgi değerleri atar ve öğrenmenin ilerlemesini en üst düzeye çıkarması beklenenlere keşfi yönlendirir.

Yazar, genellikle yapay sinir ağlarının çevrimiçi güncellemelerini gerçekleştirirken karşılaşılan yıkıcı unutma problemleriyle başa çıkmak için epizodik belleğin içsel motivasyon sistemine entegre edilmesini önermektedir. Sonuçlarımız, bağlam depolama sisteminin kullanımının yalnızca hesaplama modelinin önceden edinilen bilgileri hızlıca unutmasını engellemekle kalmayıp, aynı zamanda modelin esnekliği ve kararlılığı arasındaki dengeyi ayarlamak için yeni bir yol sağladığını göstermektedir.

Aktif insan pozu tahmini için derin pekiştirmeli öğrenme

Kağıt adı: Aktif İnsan Duruşu Tahmini için Derin Güçlendirmeli Öğrenme

Yazar: Gärtner Erik / Pirinen Aleksis / Sminchisescu Cristian

Gönderme süresi: 2020/1/7

Kağıt bağlantısı: https://paper.yanxishe.com/review/8416?from=leiphonecolumn_paperreview0109

Önerinin nedeni: Mevcut 3B insan pozu tahmin yöntemlerinin tümü, bir videodan veya birden çok perspektiften toplanan sahne görüntülerinin mevcut olduğunu varsayar, bu nedenle mekansal veya zamansal bilgileri birleştirerek önceki bilgileri ve ölçüm bilgilerini kullanmaya odaklanırlar. Bu makale, aktif gözlemcinin serbestçe hareket edebileceği ve sahneyi keşfedebileceği 3B insan pozu tahmin problemini inceler ve pekiştirmeli öğrenmeye dayalı Pose-DRL adlı bir insan pozu tahmin modeli önerir. Pose-DRL, poz tahmini için uzay ve zaman boyutlarında en iyi perspektifi seçebilir. Panoptic çoklu görünüm veri setindeki deneyler, kıyaslama modeliyle karşılaştırıldığında, Pose-DRL'nin daha doğru bir poz tahmini üretebilen bir görünümü nasıl seçeceğini öğrendiğini göstermektedir.

Çekirdek evrişimli sinir ağı

Kağıt adı: Kervolutional Neural Networks

Yazar: Wang Chen / Yang Jianfei / Xie Lihua / Yuan Junsong

Gönderme süresi: 2019/4/8

Kağıt bağlantısı: https://paper.yanxishe.com/review/8415?from=leiphonecolumn_paperreview0109

Öneri nedeni: Evrişimli sinir ağları ile ilgili mevcut araştırmaların çoğu, aktivasyon katmanına dayanır ve mevcut aktivasyon katmanı, yalnızca noktadan noktaya doğrusal olmama sağlayabilir. Bu sorunu çözmek için, bu makale, insan algılama sisteminin karmaşık davranışına yaklaşmak için çekirdek tekniklerini kullanan yeni bir çekirdek evrişimi (Kervolution) işlemi önermektedir. Çekirdek evrişim işlemi model kapasitesini geliştirir ve diğer parametreleri tanıtmadan blok-blok çekirdek işlevi aracılığıyla öğelerin yüksek sıralı etkileşimini yakalar. Çok sayıda deney, temel CNN ile karşılaştırıldığında, çekirdek evrişimine dayalı sinir ağının daha yüksek doğruluğa ve daha hızlı yakınsama hızına sahip olduğunu göstermektedir.

Optik akış rekonstrüksiyonunu kullanarak derinlik video süper çözünürlük tahmini

Kağıt adı: İK Optik Akış Tahminini kullanan Derin Video Süper Çözünürlük

Yazar: Wang Longguang / Guo Yulan / Liu Li / Lin Zaiping / Deng Xinpu / An Wei

Gönderme süresi: 2020/1/6

Kağıt bağlantısı: https://paper.yanxishe.com/review/8414?from=leiphonecolumn_paperreview0109

Önerilen neden: Mevcut derin öğrenmeye dayalı yöntemler genellikle zaman bağımlılığı sağlamak için düşük çözünürlüklü çerçeveler arasındaki optik akışı tahmin eder, ancak düşük çözünürlüklü optik akış ile yüksek çözünürlüklü çıktı arasındaki çözünürlük çakışması çerçeveyi engelleyecektir. Detaylar geri yüklendi. Bu sorunu çözmek için, bu makale, düşük çözünürlüklü çerçevelerden gelen optik akışın doğru zaman bağımlılığı sağladığı Optik Akış Yeniden Yapılandırma Ağı (OFRnet) adı verilen uçtan uca bir optik akış yeniden yapılandırma ağı önermektedir ve son olarak Video süper çözünürlük görevlerinin performansı iyileştirildi. Makale, zaman bağımlılığını kodlamak için hareket telafisi gerçekleştirmek için yüksek çözünürlüklü optik akış kullanır ve son düşük çözünürlüklü giriş, süper çözünürlüklü sonuçlar oluşturmak için bir süper çözünürlüklü ağın girdisi olarak kullanılacaktır. Bu makaledeki deneyler, süper çözünürlük performansını iyileştirmek için yüksek çözünürlüklü optik akışın etkinliğini kanıtlamaktadır.Vid4 ve DAVIS-10 veri setleri üzerinde yapılan deneyler de OFRnet'in SOTA performansına ulaştığını kanıtlamaktadır.

Derin yaya yeniden tanımlama için güçlü temel ve toplu normalleştirme yapısı

Bildiri Başlığı: Derin Kişilerin Yeniden Tanımlanması için Güçlü Bir Temel ve Toplu Normalleştirme Boynu

Yazar: Luo Hao / Jiang Wei / Gu Youzhi / Liu Fuxu / Liao Xingyu / Lai Shenqi / Gu Jianyang

Gönderme süresi: 2019/6/19

Kağıt bağlantısı: https://paper.yanxishe.com/review/8413?from=leiphonecolumn_paperreview0109

Önerilen neden: Bu makale, yayaların yeniden kimliklendirilmesi sorununu ele almaktadır. Derin sinir ağları, yaya yeniden tanımlama problemlerinde yaygın olarak kullanılmaktadır ve bu modeller genellikle çok karmaşıktır. Bu makale, mevcut yaya yeniden tanıma kağıtlarında görünen etkili eğitim tekniklerini toplar ve değerlendirir.Bu teknikleri birleştirerek, makale yalnızca ResNet50'yi kullanarak% 94.5'lik bir 1. sırada ve Market1501 veri setinde ortalama% 85.9'u elde eder. Doğruluk. Bu makale ayrıca, metrik ve sınıflandırma kaybını iki farklı özellik alanına bölmek için global havuzlama katmanından sonra bir toplu normalleştirme katmanı ekleyen Batch Normalization Neck (BNNeck) adlı yeni bir yapı önermektedir. Bu makale, çok sayıda deney aracılığıyla BNNeck'in kıyaslama modelinin performansını iyileştirebileceğini göstermektedir.

FACLSTM: Sahne metni tanımaya odaklanan ConvLSTM

Bildiri Başlığı: FACLSTM: Sahne Metin Tanıma için Odaklanmış Dikkatli ConvLSTM

Yazar: Wang Qingqing / Jia Wenjing / He Xiangjian / Lu Yue / Blumenstein Michael / Huang Ye

Gönderme süresi: 2019/4/20

Kağıt bağlantısı: https://paper.yanxishe.com/review/8412?from=leiphonecolumn_paperreview0109

Öneri nedeni: Bu makale Science China Information Science tarafından kabul edilen sahne metni tanıma sorununu çözmeyi amaçlamaktadır.

Bu makale, sahne metni tanımanın esasen iki boyutlu görüntü girişinin uzamsal-zamansal tahmin problemi olduğuna inanmaktadır ve buna dayanarak, sıralı tahmin gerçekleştirmek için LSTM kullanan ve piksel alanını tam olarak kullanabilen evrişimli LSTM'ye dayalı bir sahne metin tanıma modeli FACLSTM önermektedir. Korelasyon. Aynı zamanda bu makale, dikkati doğru özellik bölgelerine odaklamak için, dikkat mekanizmasını evrişim işlemleriyle ConvLSTM yapısına entegre etmektedir. Karşılaştırma veri seti IIIT5K, SVT ve CUTE üzerindeki deneysel sonuçlar, FACLSTM'nin geleneksel düşük çözünürlüklü ve gürültülü metin görüntülerinde rekabet avantajı sergilediğini ve en son eğri metinden daha büyük bir marjla daha iyi performans gösterdiğini göstermektedir. Yöntemler.

Yeni bir örtük hareket tahmini ve telafi mekanizmasına dayalı uçtan uca eğitilebilir video süper çözünürlüğü

Bildiri Başlığı: Uçtan Uca Eğitilebilir Video Süper Çözünürlük Tabanlı > Yazar: Liu Xiaohong / Kong Lingshi / Zhou Yang / Zhao Jiying / Chen Jun

Gönderme süresi: 2020/1/5

Kağıt bağlantısı: https://paper.yanxishe.com/review/8411?from=leiphonecolumn_paperreview0109

Öneri nedeni: Bu makale, video süper çözünürlüğü konusu dikkate alınarak WACV 2020 tarafından kabul edilmiştir.

Videonun süper çözünürlüğü, düşük çözünürlükten yüksek çözünürlüklü video oluşturmaktır. Son zamanlarda önerilen video süper çözünürlük yöntemlerinin çoğu, düşük çözünürlüklü çerçeveler içinde ve arasında istatistiksel bağımlılıktan yararlanmak için açık hareket telafisi ile birlikte evrişimli sinir ağlarını kullanır. Bu makale, örtük hareket tahmini ve telafisi gerçekleştirmek için hedef piksellere göre uyarlanmış örneğe özgü ve konuma özgü dinamik yerel filtreler kullanan yeni bir dinamik yerel filtre ağı önermektedir. Bu makale ayrıca, yerel olmayan korelasyondan yararlanmak ve süper çözünürlüklü çerçevelerin uzamsal tutarlılığını geliştirmek için ResBlock ve otomatik kodlayıcı yapısına dayalı küresel bir optimizasyon ağı önermektedir. Deneysel sonuçlar, bu makaledeki yöntemin mevcut en iyi teknolojiden daha üstün olduğunu ve yerel dönüşüm işleme, zaman tutarlılığı ve kenar tanımı açısından üstünlük gösterdiğini göstermektedir.

TableNet: Uçtan uca tablo algılama ve taranmış belge görüntülerinden tablo verilerinin çıkarılması için derin öğrenme modeli

Kağıt adı: TableNet: Uçtan uca Tablo algılama ve Taranan Belge Görüntülerinden Tablo veri çıkarma için Derin Öğrenme modeli

Yazar: Paliwal Shubham / D Vishwanath / Rahul Rohit / Sharma Monika / Vig Lovekesh

Gönderme süresi: 2020/1/6

Kağıt bağlantısı: https://paper.yanxishe.com/review/8410?from=leiphonecolumn_paperreview0109

Öneri nedeni: Bu makale, taranmış belge görüntülerinden tablo algılama ve tablo verisi çıkarmayı ele almaktadır.

Taranan görüntülerden tablo şeklindeki verileri ayıklamanın önündeki ana engel, bu görüntülerin genellikle tablo halinde bilgiler içermesi ve tablo alt görüntülerinden veri çıkarmanın, görüntüdeki tablo alanının doğru tespiti ve ardından tablo satırlarının ve sütunlarının tespiti dahil olmak üzere bir dizi zorluğun olmasıdır. Bilgileri tespit edin ve çıkarın. Mevcut yöntemler, tablo algılama ve yapı tanıma sorunlarını bağımsız olarak çözmek için iki ayrı model kullanmaya çalışır. Bu makale, tablo algılama ve yapı tanıma için yeni bir uçtan uca derin öğrenme modeli olan TableNet'i önermektedir. Model, tablonun sütun alanını bölümlere ayırmak ve anlamsal kurallara dayalı olarak tablonun tanımlanan alt alanlarından satırları çıkarmak için tablo algılama ve tablo yapısı tanıma gibi iki görev arasındaki karşılıklı bağımlılığı kullanır. TableNet, ICDAR 2013 ve Marmot Table veri setlerinde şimdiye kadarki en iyi sonuçları elde etti. Ek olarak, bu makale, diğer anlamsal özelliklerin sağlanmasının model performansını daha da iyileştirebileceğini kanıtlamaktadır ve önerilen yöntem ayrıca veri kümeleri arasında aktarım öğrenmeyi göstermektedir.

Karşılıklı ortalama öğretim: yaya yeniden tanımlamayı hassaslaştırmak için kullanılan denetimsiz alan adaptasyonu sözde etiketleri

Kağıt adı: Karşılıklı Ortalama Öğretim: Denetimsiz Etki Alanı Adaptasyonu için Sözde Etiket Rafineri > Yazar: Ge Yixiao / Chen Dapeng / Li Hongsheng

Gönderme süresi: 2020/1/6

Kağıt bağlantısı: https://paper.yanxishe.com/review/8317?from=leiphonecolumn_paperreview0109

Öneri nedeni: Bu makale, yaya yeniden kimliklendirme sorunu dikkate alınarak ICLR 2020 tarafından kabul edilmiştir.

Kümeleme sürecindeki parazit sözde etiketlerinin etkisini azaltmak için, bu makale, çevrimdışı zor sözde etiketlere etkileşimli olarak ince ayar yapabilen ve çevrimiçi yumuşak etiketlere ince ayar yapabilen Mutual Mean-Teaching (MMT) adı verilen denetimsiz bir çerçeve önermektedir. Sözde etiketler, hedef alandan daha iyi özellikler öğrenin. Ek olarak, geleneksel üçlü kayıp, yumuşak etiketler için uygun değildir. Bu sorunu çözmek için, bu makale ayrıca, en iyi etki alanı uyarlama performansını elde etmek için öğrenme için sözde üçlü etiketlerin kullanımını destekleyen yeni bir yumuşak üçlü kayıp önermektedir. Deneyimden sonra MMT çerçevesi, Duke-to-Market, Market-to-MSMT ve Duke-to-MSMT veri setlerinin denetimsiz alan uyarlama görevlerinin sırasıyla% 14.4,% 18.2,% 13.1 ve% 16.4'ünü gerçekleştirdi. Desteklemek.

Lei Feng Ağı Lei Feng Ağı Lei Feng Ağı

Veriler eski fabrika işçileri ile buluşuyor! Advantech'in Akıllı Fabrikası Nasıl Yapıldı | En İyi Uygulama Örnekleri
önceki
Yaşadığımız teknolojik adım çağı, gelecekte 10.000 olasılık yaratmaktır.
Sonraki
2019'da devler "AI + eğitim" çemberinde ne yaptı? | Yıl sonu envanteri
Huami çemberi kırıyor: Küresel sağlıklı bir ekoloji yaratmaya adanmış, kulaklıklar ve koşu bantları dahil 6 yeni ürün çıktı
Meituan ile tamamen yüzleşmek mi? Hu Xiaoming'in Ali'nin yerel yaşam hizmetinde olduğu ve birden fazla işletmenin entegre edilebileceği söyleniyor
Apple, App Store'un her hafta 500 milyondan fazla kişi tarafından ziyaret edildiğini iddia ediyor; WeChat 5.000 arkadaş sınırını yayınladı; Güney Kore'nin Samsung telefonlarındaki bazı ünlüler hackle
Dünyadaki ilk on yapay zeka olayını incelerken, yapay zeka yönetişimi nasıl avantajlar arayabilir ve dezavantajlardan kaçınabilir
Boxing County'deki terk edilmiş kırsal evler ve yıkılmış duvarların "Sıfır Eylemi Temizleme" Gözlem Grubu, Chenhu Kasabasını ziyaret etti.
Qingming'i Anma Qingming'i Anma
Jinan'da bir adam ibadet etmek için yangın kağıdını yaktı, kazara orman yangınına neden oldu ve iki yıl hapis cezasına çarptırıldı
Ching Ming Festivali sırasında, bu araçların Jiqing Kuzey Hattında seyahat etmesine izin verilmiyor! Rotadan sapma rota duyurusu
Qilu Sabah Postası Devlet Konseyi: Bugün tüm ulus yarı yarıya yas tutuyor ve halk eğlencesini durduruyor
Ma Guangpeng, Parti Çalışma Komitesi Sekreteri ve Liaocheng Resort Yönetim Komitesi Direktörü olarak görev yaptı.
Ölümlü Şarkı · Qingming Festivali Jinan'dan bir polis memuru olan Zhang Yong, şüpheliyi durdurduktan sonra aniden yere düştü ve öldü
To Top