Sahne metni tanıma için verimli omurga araması
Öğrenme genişletme: metin tanıma için ortak veri geliştirme ve ağ optimizasyonu
KPNet: en küçük yüz dedektörü
DEPARA: Derinlemesine bilgi aktarılabilirliğinin derinlik öznitelik haritası
Keyfi şekil metin algılama için derin ilişkisel çıkarım grafiği ağı
Kağıt adı: Sahne Metni Tanıma için Etkili Omurga Arama
Yazar: Zhang Hui / Yao Quanming / Yang Mingkun / Xu Yongchao / Bai Xiang
Gönderme süresi: 2020/3/14
Kağıt bağlantısı: https://paper.yanxishe.com/review/14658?from=leiphonecolumn_paperreview0401
Önerilen neden
Bu makale, Sahne Metin Tanıma (STR) problemini çözmek içindir. Geçmiş araştırmalar, düzeltme ve çapak alma gibi ön işleme görüntü modüllerini veya sıra dönüştürücüler geliştirerek performansı iyileştirmeye daha fazla önem vermiştir. Bununla birlikte, başka bir anahtar modül olan özellik dizisi çıkarıcı kapsamlı bir şekilde incelenmemiştir. Bu makale, metin tanıma performansını iyileştirmek için veriye bağlı omurga modellerini aramak için otomatik bir sahne metin tanıma (AutoSTR) yöntemi önermektedir. Her şeyden önce, yeni yöntem STR için çeşitli işlem seçenekleri ve altörnekleme yolu kısıtlamalarını içeren alana özgü bir arama alanı tasarlar. Daha sonra, yeni yöntem, işlemi ve aşağı örnekleme yolunu ayıran iki adımlı bir arama algoritması kullanır ve belirli bir alanda etkili bir arama gerçekleştirebilir. Deneyler, verilere bağlı omurgaları arayarak, AutoSTR'nin daha az hata ve model parametresi ile standart kıyaslama veri setlerinde en gelişmiş yöntemleri aşabileceğini göstermektedir.
Bildiri Başlığı: Artırmayı Öğrenin: Ortak Veri Artırma ve Metin Tanıma için Ağ Optimizasyonu
Yazar: Luo Canjie / Zhu Yuanzhi / Jin Lianwen / Wang Yongpan
Gönderme süresi: 2020/3/14
Kağıt bağlantısı: https://paper.yanxishe.com/review/14657?from=leiphonecolumn_paperreview0401
Önerilen neden
Bu makale CVPR 2020 tarafından kabul edildi ve çözülmesi gereken sorun metin tanımadır.
Bu makale, yeni bir metin görüntüsü veri geliştirme yöntemi önermektedir. Geleneksel geliştirme yöntemlerinden (rotasyon, ölçekleme ve perspektif dönüştürme gibi) farklı olarak, yeni yöntem, güçlü tanıyıcıları eğitmek için daha etkili ve spesifik olan uygun ve verimli veri geliştirme yöntemlerinde uzmanlaşmayı amaçlamaktadır. Yeni yöntem, bir dizi özel kıyaslama kullanılarak esnek ve kontrol edilebilir hale gelir ve izole edilmiş veri geliştirme süreci ile ağ optimizasyonu arasındaki boşluğu ortak öğrenme yoluyla kapatır. Proxy ağı, tanıma ağı için daha uygun eğitim örnekleri oluşturmak üzere tanıma ağının çıktısından referans noktalarını öğrenir ve kontrol eder. Normal sahne metni, düzensiz sahne metni ve el yazısı metin dahil olmak üzere çeşitli ölçütler üzerinde yürütülen çok sayıda deney, bu makalede önerilen geliştirme yöntemi ve ortak öğrenme stratejisinin tanıma ağının performansını önemli ölçüde artırdığını göstermektedir.
Kağıt adı: KPNet: Minimal Yüz Dedektörüne Doğru
Yazar: Song Guanglu / Liu Yu / Zang Yuhang / Wang Xiaogang / Leng Biao / Yuan Qingsheng
Gönderme süresi: 2020/3/17
Kağıt bağlantısı: https://paper.yanxishe.com/review/14656?from=leiphonecolumn_paperreview0401
Önerilen neden
Bu makale AAAI 2020'de yayınlandı ve yüz algılama sorununu ele alıyor.
Bu makale, yüz görünümü özelliklerinin yeterli ayırt etme gücüne sahip olduğunu ve minyatür sığ bir sinir ağı kullanılarak arka plandan da tespit edilebileceğini buldu. Yukarıdan aşağıya eklem yüz algılama ve hizalama yöntemlerinin çoğunun aksine, önerilen KPNet tüm yüz yerine aşağıdan yukarıya doğru daha küçük yüz anahtar noktalarını algılar. KPNet ilk önce dikkatlice tasarlanmış ince taneli ölçek yaklaşımı ve ölçek uyarlamalı Soft-argmax operatörü aracılığıyla düşük çözünürlüklü görüntülerden yüzdeki yer işaretlerini tahmin eder. Herhangi bir karmaşık kafa mimarisi veya ayrıntılı ağ tasarımı olmadan KPNet, genel yüz algılama ve hizalama kıyaslamalarının mevcut en iyi doğruluğunu elde etmek için yalnızca yaklaşık 1M parametreye ihtiyaç duyar. GPU'da çalışma hızı 1000 fps'dir ve çoğu durumda kullanılması kolaydır Ön uç yongasında gerçek zamanlı yürütme.
Bildiri Başlığı: DEPARA: Derin Bilgi Aktarılabilirliği için Derin İlişkilendirme Grafiği
Yazar: Song Jie / Chen Yixin / Ye Jingwen / Wang Xinchao / Shen Chengchao / Mao Feng / Song Mingli
Gönderme süresi: 2020/3/17
Kağıt bağlantısı: https://paper.yanxishe.com/review/14655?from=leiphonecolumn_paperreview0401
Önerilen neden
Bu makale CVPR 2020 tarafından alındı ve önceden eğitilmiş derin sinir ağlarından (PRe eğitimli Derin Sinir Ağları, PR-DNN) elde edilen bilgilerin aktarılabilirliğini incelemek için DEPARA adlı derin bir öznitelik grafik modeli önerdi. DEPARA'da, düğümler girişlere karşılık gelir ve PR-DNN'nin çıkışında kendi vektörleştirilmiş öznitelik grafikleriyle temsil edilir. Kenarlar, girişler arasındaki korelasyonu temsil eder ve PR-DNN'den çıkarılan özelliklerin benzerliği ile ölçülür. İki PR-DNN'nin bilgi aktarılabilirliği, karşılık gelen DEPARA'larının benzerliği ile ölçülür. Bu makale, DEPARA'yı transfer öğrenmede eğitim öncesi model seçimi ve katman seçimi problemlerine uygulamaktadır ve çok sayıda deney, bu iki problemin çözümünde önerilen yöntemin etkililiğini ve üstünlüğünü kanıtlamaktadır.
Kağıt adı: Rasgele Şekil Metin Algılama için Derin İlişkisel Akıl Yürütme Grafiği Ağı
Yazar: Zhang Shi-Xue / Zhu Xiaobin / Hou Jie-Bo / Liu Chang / Yang Chun / Wang Hongfa / Yin Xu-Cheng
Gönderme süresi: 2020/3/17
Kağıt bağlantısı: https://paper.yanxishe.com/review/14654?from=leiphonecolumn_paperreview0401
Önerilen neden
Bu makale CVPR 2020 tarafından kabul edilmiştir ve çözülmesi gereken, rastgele şekillerin metin tespitidir.
Bu makale, rasgele şekil metin tespiti için yeni bir birleşik ilişkisel muhakeme grafik ağı önermektedir. Bu yöntemde, yerel grafik, metin önerisi modelini evrişimli sinir ağı aracılığıyla köprüler ve derin ilişkisel çıkarım ağını grafik evrişim ağı üzerinden geçer, böylece önerilen ağ uçtan uca eğitilebilir. Spesifik olarak, her metin örneği bir dizi küçük dikdörtgen bileşene bölünecek ve bu küçük bileşenlerin geometrik özellikleri (yükseklik, genişlik ve yön gibi) metin teklif modeli tarafından tahmin edilecektir. Geometrik nitelikler göz önüne alındığında, bu harita oluşturma modeli, farklı metin bileşenleri arasında kabaca bağlantılar kurabilir. Bileşenler ve komşuları arasındaki bağlantı olasılığını daha fazla gerekçelendirmek ve çıkarabilmek için, bu makale yerel grafikler üzerinde derin ilişkisel akıl yürütme yapmak için grafik tabanlı ağlar kullanıyor. Halka açık veri seti üzerinde yapılan deneyler, önerilen yöntemin mevcut en iyi performansa sahip olduğunu kanıtlamaktadır.
Lei Feng Ağı Lei Feng Ağı Lei Feng Ağı