Today Paper | TRANSFORMER yapısı; görüntüden görüntüye çeviri; eksik açıklamalı hedef algılama çözümü; GAN su altı görüntü rengi düzeltme, vb.

içindekiler

REFORMER: verimli bir TRANSFORMER yapısı

Metin rehberliği ile resimden resme çeviri

Arka plan yeniden kalibrasyon kaybı altında eksik etiket hedefi tespiti sorununu çözün

MLFcGAN: Çok seviyeli özellik füzyonuna dayalı Koşullu GAN su altı görüntüsü renk düzeltmesi

Çapraz modal öz-ilgi ağ öğrenmeye dayalı video soru oluşturma

REFORMER: verimli bir TRANSFORMER yapısı

Kağıt adı: REFORMER: VERİMLİ TRANSFORMATÖR

Yazar: Nikita Kitaev / Lukasz Kaiser / Anselm Levskaya

Düzenlenme zamanı: 2019/9/26

Makaleye bağlantı: https://openreview.net/attachment?id=rkgNKkHtvBname=original_pdf

Önerilen neden

Temel sorun: BERT harika sonuçlar elde ettiğinden, dönüşüm çoğu nlp görevi için standart yapılandırma haline geldi, ancak yavaş eğitim hızı, büyük içerik ve uzun dizileri idare edememe gibi bazı sorunları var. bu sorunları çöz.

İnovasyon noktası: Bu makale bir REFORMER yapısı önermektedir. Çekirdeğinde aşağıdaki noktalar bulunmaktadır: ilk olarak, içinde tek bir katmanın aktivasyon değerinin sadece bir kopyasının depolandığı tersine çevrilebilir bir katman önerilir ve ardından FF katmanındaki aktivasyon değerini alır Segmentasyon gerçekleştirin ve nihayet geleneksel çok başlı dikkat yerine Yerel Hassas Karma (LSH) dikkatini kullanır.

Araştırmanın önemi: Bu yeni model sadece eğitimde hızlı değil, aynı zamanda daha az hafıza kaplıyor ve çok uzun sekanslar sorununu da çözebilir.

Metin rehberliği ile resimden resme çeviri

Kağıt adı: Metin Kılavuzlu Resimden Resme Çeviri

Yazar: Li Bowen / Qi Xiaojuan / Torr Philip H. S. / Lukasiewicz Thomas

Gönderme süresi: 2020/2/12

Makaleye bağlantı: https://arxiv.org/abs/2002.05235v1

Önerilen neden

Bu makale, bir yüzleşme ağı oluşturarak görüntüden görüntüye geçişe kontrol edilebilir faktörleri (yani doğal dil tanımı) yerleştiren yeni bir görüntüden görüntüye geçiş yöntemi önermektedir, böylece metin açıklaması bileşik görüntünün görsel özelliklerini belirleyebilir. Bu yeni yöntem 4 temel bileşenden oluşur: 1. Belirli bir açıklamadaki anlamsal olmayan sözcükleri filtrelemek için konuşma parçası etiketleme uygulayın; 2. Farklı metin ve görüntü özelliklerini etkili bir şekilde birleştirmek için benzeşimli bir kombinasyon modülü kullanın; 3. Bir Yeni ince çok seviyeli mimari, ayırıcının ayırt etme yeteneğini ve jeneratörün düzeltme yeteneğini geliştirir; 4. Yeni bir yapı kaybı, gerçek görüntüler ile sentetik görüntüler arasında daha iyi ayrım yapmak için ayırıcının performansını daha da artırır. COCO veri seti üzerindeki deneyler, bu makalede önerilen yöntemin görsel özgünlük ve anlamsal tutarlılık açısından mükemmel bir performansa sahip olduğunu göstermektedir.

Arka plan yeniden kalibrasyon kaybı altında eksik etiket hedefi tespiti sorununu çözün

Kağıt adı: Arka Plan Yeniden Kalibrasyon Kaybıyla Eksik Ek Açıklama Nesne Algılamasını Çözme

Yazar: Zhang Han / Chen Fangyi / Shen Zhiqiang / Hao Qiqi / Zhu Chenchen / Savvides Marios

Gönderme süresi: 2020/2/12

Kağıt bağlantısı: https://arxiv.org/abs/2002.05274v1

Önerilen neden

Bu makale yeni ve zorlu bir hedef tespit senaryosunu incelemektedir: veri setindeki gerçek nesnelerin veya örneklerin çoğu etiketlenmemiştir, bu nedenle bu etiketlenmemiş alanlar eğitim sürecinde arka plan olarak kabul edilir. Mevcut yöntem, Daha Hızlı RCNN'ye dayanmaktadır ve ROI'nin gradyanını ağırlıklandırmak için yumuşak örnekleme ve pozitif örneklerin örtüşmesini kullanır. Bu makale, önceden tanımlanmış bir IoU eşiğine ve giriş görüntüsüne göre kayıp sinyalini otomatik olarak yeniden kalibre edebilen, arka plan yeniden kalibrasyon kaybı adı verilen yeni bir çözüm önermektedir. Bu makale ayrıca ek açıklama eksikliğini gidermek için birkaç büyük revizyondan geçti. PASCAL VOC ve MS COCO veri setleri üzerine yapılan deneyler, bu yazıda önerilen yöntemin mevcut yöntemlerden büyük ölçüde üstün olduğunu göstermektedir.

MLFcGAN: Çok seviyeli özellik füzyonuna dayalı Koşullu GAN su altı görüntüsü renk düzeltmesi

Kağıt adı: MLFcGAN: Sualtı Görüntü Renk Düzeltme için Çok Seviyeli Özellik Füzyon tabanlı Koşullu GAN

Yazar: Liu Xiaodong / Gao Zhi / Chen Ben M.

Gönderme süresi: 2020/2/13

Makaleye bağlantı: https://arxiv.org/abs/2002.05333

Önerilen neden

Bu makale su altı görüntülerinin renk düzeltmesini ele almaktadır.

Generative Adversarial Network'e dayalı olarak, bu makale derin bir çok ölçekli özellik füzyon ağı önermektedir.İlk olarak, çok ölçekli özellikler çıkarılır ve ardından yerel özellikler her ölçekte global özelliklerle geliştirilir. Renk düzeltme ve detay koruma gibi iki görevde, bu makalede önerilen yöntem öncü bir avantaj elde etti ve kalite, işleme etkisi ve yeni yöntem açısından mevcut en iyi modelden üstündür.

Çapraz modal öz-ilgi ağ öğrenmeye dayalı video soru oluşturma

Kağıt adı: Çapraz Modal Öz-Dikkat Ağları Öğrenme Yoluyla Video Soru Üretimi

Yazar: Wang Yu-Siang / Su Hung-Ting / Chang Chen-Hsi / Liu Zhe-Yu / Hsu Winston

Gönderme süresi: 2019/7/5

Makaleye bağlantı: https://arxiv.org/abs/1907.03049

Önerilen neden

Bu yazının çözmeyi amaçladığı şey, videolu soru cevap sorusudur.

Videolu soru cevaplama görevleri için, derin öğrenme modelleri büyük ölçüde büyük miktarda veriye dayanır ve bu tür verileri etiketlemenin maliyeti yüksektir. Bu makale, video kare sırasına ve video klipteki ilgili altyazılara bağlı olarak otomatik olarak problemler oluşturabilen ve böylece büyük etiketleme maliyetini azaltan yeni bir görev önermektedir. Video içeriği hakkında nasıl soru sorulacağını öğrenmek, modelin sahnedeki zengin semantiği ve vizyon ile dil arasındaki etkileşimi anlamasını gerektirir. Bu sorunu çözmek için, bu makale video karelerinin ve altyazıların çeşitli özelliklerini bir araya getirmek için yeni bir modlar arası öz-ilgi ağı önermektedir. Deneyler, önerilen yöntemin kıyaslama yöntemine kıyasla% 85 oranında iyileştirilebileceğini kanıtlamıştır.

Makale yazar ekibinin işe alınması

AI Araştırma Enstitüsü, yapay zeka gençlerinin çoğuna daha iyi hizmet verebilmek için resmi olarak yeni bir "Tez" bölümü başlattı ve tezleri, önerileri, yorumları ve yorumları sıralayan makaleler aracılığıyla yapay zeka öğrencilerini ve gençleri bir araya getirmek için "ilgi çekici noktalar" olarak kullanmayı umdu ve kod yeniden üretildi. Yurtiçinde ve yurtdışında en son araştırma sonuçlarının incelenmesi, tartışılması ve yayınlanması için bir buluşma yeri olmaya ve mükemmel bilimsel araştırmaların daha yaygın olarak yayılmasına ve tanınmasına izin vermeye kararlıdır.

Akademisyenleri sevenlerin, makale yazarları ekibimize katılmanızı umuyoruz.

Alabilirsiniz

1. Adınızın yazdığı bir makale sizi en göz kamaştırıcı akademik yıldız yapacak

2. Zengin ücret

3. AI ünlü şirketleri, konferans bileti avantajları, özel çevre birimleri vb.

Bildiri yazarı ekibine katılmak için ihtiyacınız olan:

1. Favori makalelerinizi araştırma kulübü üyelerinin çoğuna önerin

2. Tez yorumunu yazın

AI Araştırma Enstitüsü'nün yarı zamanlı makale yazarı ekibine katılmaya hazırsanız, operasyon kadının WeChat hesabını ekleyebilir ve "Yarı zamanlı makale yazarı" notunu yazabilirsiniz

Göç öğreniminin sınırlarını aşın! Google "T5" yeni NLP modeli öneriyor, çoklu karşılaştırma testi SOTA'ya ulaşıyor
önceki
Eski zamanlarda sihirli bir ayna vardı ve şimdi bir yüz tanıma makinesi, Microsoft CVPR 2020 başyapıtı var, böylece sahte yüzlerin saklanacak hiçbir yeri yok
Sonraki
NAS çok zordur, arama sonuçları rastgele örnekleme ile karşılaştırılabilir! Huawei ICLR 2020 belgesi 6 öneri veriyor
CVPR 2020 kabul edilen bildiriler duyuruldu: 1470 kabul edilen bildiri, kabul oranı "art arda iki damla", yalnızca% 22
AAAI Online Live | Dikkat HetSANN modeline dayalı olarak heterojen ağ semantik bilgilerini otomatik olarak madenciliği
IJCAI 2020 o kadar acımasız ki, gönderilen bildirilerin% 42'si son incelemeden önce reddedildi! Reddedilen yazar: cahil bir güce bakın, bunun üzerine geribildirim mi?
Pekiştirmeli öğrenmede her yerde bulunan Bellman optimallik denkleminin arkasındaki matematiksel ilke nedir?
Yicai muhabirleri Şangay Otobanı G50'ye gece ziyaretleri, Şangay'a giren araçların salgın durumuna ilişkin 24 saat kesintisiz nokta kontrollerine başlıyor
Bu 13 günde Wuhan'dan ayrılan tüm insanlar nereye gitti?
Grafik | Turistlerin Yılbaşı Gecesi: Çocuklar, hazır erişte ve özel Yılbaşı Yemeği
Oksijen iyon taşıma mekaniği üzerine yerinde elektron mikroskobu araştırması ilerleme kaydetti
Salgın sırasında aşırı anksiyete? Gelin, bazı bilişsel kontrol tekniklerini öğrenin
Salgından sonra hazır yemek nasıl dönüştürülür?
Salgın sonrası çevrimiçi eğitim, sonuçta "yalnız" öğrenenlere ulaşacak mı?
To Top