g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Google yakınlaştır! Otomatikleştirmek için veri artırma

Xinzhiyuan Derlemesi

Kaynak: Google Araştırması

Yazar: Ekin Doğuş Çubuk ve Barret Zoph

Editör: Wen Fei, Craig

Xin Zhiyuan Rehberi Google araştırmacıları yakın zamanda otomatik bir veri geliştirme yöntemi önerdiler. AutoML'den esinlenerek, yeni oluşturmaya güvenmeden verinin kendisinden en iyi görüntü dönüştürme stratejisini bulmak için pekiştirmeli öğrenmeyi kullanarak veri geliştirme sürecini otomatikleştirmeye çalışıyorlar. Bilgisayarla görme modelinin performansı, yeni ve sürekli genişleyen veri kümeleri durumunda geliştirilir.

Bilgisayarla görerek derin öğrenmenin başarısı, kısmen büyük miktarda etiketlenmiş eğitim verisine bağlanabilir - verilerin kalitesi, miktarı ve çeşitliliği artar ve modelin performansı genellikle artar. Bununla birlikte, modeli iyi bir performans elde edecek şekilde eğitmek için yeterince yüksek kaliteli veri toplamak genellikle çok zordur.

Bu sorunu çözmenin bir yolu, görüntü simetrilerini bir sinir ağı yapısı olarak sabit kodlamak veya uzmanların, genellikle iyi eğitimli görsel modeller tarafından kullanılan görüntüleri döndürme ve çevirme gibi veri geliştirme yöntemlerini manuel olarak tasarlamasına izin vermektir. Yönteme.

Ancak yakın zamana kadar insanlar, mevcut verileri otomatik olarak geliştirmek için makine öğreniminin nasıl kullanılacağına çok az dikkat ettiler. Google daha önce, insan tasarımı sistem bileşenlerini değiştirmek için AutoML'yi tanıttı ve sinir ağlarının otomatik olarak sinir ağlarını ve optimize edicileri iyi sonuçlarla tasarlamasına izin verdi. Bundan ilham alan Google araştırmacıları, kendilerine şu soruyu sormaktan kendini alamıyor: Veri geliştirme süreci otomatik olarak yapılabilir mi?

Google araştırmacıları, yeni yayınlanan "OtomatikAugment: Verilerden Artırma Politikalarını Öğrenin" makalesinde (AutoAugment: Verilerden Artırma Politikalarını Öğrenin) mevcut eğitim veri kümesindeki verilerin miktarını ve çeşitliliğini artıran bir takviye öğrenme algoritması keşfetti . Sezgisel olarak konuşursak, veri artırma, modele veri alanındaki görüntü değişmezlikleri hakkında bilgi vermek için kullanılır, sinir ağının bu önemli simetriye değişmez kalmasına izin verir ve böylece performansını artırır.

Araştırmacılar, veri geliştirme stratejilerinin manuel tasarımını kullanan önceki gelişmiş derin öğrenme modellerinden farklı olarak, verilerin kendisinden en iyi görüntü dönüştürme stratejisini bulmak için pekiştirmeli öğrenmeyi kullandıklarını söylediler. Sonuç olarak, bilgisayarla görme modellerinin performansı, yeni ve genişleyen veri kümeleri oluşturmaya dayanmadan geliştirilir.

Eğitim verilerinin iyileştirilmesi

Veri geliştirme fikri basittir: Görüntünün birçok simetrisi vardır ve bu simetri, görüntüde bulunan bilgileri değiştirmeyecektir. Örneğin bir köpeğin ayna yansıması hala bir köpektir. Bu "değişmezlik" in bazıları insanlar için aşikardır, ancak çoğunun fark edilmesi zordur. Örneğin, karıştırma yöntemi eğitim sırasında görüntüleri üst üste yerleştirerek verileri geliştirir ve böylece sinir ağı performansını geliştiren veriler üretir.

Sol: ImageNet veri kümesinden orijinal görüntü. Sağ görüntü: Aynı görüntü, yaygın veri geliştirme yöntemleriyle yatay olarak çevrildi.

AutoAugment, bilgisayarla görme veri kümeleri için özel veri geliştirme stratejileri tasarlamanın otomatik bir yoludur.Örneğin, AutoAugment, görüntüyü yatay / dikey olarak çevirmek, görüntüyü döndürmek, görüntü rengini değiştirmek gibi temel görüntü dönüştürme işlemlerinin seçimine rehberlik edebilir. AutoAugment, yalnızca birleştirilecek görüntü geçişlerini değil, aynı zamanda geçiş için kullanılan her görüntünün olasılığını ve boyutunu da tahmin edebilir, böylece görüntüler her zaman aynı şekilde manipüle edilmez. AutoAugment, 2,9 x 10 ^ 32'lik geniş bir arama alanından görüntü dönüştürme için en iyi stratejiyi seçebilir.

AutoAugment, çalıştırdığı veri kümesine göre farklı dönüşümleri öğrenir. Örneğin, dijital doğal sahneler içeren Sokak Görünümü (SVHN) görüntüleri için AutoAugment, veri kümesindeki yaygın bozulmaları temsil eden kırpma ve çevirme gibi geometrik dönüşümlere odaklanır. Ek olarak, dünyadaki farklı bina ve ev numaralandırma malzemelerinin çeşitliliği nedeniyle, AutoAugment ajansı, orijinal SVHN veri setinde doğal olarak görünen renkleri tamamen tersine çevirmeyi öğrendi.

Sol: SVHN veri kümesinden orijinal görüntü. Sağ: Aynı görüntünün Otomatik Büyütmesi. Bu durumda, en uygun dönüşüm kesmektir.

CIFAR-10 ve ImageNet'te, AutoAugment kırpma kullanmaz, çünkü bu veri kümeleri genellikle kırpma nesnesinin görüntülerini içermez ve renkleri tamamen tersine çevirmez, çünkü bu dönüştürmeler gerçekçi olmayan görüntülerle sonuçlanacaktır. Aksine, AutoAugment r'nin odak noktası, genel renk özelliklerini korurken renk ve ton dağılımını biraz ayarlamaktır. Bu, nesnenin gerçek renginin CIFAR-10 ve ImageNet'te önemli olduğunu, SVHN'de ise yalnızca göreli rengin önemli olduğunu gösterir.

Sol: ImageNet veri kümesinin orijinal görüntüsü. Sağ: AutoAugment stratejisi tarafından dönüştürülen aynı görüntü. İlk olarak, görüntüyü büyütün

sonuç

AutoAugment algoritmamız, en ünlü bilgisayar görme veri setlerinden bazıları için geliştirme stratejileri keşfetmiştir. Bu veri setleri, en gelişmiş doğruluğu sağlamak için sinir ağlarının eğitimine dahil edilmiştir. ImageNet verilerini geliştirerek,% 83,54 en iyi1 doğruluk oranına sahip yeni en son doğruluğu elde ettik , CIFAR10'da bilim adamları tarafından tasarlanan varsayılan veri geliştirmeden% 0,83 daha yüksek olan% 1,48 hata oranı elde ettik. SVHN'de en gelişmiş hatayı% 1,30'dan% 1,02'ye yükselttik. Önemli olan şey şu ki AutoAugment stratejisinin aktarılabilir olduğu bulundu - ImageNet veri kümesi için bulunan strateji diğer görüntü veri kümelerine de uygulanabilir (Stanford Motors, FGVC-Aircraft, vb.) Sinir ağının performansını iyileştirmek için.

AutoAugment algoritmamızın birçok farklı rekabetçi bilgisayar görüşü veri setinde bu performans düzeyine ulaştığını görmekten çok memnunuz ve gelecekte ses işleme veya dil modellerinde bile daha fazla bilgisayarla görme görevini dört gözle bekliyoruz. Bu teknoloji diğer alanlara da uygulanabilir. En iyi performans gösteren stratejiler, araştırmacıların ilgili vizyon görevlerinde modellerini geliştirmek için kullanabilmeleri için bu makalenin ekinde yer almaktadır.

Ortak çalışanlar Dandelion Mane, Vijay Vasudevan ve Quoc V. Le'ye özel teşekkürler. Bu projedeki yardımlarından dolayı Alok Aggarwal, Gabriel Bender, Yanping Huang, Pieter-Jan Kindermans, Simon Kornblith, Augustus Odena, Avital Oliver ve Colin Raffel'e de teşekkür ederiz.

Derleme kaynağı: https://ai.googleblog.com/2018/06/improving-deep-learning-performance.html

Topluluğa katıl

Xinzhiyuan AI teknolojisi + endüstri topluluğunun işe alımında, AI teknolojisi + endüstrisiyle ilgilenen öğrenciler küçük bir WeChat asistanı hesabı ekleyebilirler: aiera2015_3 Gruba katılın; incelemeyi geçtikten sonra sizi gruba katılmaya davet edeceğiz. Topluluğa katıldıktan sonra, grup açıklamalarını değiştirmeniz gerekir (isim-şirket-pozisyon; profesyonel grup incelemesi katıdır, lütfen anlayın).

Çin'in en güzel doğu kıyı şeridi boyunca okyanusun unutulmaz işaretine dokunun

Ülke genelindeki asayiş bürolarının yılbaşı yemeği böyle oldu!