Kağıt | Oluşturulan görüntü veri kümesi etkili değil mi? Belki içerik dağıtımındaki farkı göz önünde bulundurmanız gerekiyor

AI Technology Review Press: Eğitim verilerinin artması ile derin öğrenme modellerinin performansının artacağını herkes bilir.Bu nedenle modelin performansını sürekli iyileştirmek için modelin kendisinin tasarımı ve eğitim verilerinin artırılması üzerine birçok araştırma yapılmaktadır. Görüntüyle ilgili görevler için, geleneksel olarak Google tarzı şiddet içeren toplama, Facebook'un kullanıcılar tarafından yüklenen görüntüleri etiketlemesi ve Apple'ın üretimi ve ince ayarları gibi dönüşüme dayalı veri artırma yöntemlerine sahibiz. Veri üretme yöntemi elbette en ideal olanıdır.Ne de olsa birçok görevdeki ilgili tüm görsellerin toplamı fazla değildir ve verileri oluştururken gerçek etiketler de doğrudan elde edilir. Ancak veri üretme yönteminin de ciddi bir sorunu vardır, yani üretilen veri setinin veri dağılımı ile gerçek veri seti arasında farklılıklar vardır ve bu farklılıklar veri üretme yönteminin etkisini sınırlandırmaktadır.

Oluşturulan veri seti ile gerçek veri seti arasındaki farkın araştırılmasında, farklı görevlerde ortak olan görüntü özelliklerinin öğrenilmesi, görüntü stili aktarımının öğrenilmesi vb. Gibi, oluşturulan veri setindeki görüntülerin daha çok gerçek görüntülere benzemesini sağlayan birçok sonuç vardır. Bununla birlikte, bu makalenin yazarları, görüntü stilindeki farklılığın aslında sadece küçük bir faktör olduğuna inanmaktadır.Daha önemli fark, görüntü içeriğindeki farklılıktır ve oluşturulan görüntünün yeni görevler için yardımcı olması gerekir. Önceki görüntü oluşturma yöntemleri yalnızca sınırlı sahneleri, sınırlı nesneleri ve sınırlı değişiklikleri kapsayabilir ve gerçek dünya nesnelerinin değişkenliğini ve öznitelik dağılımını yetersiz bir şekilde tanımlayabilir; ve yazarlar, KITTI veri setini örnek alarak verilerinin Almanya'da toplandı, ancak belki de bu veri setini kullanarak diğer araştırmacılar tarafından eğitilen sistem Japonya'da kullanılmak istiyor. Sahnenin içeriği farklı olacak, hatta hizmetin görev hedefi bile farklı olabiliyor. Bunların tümü, mevcut veri oluşturma yöntemlerinin çözemediği ve hatta dikkate almadığı yönlerdir. Tamamen sanal ortamda çoğaltılırsa, sermaye ve zaman maliyetleri de çok yüksektir.

Meta-Sim tarafından oluşturulan veri kümesi, gerçek ve üretilen veriler arasındaki dağılımı azaltabilir ve aşağı akış görevleri için optimize edilebilir

Bu nedenle, "Meta-Sim: Sentetik Veri Kümeleri Oluşturmayı Öğrenme" başlıklı makalede yazarlar, araştırma hedeflerinin otomatik olarak büyük ölçekli açıklamalı veri kümeleri oluşturmak olduğunu ve bu veri kümesinin aşağı akış görevleri için yararlı olduğunu açıkça belirtmişlerdir (veri kümesi İçerik dağıtımı, hedef kullanım senaryolarını karşılayabilir). Yazarlar tarafından önerilen yöntem, yeni sentezlenen sahnenin üretken modelini öğrenen ve eğitim grafiklerini ve karşılık gelen gerçek etiket değerini bir grafik motoru aracılığıyla eşzamanlı olarak elde edebilen Meta-Sim'dir. Yazarlar daha sonra, görüntü motoru tarafından görüntü çıktısı ile hedef veri kümesinin dağıtımı arasındaki farkı azaltmak için sahne içeriğinin dağıtım olasılığından elde edilen sahne yapısı haritasının niteliklerini değiştirmeyi öğrenebilmesi için veri kümesi üreticisini parametrelendirmek için bir sinir ağı kullanır. fark. Taklit edilecek gerçek veri setinin küçük bir etiketli doğrulama seti varsa, yazarların yöntemi ek bir meta-hedef için optimize edilebilir, bu da mevcut veri seti görevinin aşağı akış görevleri için optimize edilebileceği anlamına gelir. Deneyler, manuel olarak tasarlanmış sahne içeriği dağıtım olasılığı ile karşılaştırıldığında, önerilen yöntemlerinin, aşağı akış görevlerinde niteliksel ve niceliksel olarak doğrulanabilen içerik üretiminin kalitesini büyük ölçüde iyileştirebileceğini göstermektedir. Orijinal belgede daha spesifik ayrıntılar bulunabilir.

Bu makalenin yazarları Nvidia, Toronto Üniversitesi, Vector Yapay Zeka Enstitüsü ve MIT'den.

Proje ana sayfasına bakın: https: //nv-tlabs.github.io/meta-sim/

Kağıt adresi: https://arxiv.org/abs/1904.11621

Tıklamak Orijinal metni okuyun, Görünüm Pekiştirme öğrenme motor kontrolünün mevcut ilerlemesini anlamak için pekiştirmeli öğrenme tezi tartışma grubu

Bilgisayarların ve cep telefonlarının zorbalığının altında, akıllı TV'nin ne kadar hayal gücü var?
önceki
Bugün, 70 yıl sonra, Çin Donanması Qingdao'da toplanıyor!
Sonraki
Haberler | 2019 Global Smart Expo alt forumunun gündemi açıklandı ve altı AI açık inovasyon platformu aynı aşamada sergilenecek
Endüstri | Bu yapay zeka Beethoven'ı Lady Gaga'nın tarzıyla yazmaya devam edebilir ve netizenler eğleniyor
Sürpriz mi yoksa korku mu? Makine öğrenimi algoritmalarının `` yüksek enerjili '' anlarını sayın
ICLR2019 | Sen Takip Ederim: Aktif Görsel İzleme İçin Bir Yüzleşme Oyunu Mekanizması
Bingcheng'deki Haping West Road'daki 1.400 kayısı ağacının hepsi çiçek açıyor!
ASC sekizinci yıl
"1 Mayıs" döneminde, Harbin polis hizmeti penceresi "kapatılmadı"
Harbin Çocuk Parkı 1 Haziran'da yenilenerek şehir merkezindeki bir parka dönüşüyor
Çin'in en etkili iş kadınlarının listesi açıklandı: VIPKID kurucusu Mi Wenjuan, üst üste iki yıldır listede yer alıyor
İlk yarı: Biella çift şut Zhang Xizhe şut, Guoan 3-0
İlk yarı: Dai Lin Qi Tianyu Pellet'e çift ring, Luneng 2-0 Zall ile asist yaptı
Filipinler'deki 6.4 deprem 5 kişiyi öldürdü, kişi tahliye edildi
To Top