AI Technology Review Press: Eğitim verilerinin artması ile derin öğrenme modellerinin performansının artacağını herkes bilir.Bu nedenle modelin performansını sürekli iyileştirmek için modelin kendisinin tasarımı ve eğitim verilerinin artırılması üzerine birçok araştırma yapılmaktadır. Görüntüyle ilgili görevler için, geleneksel olarak Google tarzı şiddet içeren toplama, Facebook'un kullanıcılar tarafından yüklenen görüntüleri etiketlemesi ve Apple'ın üretimi ve ince ayarları gibi dönüşüme dayalı veri artırma yöntemlerine sahibiz. Veri üretme yöntemi elbette en ideal olanıdır.Ne de olsa birçok görevdeki ilgili tüm görsellerin toplamı fazla değildir ve verileri oluştururken gerçek etiketler de doğrudan elde edilir. Ancak veri üretme yönteminin de ciddi bir sorunu vardır, yani üretilen veri setinin veri dağılımı ile gerçek veri seti arasında farklılıklar vardır ve bu farklılıklar veri üretme yönteminin etkisini sınırlandırmaktadır.
Oluşturulan veri seti ile gerçek veri seti arasındaki farkın araştırılmasında, farklı görevlerde ortak olan görüntü özelliklerinin öğrenilmesi, görüntü stili aktarımının öğrenilmesi vb. Gibi, oluşturulan veri setindeki görüntülerin daha çok gerçek görüntülere benzemesini sağlayan birçok sonuç vardır. Bununla birlikte, bu makalenin yazarları, görüntü stilindeki farklılığın aslında sadece küçük bir faktör olduğuna inanmaktadır.Daha önemli fark, görüntü içeriğindeki farklılıktır ve oluşturulan görüntünün yeni görevler için yardımcı olması gerekir. Önceki görüntü oluşturma yöntemleri yalnızca sınırlı sahneleri, sınırlı nesneleri ve sınırlı değişiklikleri kapsayabilir ve gerçek dünya nesnelerinin değişkenliğini ve öznitelik dağılımını yetersiz bir şekilde tanımlayabilir; ve yazarlar, KITTI veri setini örnek alarak verilerinin Almanya'da toplandı, ancak belki de bu veri setini kullanarak diğer araştırmacılar tarafından eğitilen sistem Japonya'da kullanılmak istiyor. Sahnenin içeriği farklı olacak, hatta hizmetin görev hedefi bile farklı olabiliyor. Bunların tümü, mevcut veri oluşturma yöntemlerinin çözemediği ve hatta dikkate almadığı yönlerdir. Tamamen sanal ortamda çoğaltılırsa, sermaye ve zaman maliyetleri de çok yüksektir.
Meta-Sim tarafından oluşturulan veri kümesi, gerçek ve üretilen veriler arasındaki dağılımı azaltabilir ve aşağı akış görevleri için optimize edilebilir
Bu nedenle, "Meta-Sim: Sentetik Veri Kümeleri Oluşturmayı Öğrenme" başlıklı makalede yazarlar, araştırma hedeflerinin otomatik olarak büyük ölçekli açıklamalı veri kümeleri oluşturmak olduğunu ve bu veri kümesinin aşağı akış görevleri için yararlı olduğunu açıkça belirtmişlerdir (veri kümesi İçerik dağıtımı, hedef kullanım senaryolarını karşılayabilir). Yazarlar tarafından önerilen yöntem, yeni sentezlenen sahnenin üretken modelini öğrenen ve eğitim grafiklerini ve karşılık gelen gerçek etiket değerini bir grafik motoru aracılığıyla eşzamanlı olarak elde edebilen Meta-Sim'dir. Yazarlar daha sonra, görüntü motoru tarafından görüntü çıktısı ile hedef veri kümesinin dağıtımı arasındaki farkı azaltmak için sahne içeriğinin dağıtım olasılığından elde edilen sahne yapısı haritasının niteliklerini değiştirmeyi öğrenebilmesi için veri kümesi üreticisini parametrelendirmek için bir sinir ağı kullanır. fark. Taklit edilecek gerçek veri setinin küçük bir etiketli doğrulama seti varsa, yazarların yöntemi ek bir meta-hedef için optimize edilebilir, bu da mevcut veri seti görevinin aşağı akış görevleri için optimize edilebileceği anlamına gelir. Deneyler, manuel olarak tasarlanmış sahne içeriği dağıtım olasılığı ile karşılaştırıldığında, önerilen yöntemlerinin, aşağı akış görevlerinde niteliksel ve niceliksel olarak doğrulanabilen içerik üretiminin kalitesini büyük ölçüde iyileştirebileceğini göstermektedir. Orijinal belgede daha spesifik ayrıntılar bulunabilir.
Bu makalenin yazarları Nvidia, Toronto Üniversitesi, Vector Yapay Zeka Enstitüsü ve MIT'den.
Proje ana sayfasına bakın: https: //nv-tlabs.github.io/meta-sim/
Kağıt adresi: https://arxiv.org/abs/1904.11621