Apple'ın yoğun yapay zeka teknolojisi blogu lansmanı, gerçekçi fotoğraf kağıtlarının CVPR sentezi ilk çekimi ateşledi

1 Xinzhiyuan derlemesi

Apple, makine öğrenimi araştırma makalelerine odaklanan bir blog yayınladı ve Apple'ın en son araştırma bulgularını paylaştı. Blogun adı "Apple Machine Learning Journal" (Apple Machine Learning Journal), yayınlanan ilk makale, sentezlenen görüntülerin sinir ağlarını eğitmek için nasıl daha gerçekçi hale getirileceğiyle ilgili.

Bu hareket çok ilginç çünkü Apple genellikle araştırma projeleri hakkında kamuya açık bir şekilde konuşmuyor. Techcrunch raporlarına göre Apple, Safari'nin arkasındaki tarayıcı motoru WebKit ve iOS, watchOS ve tvOS için Apple'ın en yeni programlama dili Swift gibi bazı önemli açık kaynaklı projeleri başlattı. Ancak, yapay zeka araştırma makalelerine adanmış bir blog, Apple için hala çok yenidir.

Birkaç nedenden dolayı ilginçtir. Öncelikle bu makale arXiv'de yayınlandı. Bugün blogda yayınlanan sürüm aynı şeyden bahsediyor, ancak daha basit bir dille. Dahası, Apple ayrıca göstermek için bazı GIF animasyonları ekledi.

Bu makaleye göre, Apple'ın fotoğraflardaki yüzleri ve diğer nesneleri algılamak için bir sinir ağı eğitmesi gerekiyor. Ancak, sinir ağlarını eğitmek için milyonlarca görüntü örneğiyle devasa veri kümeleri oluşturmak yerine, Apple'ın yaklaşımı, bilgisayar tarafından üretilen karakterlerin sentetik görüntülerini oluşturmak ve bu sentetik görüntüleri daha gerçekçi hale getirmek için bir filtre uygulamaktır. Bu, sinir ağlarını eğitmek için genel yöntemlerden daha ucuz ve daha hızlıdır.

İkincisi, bu blogda Apple okuyucuları onlara e-posta göndermeye teşvik ediyor. Altbilgide Appleın işe alım sayfasına büyük bir bağlantı da var. Açıkçası, Apple bu platformu yetenekli mühendisler bulmak için kullanmayı umuyor.

Üçüncüsü, birçok kişi, Google ve Amazon gibi şirketlerin daha yetenekli olduğuna inanarak Apple'ın makine öğrenimindeki performansını eleştiriyor. Elbette Apple'ın sessiz kaldığı da doğru. Google'ın Asistanı ve Amazon'un Alexa'sı gibi tüketici ürünleri de Apple'ın Siri'sinden çok daha iyi performans gösteriyor.

Ancak mobil cihazlardaki fotoğraf kitaplığını, iPhone 7 Plus'ın alan etkisinin derinliğini ve Apple'ın ARkit artırılmış gerçekliğini analiz ederken Apple da iyi bir iş çıkardı. Açıkçası, yapay zeka ve makine öğrenimi açısından Apple, halkın bu konudaki algısını değiştirmek istiyor.

Apple Machine Learning Journal'daki ilk makalenin ne dediğine bir göz atalım.

Kompozit görüntülerin gerçekçiliğini geliştirin

Şu anda, sinir ağının en başarılı örneği denetimli öğrenme ile eğitilmektedir. Bununla birlikte, yüksek doğruluk elde etmek için, eğitim seti çok sayıda farklı örnek ve doğru ek açıklamalar gerektirir ki bu çok pahalıdır. Büyük miktarda veriyi etiketlemenin bir alternatifi, simülatör tarafından sentezlenen görüntüleri kullanmaktır. Bu yöntemin maliyeti düşüktür, çünkü verilere açıklama eklemeye gerek yoktur, ancak sentezlenen görüntü yeterince gerçekçi olmayabilir ve bu da gerçek test görüntüsünde yetersiz genellemeye neden olur. Bu sorunu çözmek için Apple, bileşik görüntünün daha gerçekçi görünmesini sağlamak için birleşik görüntüyü iyileştirmek için bir yöntem önerdi. Araştırma sonuçları, bu iyileştirilmiş sentetik görüntü eğitim modellerinin kullanılmasının birden fazla makine öğrenimi görevinde doğruluğu önemli ölçüde artırabileceğini göstermektedir.

Şekil 1: Görev, etiketlenmemiş gerçek verileri kullanan ve ek açıklama bilgilerini korurken sentezlenen görüntünün gerçekliğini iyileştirmek için bir simülatör kullanan bir modeli öğrenmektir.

"Gerçekliği geliştirme" nin amacı, testin doğruluğunu artırmak için görüntüyü olabildiğince gerçekçi hale getirmektir. Bu, makine öğrenimi modelini eğitmek için ek açıklama bilgilerini saklamamız gerektiği anlamına gelir. Örneğin, Şekil 1'deki göz bakışının yönü korunmalı ve hiçbir yapaylık üretilmemelidir, aksi takdirde makine öğrenimi bunları aşabilir. Görüntünün gerçekliğini iyileştirmek için sentezlenen görüntüyü işleyen "iyileştirici ağ" adı verilen derin bir sinir ağı öğreniyoruz.

Şekil 2: İyileştirilmiş ağ R, yerel olumsuz kayıpların ve "kendi kendini düzenleme" koşullarının kombinasyonunu en aza indirir. Kayıp "aldatma" ayrımcı ağıyla karşı karşıya kalan görüntü, "gerçek" ve "rafine" olarak sınıflandırılır. Kendi kendini normalleştirme terimi, sentezlenmiş görüntü ile iyileştirilmiş görüntü arasındaki farkı en aza indirir. Geliştirilmiş ağ ve ayırıcı ağ dönüşümlü olarak güncellenir.

Şekil 3: Yerel sayaç kaybının grafik gösterimi. Ayırıcı ağ, w × h'lik bir olasılık haritası çıkarır. Rakip kayıp fonksiyonu, yerel yamanın çapraz entropi kaybının toplamıdır.

Şekil 4: Ayırıcıyı iyileştirmek için görüntü geçmişini kullanmanın görsel illüstrasyonu.

Şekil 5: Ayırıcı D'nin geçmişindeki mini parti şeması. Her bir mini grup, jeneratörden gelen güncel yinelemeli görüntüyü ve tampondan önceki sahte görüntüyü içerir.

Şekil 6: Eğitim ilerledikçe, rafineri ağının çıktısı. Ağ, bulanık görüntüden başlayarak gerçek görüntüdeki ayrıntıları simüle etmeyi öğrenir.

Şekil 7: Eğitim ilerledikçe, jeneratörün ve ayırıcının kayıp değerleri

Şekil 8: Özellik uzayında kendi kendini normalleştirme kaybı örneği.

Şekil 9: Sentetik görüntüdeki göz bebeği merkezleri ile gerçek görüntü arasındaki mesafenin dağılım grafiği

Şekil 10: Rafine göz görüntüleri elde etmek için önerdiğimiz yöntemi kullanmak

Şekil 11: Sentezlenmiş görüntüler ve iyileştirilmiş görüntüler kullanılarak göz bakışı tahmininin eğitim karşılaştırması. Gerçek test görüntülerini değerlendirin.

Şekil 12: MPIIGaze veri setinde bakış tahmini için farklı yöntemlerin karşılaştırılması. İlk iki yöntem Kaynaklar ve.

Bu makalede açıklanan çalışma hakkında daha fazla ayrıntı için lütfen https: // arxiv adresindeki "Simüle Edilmiş ve Denetlenmemiş Görüntülerden Simüle Edilmiş ve Denetlenmemiş Görüntülerden Öğrenme" başlıklı CVPR makalemize bakın. .org / abs / 1612.07828

Daha fazla araştırma detayı ve referans için lütfen orijinal metni görüntüleyin: https://machinelearning.apple.com/2017/07/07/GAN.html

Melodinin ve zamanın izlerini keşfederek Avusturya müzik turu
önceki
Kendime bir Avrupa seyahati borçluyum, geri ödeme zamanı!
Sonraki
Zaten sahip olduklarınızı kullanın ve sahip olduğunuz kaynaklara dikkat edin | 8 Eylem Listesi
İlk lansman: Yüz tanıma Dünya Kupası listesi yayınlandı, Microsoft Milyon Ünlüler Tanıma Yarışması Şampiyon Paylaşımı
İran ABD dolarını renminbi ile değiştirdi.Irak Petrol yeni bir alıcı bulduktan sonra işler aniden iki şekilde değişti.
Vietnam'ın ekonomisi ABD dolarına aşırı derecede bağımlı. Kanada örneğini izledikten sonra, zengin olmadan önce düşebilir ve aniden RMB'yi düşünebilir
Bir Türk Akdeniz mavisi rüyası yaşayın ve bu romantik ülkeye gülümseyin.
Ma Weiying, Zhu Jun, Mei Qiaozhu, Liu Yang, Qin Tao, CCIR 2017 genel bakış tarafından derinlemesine paylaşım
Kırsal bölgeye dönmek ve arabayı hendeğe sürmek iyi bir yüz mü? Netizen: Artık herkesin arabası var, buna hiç gerek yok!
Venezuela, yerleşim için petrocoin kullanımını resmen açıkladıktan sonra işler ilerledi ve diğer iki büyük ülke de aynı şeyi yaptı.
`` Derin Öğrenmenin Dört Teknik Yönergesi '' Keras'ın babası ve bir Google araştırmacısı, makinede otonom öğrenmeyi ortadan kaldırdı
Yanlışlıkla IQ vergisi ödedim ...
Kalbi kırık! Kırsal bölgeye lüks bir araba sürerken çevrenizdeki insanların tutumları neden böyle oluyor?
Sorun yaratma şüphesi, cezai gözaltı! İşte!
To Top