g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Araçlar Facebook, çeşitli makine öğrenimi sorunlarına uygulanabilen, gradyan içermeyen optimizasyon için açık kaynaklı bir araç olan Nevergrad'ı piyasaya sürdü

AI Technology Review Press: Doğal dil işleme, görüntü sınıflandırmasından çeviriye ve bir dizi diğer görevlere kadar birçok makine öğrenimi görevi, modeldeki parametreleri ve / veya hiperparametreleri ayarlamak için gradyan içermeyen optimizasyona dayanır. Facebook, parametre / hiper-parametre ayarlamasını daha hızlı ve daha kolay hale getirmek için Nevergrad (https://github.com/facebookresearch/nevergrad) adlı bir Python 3 kitaplığı oluşturdu ve açık kaynak olarak yayınladı. Nevergrad, gradyan hesaplamalarına dayanmayan ve bunları standart bir Q&A Python çerçevesinde sunan birçok optimizasyon algoritması sağlar. Ek olarak, Nevergrad ayrıca test ve değerlendirme araçlarını da içerir.

Nevergrad artık halka açık ve yapay zeka araştırmacıları ve diğer gradyan olmayan optimizasyonla ilgili çalışanlar, işlerine yardımcı olmak için bunu hemen kullanabilirler. Bu platform, yalnızca en gelişmiş algoritmaları ve yöntemleri uygulamalarına ve performanslarını farklı ayarlarda karşılaştırmalarına izin vermekle kalmayacak, aynı zamanda makine öğrenimi bilim insanlarının belirli bir kullanım durumu için en iyi optimize ediciyi bulmalarına yardımcı olacaktır. Facebook Yapay Zeka Araştırma Enstitüsü'nde (FAIR) araştırmacılar, Nevergrad'ı pekiştirmeli öğrenme, görüntü oluşturma ve diğer alanlarda çeşitli projelere uyguluyorlar.Örneğin, makine öğrenimi modellerinin daha iyi ayarlanmasına yardımcı olmak için parametre taramanın yerini alabilir.

Bu kitaplık, aşağıdakiler gibi çeşitli optimize ediciler içerir:

Diferansiyel evrim (Diferansiyel evrim)
Sıralı ikinci dereceden programlama
FastGA
Kovaryans matris uyarlaması
Gürültü yönetimi için nüfus kontrol yöntemleri (Gürültü yönetimi için nüfus kontrol yöntemleri)
Parçacık sürüsü optimizasyonu

Bundan önce, bu algoritmaların kullanımı genellikle araştırmacıların algoritmanın uygulamasını kendilerinin yazmasını gerektiriyordu, bu da çeşitli en yeni yöntemler arasında karşılaştırma yapmalarını zorlaştırıyor, hatta bazen tamamen imkansız hale getiriyordu. Artık yapay zeka geliştiricileri, Nevergrad'ı kullanarak belirli makine öğrenimi sorunları üzerinde farklı yöntemleri kolayca test edebilir ve ardından sonuçları karşılaştırabilir. Alternatif olarak, yeni gradyansız optimizasyon yönteminin mevcut son teknoloji yöntemlerle nasıl karşılaştırıldığını değerlendirmek için iyi bilinen kıyaslamaları kullanabilirler.

Nevergrad'da bulunan gradyan içermeyen optimizasyon yöntemleri, aşağıdakiler gibi çeşitli makine öğrenimi problemleri için kullanılabilir:

Çoklu yerel minimumlarla ilgili sorunlar gibi çok modlu problemler. (Dil modellemesi için derin öğrenme hiperparametrelendirmesi gibi.)
Kötü koşullandırılmış problemler genellikle tamamen farklı dinamik özelliklere sahip birden çok değişkeni optimize ederken ortaya çıkar (belirli bir problem için ayarlanmayan atma ve öğrenme oranları gibi).
Kısmi rotasyon problemleri dahil ayrılabilir veya dönen problemler.
Kısmen ayrılabilir sorunlar birkaç değişken blok aracılığıyla çözülebilir. Örnekler arasında derin öğrenme veya diğer mimari arama tasarım formları ve çok görevli ağların parametreleştirilmesi yer alır.
Kesikli, sürekli veya karışık problemler. Bu sorunlar, güç sistemlerini içerebilir (çünkü bazı güç istasyonları ayarlanabilir sürekli çıktıya sahipken diğerleri sürekli veya yarı sürekli çıktıya sahiptir) veya her katman için öğrenme hızının, ağırlık zayıflamasının ve doğrusal olmayan türdeki sinir ağı görevlerinin eşzamanlı seçilmesini gerektirebilir. .
Bir gürültü problemi vardır, yani bu problem için fonksiyon, pekiştirmeli öğrenmedeki farklı seviyeler gibi tam olarak aynı parametrelerle çağrıldığında farklı sonuçlar döndürebilir.

Makine öğreniminde Nevergrad, öğrenme hızı, momentum, ağırlık azalması (belki her katman için), bırakma algoritması, derin ağın her parçası için katman parametreleri ve diğerleri gibi parametreleri ayarlamak için kullanılabilir. Daha genel olarak, gradyan olmayan yöntemler ayrıca grid yönetimi (https://www.sciencedirect.com/science/article/pii/S0142061597000409), havacılık (https://www.sciencedirect.com/science/article/ pii / S0142061597000409), lens tasarımı (https://www.researchgate.net/publication/222434804_Human-competitive_lens_system_design_with_evolution_strategies) ve diğer birçok bilimsel ve mühendislik uygulamaları.

Gradyan optimizasyonuna neden ihtiyaç var?

Sinir ağı ağırlık optimizasyonu gibi bazı senaryolarda, işlevin gradyanını hesaplamak için analitik yöntemler kullanmak basittir. Ancak, f hesaplama fonksiyonunun yavaş olması veya etki alanının sürekli olmaması gibi diğer senaryolarda, fonksiyonun eğimi tahmin edilemez. Bu uygulama örneklerinde gradyan içermeyen yöntem bir çözüm sağlar. Basit bir degradesiz çözüm, üç adımdan oluşan rastgele aramadır: çok sayıda arama noktasını rastgele örneklemek, her arama noktasını değerlendirmek ve en iyi arama noktasını seçmek. Rastgele arama, birçok basit senaryoda iyi performans gösterir, ancak yüksek boyutlu senaryolarda kötü performans gösterir. Genellikle makine öğrenimi parametre ayarlaması için kullanılan ızgara araması benzer sınırlamalarla karşı karşıyadır. Bununla birlikte, birçok alternatif yöntem de vardır: bazıları simülatörün ikinci yaklaşımını güncelleyen sıralı karesel programlama gibi uygulamalı matematikten gelir; Bayes optimizasyonu ayrıca belirsizlik modelleri de dahil olmak üzere nesnel fonksiyon modelleri kurar; evrim Hesaplama, gelecek vaat eden varyantların seçilmesi, değiştirilmesi ve karıştırılması üzerine çok fazla çalışma gerektirir.

Bu örnek evrimsel algoritmanın nasıl çalıştığını göstermektedir. İşlev alanındaki arama noktalarını örnekleyin, en iyi nokta topluluğunu seçin ve ardından mevcut nokta topluluğunu optimize etmeye çalışmak için mevcut noktaların etrafında yeni noktalar önerin.

Algoritma karşılaştırmaları oluşturmak için Nevergrad'ı kullanın

Facebook araştırma ekibi, belirli algoritmaların belirli durumlarda en iyi performansı gösterdiğini göstermek için çeşitli kıyaslamaları uygulamak için Nevergrad'ı kullandı. Bu iyi bilinen örnekler, çeşitli ayarlara (çok modlu veya çok modlu olmayan, gürültülü veya gürültüsüz, ayrık veya ayrık olmayan, kötü koşullu veya kötü koşulsuz) karşılık gelir ve en iyi optimizasyon algoritmasını belirlemek için Nevergrad'ın nasıl kullanılacağını gösterir.

Her kıyaslama testinde, Facebook araştırma ekibi farklı X değerleri üzerinde bağımsız deneyler yaptı. Bu, çeşitli yöntemler arasında birkaç X değeri üzerinden tutarlı sıralamanın istatistiksel olarak anlamlı olmasını sağlar. Aşağıdaki iki kıyaslama örneğine ek olarak, burada (https://github.com/facebookresearch/nevergrad/blob/master/docs/benchmarks.md) daha kapsamlı bir liste var ve basit bir komut satırının nasıl kullanılacağını ekliyor Bu karşılaştırmaları yeniden çalıştırmak için yönergeler.

Bu şekil, gürültü optimizasyonunun bir örneğini göstermektedir

Bu örnek, pcCMSA-ES gürültü yönetimi ilkelerini (https://homepages.fhv.at/hgb/New-Papers/PPSN16_HB16.pdf) kullanan TBPSA'nın birkaç alternatiften nasıl daha iyi performans gösterdiğini göstermektedir. Facebook araştırma ekibi burada sadece TBPSA'yı algoritmanın sınırlı bir örneğiyle karşılaştırıyor, ancak diğer yöntemlerden daha iyi performans gösteriyor.

Nevergrad platformu, birçok makine öğrenimi senaryosunda görünen ayrı amaç işlevlerini de yürütebilir. Bu senaryolar, örneğin, sınırlı bir seçenek kümesi arasından seçim yapmayı (sinir ağlarındaki etkinleştirme işlevleri gibi) ve çeşitli katman türleri arasından seçim yapmayı (örneğin, ağdaki belirli konumların atlanıp atlanmayacağına karar vermeyi içerir. bağ).

Mevcut alternatif platformlar (Bbob ve Cutest) herhangi bir ayrı kıyaslama içermiyor. Nevergrad, softmax işlevi (ayrık sorunları gürültülü sürekli sorunlara dönüştürme) veya sürekli değişkenlerin ayrıklaştırılmasıyla işlenen ayrık etki alanlarını yürütemez.

Facebook araştırma ekibi, bu senaryoda FastGA'nın (https://arxiv.org/abs/1703.03334) en iyi performansı gösterdiğini fark etti. DoubleFastGA, 1 / dim ve (dim-1) / dim arasındaki mutasyon oranına karşılık gelir, 1 / dim ve 1/2 değil. Bunun nedeni, orijinal aralığın ikili alana karşılık gelmesi ve burada keyfi alanı dikkate almalarıdır. Birkaç senaryoda, basit ve tutarlı bir mutasyon oranı karışımı (https://arxiv.org/abs/1606.05551) iyi performans gösterdi.

Araştırmacılar ve makine öğrenimi bilim adamları için araç kutusunu genişletme

Faacebook, araştırmacıların yeni algoritmalar oluşturmasına ve değerlendirmesine yardımcı olmak için Nevergrad'a özellikler eklemeye devam edecek. İlk sürümün temel manuel test yetenekleri var, ancak Facebook, fiziksel modelleri temsil etme yeteneği de dahil olmak üzere ona daha fazla özellik eklemeyi planlıyor. Uygulama açısından, Nevergrad'ın kullanımını kolaylaştırmaya ve eğimi iyi belirleyemeyen PyTorch takviye öğrenme modelindeki parametreleri optimize etmek için kullanmaya devam edecekler. Nevergrad, parametre taraması için A / B testi ve iş planlama gibi diğer görevlere de yardımcı olabilir.

Via: https://code.fb.com/ai-research/nevergrad/, AI Technology Review tarafından derlenmiştir.

Facebook Yapay Zeka Araştırma Enstitüsü'nün yıllar içindeki önemli başarılarını görüntülemek için orijinal metni okumak için tıklayın

Hong Kong Film Ödülleri veritabanı yayınlandı ve her zaman oyuncuya ulaşamayan odur.

Bu bir polis filminin senaryosu değil, bu gerçekte Hong Kong'da korkunç bir cinayet davası ~

: Yerinde Gerçek ve yanlış teknoloji arasında ayrım yapmak zor olan Geely, boşluğu doldurmak için teknoloji markası "iNTEC" i piyasaya sürdü

: LeetCode Temel Algoritma Problemi Bölüm 102: Bir ikili ağacın tüm sol yaprak düğümlerinin toplamını bulun

: KITH x Daniel Arsham ortak serisi çıktı! Sizi bir saniyede kimyasal reaktif mi yapacak?

: Kumar kralının üç yatak odalı oğlu baba olduğunu itiraf etti ve Şubat ayında evlendi ve şimdi bebeğini gezdirebilir mi?

: Roborock süpürme robotu, Double Eleven'da satın almaya değer iyi teknoloji ürünlerini sayıyor

: Landkong Filmlerine Saldırmak: "Sword of the Sky" önce "Shadow Roaming" bağlantısının tadına bakarken, Qi Wei ve Wang Zulan web drama projesine giriyor

: Bu en iyi yapay zeka konferansları önümüzdeki yıl Çin'e taşınacak! Yurt dışına gitmeden "Kılıçta Huashan" bile yapabilirsiniz.

: "Forensic Pioneer 4", tamamlanır tamamlanmaz yuvadan ayrıldığını ve çıkışının 16 yılında zaten post-level oyunculuk yaptığını duyurdu ~

: Baojun 730 otomatik şanzımanın iç mekanı duyuruldu! Yeni araba veya 18 Kasım'da listelenmiş

: Heineken ve BAPE'nin ortak bir dizisi mi var? ! Sence hangisi Coca-Cola'dan daha iyi?

: OnePlus 6T, Çin'de görücüye çıktı, Liu Zuohu, OnePlus'ın küresel amiral gemisi pazarında çekirdek marka haline geldiğini söyledi

: New York Times Long Makalesi: Yoda of Silicon Valley-Algorithm Master Donald Knuth

g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Araçlar Facebook, çeşitli makine öğrenimi sorunlarına uygulanabilen, gradyan içermeyen optimizasyon için açık kaynaklı bir araç olan Nevergrad'ı piyasaya sürdü

Gradyan optimizasyonuna neden ihtiyaç var?

Algoritma karşılaştırmaları oluşturmak için Nevergrad'ı kullanın

Araştırmacılar ve makine öğrenimi bilim adamları için araç kutusunu genişletme

İlgili bilgi

Bu ciddi bir yükseltme, test sürüşü Geely'nin yeni vizyonu

En başından itibaren "Late Night Canteen" reklamı yerleştirildi.Altın ustası stüdyoya denetlemek için geldi, ekip her şeyi kabul etti.

Akademi Derin pekiştirmeli öğrenme algoritmalarının genelleme yeteneğini ölçmek

Hong Kong müzik sahnesi Huang Zongze'ye bir açıklama mı borçlu? Cevap verdi: Bana plastik bir torba borcu var!

Kaptan test sürüşü Mercedes-Benz S450L'nin bir başka yükseltmesi

Yüksek fiyatlı A-COLD-WALL * x NikeLab Air Force 1'e benzeyen model yeniden ortaya çıktı! Bu sefer bir de kazak var!

Çok fazla rutin var ve yeterli beyin yok Bu arabaların "ömür boyu garantiye ve sıfır ödeme" ye sahip olduğu doğru mu?

6. Şangay Uluslararası Film Forumu ve Sergisi yakında yapılacak

120.000 istasyon vagonundan hangisi daha iyi? Yuelang, Octavia station wagon'a karşı

Haberler Qiyuan World, NeurIPS 2018 çok temsilcili yarışmasının Öğrenme grubunda birinci oldu ve karar verme zeka platformunun değerini vurguladı