g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Microsoft tarafından satın alındıktan sonra Maluuba, çok kılavuzlu pekiştirmeli öğrenme makinesini incelemeye başladı

Maluuba, Montreal'de (Kanada'nın güneydoğusundaki bir liman kenti) bulunuyor ve bu yılın başında Microsoft tarafından satın alınan Kanadalı bir yapay zeka girişimi. Leifeng.com, girişimin ve araştırma ekibinin, insan-bilgisayar etkileşiminin daha doğal olması için yapılandırılmamış metni analiz etmek için daha iyi bir makine zekası aracı geliştirmeye kararlı olduğunu öğrendi. Ekip, bir süre önce ekibin çalışmalarının odak noktası olan ilk "Multi-Advisor Reinforcement Learning" i kısa süre önce tamamladı.

Makalesi, sorunu daha basit ve kolay bir şekilde çözen "çok danışmanlı pekiştirmeli öğrenme" teorisini vurguladı. Ayrıca Maluuba, makineye bazı liderlik becerilerini öğretmek için etkili girişimlerde bulunuyor. Geçmişin zor sorunlarını çözmek için.

Acilen çözülmesi gereken sorunlar nelerdir?

Sertlik, mevcut insan-bilgisayar etkileşim arayüzünün hala üstesinden gelemediği zor bir sorundur ve bu etkileşim çeşitli sorunlara eğilimlidir. Leifeng.com, mevcut endüstri lideri Siri, Alexa ve Cortana'nın önceki diyalog sistemlerini çok aşmasına rağmen, zekalarının hala sıradan insan zekasından uzak olduğunu öğrendi.

Bilgisayarlar açısından başlayıp bu sistemin sahip olabileceği maksimum kapasiteyi düşünürsek, tüm sistemi mümkün olduğunca barındıran bir modelin bile mühendislerin belirli ihtiyaçlar için yarattığı akıllı araçların yerini almaya yetmeyeceğini anlayabiliriz. Belirli kısıtlamalar altında iyi performans gösterebilme. Bu yüzden Siri'ye sizin için arama emri verebilirsiniz, ancak ondan büyük bir akşam yemeği partisi düzenlemesini isteyemezsiniz.

Takviyeli öğrenme (pekiştirmeli öğrenme, bir makine öğrenimi dalı), önerildiği günden bu yana zeka alanındaki araştırmacıların büyük ilgisini çekmiştir. Daha önce açıklandığı gibi, pekiştirmeli öğrenme, iktisatçıların pratik kavramlarından yeni fikirler alır ve sürekli olarak ölçmeye, tekrar tekrar değerlendirmeye ve kararlar almaya çalışır. Sorunlarla başa çıkmak için "oyunlaştırma" mekanizmasını kullanın ve otomatik arabanın tüm sürüş kurallarını doğrudan tanımlamak yerine akıllı sistemin iyileştirilebilmesi için akıllı sistemin optimize edebileceği bazı "düğümleri" grafik olarak ayarlayın. İkili sarı çizginin ötesine geçerken, sistem dinamik olarak bazı düğümleri atabilir; sistem hız sınırı içinde kaldığında, sistem katılmak için bazı düğümleri ayırabilir. Bu fikir sisteme daha fazla uyum sağlayabilir, ancak bu yine de çok fazla hesaplama gerektiren oldukça karmaşık bir sorundur. Bu nedenle, çok güdümlü pekiştirmeli öğrenme makinesinin gelişi bu sorunları ustaca çözecektir.

sorun çözüldü

Maluuba, pekiştirmeli öğrenme için bu karmaşık sorunları çözmeye çalışır. Yöntemleri, sorunu çözmek, azaltmak ve modüler hale getirmek için çoklu "danışmanlar" kavramını kullanmaktır. Geleneksel pekiştirmeli öğrenme algoritmaları, tek aracılı pekiştirmeli öğrenmeyi (Tek Aracılı güçlendirme) kullanır, ancak birden çok aracı kullanan son algoritmalar daha yaygın hale gelmiştir.

Maluuba ile yapılan bir röportajda ekip, akıllı bir planlama asistanı vakası gösterdi. Belki bir gün, akıllı algoritma, tek aracı öğrenme algoritmasının her tür için en iyi toplantı programını düzenlemesine izin vermek yerine, farklı toplantı düzeylerine göre farklı aracılar atayacaktır.

Zorluk, tüm aktörlerin birbirleriyle işbirliği yapmak için nasıl harekete geçirileceğidir.

Maluuba'nın orijinal fikri, bu ajanların insanlar gibi sorunları çözmelerine izin vermekti. Ve insanların birlikte verimli bir şekilde çalışmasını sağlamak büyük bir projedir, bölmek ve fethetmek fikri bazen tek başına karar vermeyi geçebilse bile. Bu nedenle çözüm, toplayıcının karar vermesi için tüm "liderlerin" üstüne oturmasına izin vermektir. Maluuba'nın makalesinde, her kolaylaştırıcının çözülmesi gereken büyük soruna farklı bir odak noktası vardır. Kolaylaştırıcılar farklı görüşlere sahipse, toplayıcı tahkim için ayağa kalkacaktır.

Maluuba, farklı çok rehberli pekiştirme ve toplama öğrenme çerçeve teorilerini test etmek için Bayan Pac-Man tarafından tasarlanan Pac-Boy programının basitleştirilmiş bir versiyonunu kullanıyor. Ekip, insanların sorunları nasıl verimli bir şekilde çözdüğünü öğrenmeye hevesli. Buna ek olarak, birçok optimal toplayıcının ideal koşullar altında nasıl organize edileceğine ve yönetileceğine ilişkin bazı yaygın yöntemler vardır. Takımın buna meraklı olmasının nedeni budur. Böylece makinenin "Liderlik 101" i öğrenmesine izin vermeye karar verdiler.

Çoklu takviye öğrenme makinelerinin avantajları nelerdir?

Çoklu takviyeli öğrenim makineleri, CPU ve GPU'nun hesaplama verimliliğini büyük ölçüde artırabilir. Böylesi bir bilgi işlem darboğazını aşmak, aynı zamanda çok sunuculu paralel hesaplamanın uygulanmasını kolaylaştırır. Hesaplama karmaşıklığını azaltmak, tüm dünyadaki araştırmacıların pekiştirmeli öğrenmeyi incelemeleri için bir anahtardır. Araştırma ekibi üyeleri, bu soruna Microsoft'un geliştirilmesinin de eşlik ettiğini söyledi. Microsoft, makine öğrenimi ekibi için bir iletişim kanalı oluşturmak üzere Azure bulut platformunu açtı. Azure çalışmaya başladığında, Maluuba dil metin analizi alanında önemli bir rol oynadı.

Pekiştirmeli öğrenmenin kendisi yeni bir kavram olmasa da, Maluuba bunun üzerine çok fazla kaynak aktardı. Ekip üyeleri, ekibin AlphaGo'da DeepMind tarafından geliştirilen takviye öğrenmenin büyük potansiyelini gördüğünü ve gelecekteki ortak araştırma projelerinin daha etkili ve uyarlanabilir takviye öğrenme yöntemleri getireceğini doğruladı. Bu, Microsoft'un oturum odaklı ürünlerine daha fazla kullanıcı getirebilir.

Techcrunch aracılığıyla, Lei Feng.com

Hala devam filmini mi bekliyorsunuz? "Utanç" çizgi romanı sizi Dunwall'a geri götürüyor

Sophie Marceau: Dünyadaki tüm kadınlar arasında vicdansız bir şekilde en güzel olan o!