Temsili öğrenmenin yedi araştırma ilerlemesine genel bakış, grafik sinir ağları, yorumlanabilir yapay zeka, makine öğrenimi ve robotik

Yazar | Gregory J Stein Derleme | Çevirmen balala

Düzenle | Cong Mo

Her yıl sona ererken, Massachusetts Institute of Technology, Elektrik Mühendisliği ve Bilgisayar Bilimleri Bölümü'nden Gregory J Stein, bu yıl da kendisi üzerinde en büyük etkiye sahip olan başlıca araştırma eğilimlerini veya makaleleri gözden geçirecek.

Bu alandaki bir araştırmacı olarak, araştırma topluluğunda büyük ilerleme olduğuna inandığı şeyleri derinlemesine incelemenin veya şimdiye kadar ilerleme kaydedilmemiş olabilecek alanları bulmanın anlamlı olabileceğini buldu.

Bu makalede Gregory J Stein, makine öğrenimi ve robotik araştırmalarının mevcut gelişme durumuna ilişkin görüşlerini dile getirdi.

1. ALPHAZERO'dan MUZERO'ya

AlphaZero, 2017'deki en sevdiğim kağıtlardan biridir. DeepMind'ın satranç ve Go AI, bu yıl büyük yükseltmeler elde etti ve mevcut sürüm, Atari oyununu insan performansını aşan görevler listesine sorunsuz bir şekilde ekleyen MuZero olarak adlandırıldı.

Geçmişte AlphaZero için Atari oyunları ulaşılamazdı, çünkü bu oyunun gözlem alanı çok büyüktü, bu da AlphaZero'nun davranış ağaçları oluşturmasını ve karar sonuçları almasını zorlaştırıyordu. Go'da, yönetim kurulu, belirli bir işlem yapıldıktan sonra yönetim kurulunun sunacağı durum için bir dizi kuralı izlediğinden, davranışın sonucunu tahmin etmek kolaydır.

Ancak Atari'ye göre, prensip olarak, bir eylemin sonucunu tahmin etmek, oyunun bir sonraki karesindeki olası savaş durumunu tahmin etmeyi gerektirir. Bu tür çok yüksek boyutlu durum uzayı ve tanımlanması zor gözlem modeli, sistem birkaç çerçeve içinde eylemlerinin gelecekteki etkisini tahmin etmeye çalıştığında son derece zor olacaktır.

  • MuZero kağıt adresi: https://arxiv.org/abs/1911.08265

MuZero, durum uzayının gizli (düşük boyutlu) temsilini (mevcut çerçeve dahil) öğrenerek ve ardından öğrenme alanında planlama yaparak bu sorunu çözer. Bu dönüşümle, ajan bu küçük gizli alanda eylemler yapabilir, birçok farklı eylemin etkisini hayal edebilir ve olası ödünleşmeleri değerlendirebilir.Bu, AlphaZero ve MuZero'nun dayandığı Monte Carlo ağacıdır. aramak (MCTS) Algoritmanın ayırt edici özelliği.

Bu yöntem daha çok beklediğim gerçekten akıllı bir karar verme sistemine benziyor: her bir seçimin gerçek dünya üzerindeki etkisini doğru bir şekilde tahmin etmek zorunda kalmadan farklı seçenekleri tartma yeteneği. Buradaki zorluk, gizli alanı aynı anda nasıl öğrendikleri ve bu gizli alanda plan yapmayı öğrenmeleridir.Daha ayrıntılı bilgi için lütfen makalelerine bakın.

Bu çalışmanın beni gerçekten şaşırtan yanı, kişisel fikirleri daha büyük bir çalışma sisteminde nasıl birleştirdiği. Bu makale, gördüğüm makine öğrenimi çalışmalarıyla ilgili diğer sistematik makaleler ile aynıdır, ancak sinir ağı eğitimini karakterize etme konusundaki kalıcı beceriye ek olarak, MuZero'da önerilen fikirler, giderek daha karmaşık hale gelen sorunların nasıl çözüleceğine ilişkin soruları da yanıtlamaya yardımcı olur Sorun, yapay zekayı oluşturmanın derin sorunudur.

Tüm AI araştırma topluluğu, daha güçlü bir karar verme sistemi oluşturmak için bireysel düşünceleri bir araya getirmek ve bireysel düşünceleri toplamak için çok çalışıyor. AlphaZero ve MuZero da bu yönde ilerliyor MCTS ağaç yapısını tanıma (farklı eylemleri seçmenin etkilerini simüle etme) ve her eylemin gelecekteki avantajlarını tahmin etme yeteneği daha güçlü bir öğrenme sistemi ile sonuçlanacaktır.

MuZero'nun kompakt gösterimi (sistem dinamik modeli) öğrenme ek yeteneği, sonraki eylemleri planlama amacına ulaşmak için planlama eylemlerini ve sonraki gözlemleri simüle edebilir.Bu, böyle bir sistemin bir gün gerçek dünyadaki robotik problemleri çözebileceğine inanmamı sağlıyor.

Bununla birlikte, AlphaZero ve MuZero şu anda pratik sorunları çözme becerisine sahip değil. İlgili tartışmalar için lütfen şu makaleye bakın:

  • Makale adresi: http : // www. cachestocaches .com / 2018/12 / doğru-gerçek dünyaya-alphazero /

Yapay zekayı daha akıllı hale getirmek için çok çalıştıkça, bu çalışma bizi hangi fikirlerin ve araçların bu sistemlerin gerçekte uygulanmasını sağlayabileceğini daha iyi anlamaya itecektir.

Bu alanda, bahsetmeye değer bir başka başarı da, yapay zekanın kısmen gözlemlenebilir bir işbirliğine dayalı kart oyunu oynamasını gerektiren Facebook AI'nın Hanabi kart oyunu AI'dır.

2. Temsil Öğrenimi (Yüce Sembol AI)

Belki de beni en çok heyecanlandıran gelişme, temsil öğrenme alanında.

Eski moda klasik planlamanın ve sözde sembolik yapay zekanın sadık bir destekçisiyim.Bu yöntemde ajan, nesneler veya insanlar gibi sembolleri anlayarak gerçek dünya ile bağlantı kurar.

İnsanlar bunu her zaman yaptı, ancak yeteneklerimizi robotlara veya yapay zeka ajanlarına çevirirken, ajanın hangi nesneleri veya diğer tahminleri yapmasını istediğimizi sıklıkla belirlememiz gerekir.

Ancak kesin bir cevap almanın büyük ölçüde zor olduğu bir soru şudur: Semboller nereden geliyor? Daha genel olarak: Robotların karmaşık gerçek dünya sorunlarını çözerken hızlı ve verimli kararlar alabilmesi için dünyayı nasıl temsil etmeliyiz?

Son zamanlarda yapılan bazı çalışmalar, bu tür temsilleri verilerden öğrenebilme, öğrenme sistemlerinin nesneleri kendi başlarına çıkarmasına veya daha önce görülmemiş konumlarla etkileşime girmek için kullanabilecekleri nesneler ve konumlar oluşturmalarına olanak sağlama yönünde gerçek ilerleme kaydetmeye başladı. "ilişki tablosu".

Bu araştırma henüz emekleme aşamasında, ancak ilerlemesini görmek için çok hevesliyim çünkü daha yetenekli bir robota doğru ilerlemenin bu alanda daha derin bir anlayış ve önemli ilerleme gerektirdiğine inanıyorum. Aşağıdakiler dahil, özellikle ilginç birkaç makale buldum:

  • Görsel Model Tabanlı Pekiştirmeli Öğrenmede Varlık Soyutlaması (Görsel Model Tabanlı Pekiştirmeli Öğrenmede Varlık Soyutlaması)

  • Kağıt adresi: https://arxiv.org/pdf/1910.12827.pdf

Bu makale, son zamanlarda sistemin nesnelerin ne olduğunu anlamasını sağlamaya çalışan ve daha sonra öğrenilen dinamikleri kullanarak bu nesnelerin davranışını öğrenme problemlerini oluşturmak için pozitif bir şekilde simüle etmeye çalışan birkaç çalışmadan biridir. Makalede şöyle deniyordu: "OP3, varlık soyutlamasını zorlar ve gizli durumu, her biri bir parametre olarak genel varlık ile aynı işlevi kullanarak simetrik olarak işlenen yerel varlık durumlarına ayırır."

Bu çalışma henüz başlangıç aşamasındadır, ancak topluluğun ilgilenilen varlıkları sistematik olarak belirlemek için yeni öğrenim yapılarını nasıl çalışmaya ve kullanmaya devam edeceğini ve ardından bunları sonraki planlama hattında nasıl kullanacağını görmek için sabırsızlanıyorum.

Şekil 1 Bu, geleceği tahmin etmek için bu yöntemin nasıl kullanılacağını gösteren, varlık özet belgesinden bir örnektir.

  • Anlamsal Görsel Gezinme için Bayes İlişkisel Bellek (Anlamsal Görsel Gezinme için Bayes İlişkisel Bellek)

  • Kağıt adresi: https://arxiv.org/pdf/1909.04 30 6.pdf

Bu makale, anlamsal hedefleri bulmak için (örneğin, bir mutfak bulmak) bir aracı navigasyonu olarak çevrimiçi bir topoloji haritası oluşturmayı içerir. Temsilci, gezinirken periyodik olarak yeni odaları belirleyecek ve yeterince emin olduklarında onları büyüyen grafiğine ekleyecektir. Burada gerçekleştirilen tüm işlemler vizyona dayalıdır, bu da sistemin önemli ölçüde belirsizlik ve yüksek boyutlu girdilerle başa çıkması gerektiği anlamına gelir. Bu makale, ICLR 2018'de yayınlanan etkili bir makale olan "Gezinme için Yarı-parametrik Topolojik Bellek" fikrine benzer: aracının haritasını oluşturmak için ortamı önceden göstermesi gerekir.

  • Kağıt adresi: https://arxiv.org/abs/1803.00653

Önümüzdeki birkaç yıl içinde, yapay zeka araştırma topluluğunun model tabanlı ve model tabanlı olmayan teknolojiler arasındaki sınırları nasıl bulanıklaştırmaya devam ettiğini görmeyi umuyorum.

Özetle: Umarım sembolik yapay zeka ve daha "modern" derin öğrenme yöntemleri kesişebilir ve robotik topluluğunun vizyona dayalı harita yapımı, belirsizlik altında planlama ve yaşam boyu öğrenme gibi çıkarlarını çözmek için daha fazla ilerleme sağlayabilir. sorun.

3. Denetimli bilgisayarla görme araştırması

Facebook Araştırma Enstitüsü'nden Mask-RCNN'nin 2018'de yükselişinden bu yana, denetimli makine görüşü alanında özellikle ilham verici araştırma sonuçları görmedim. Bu, bu alandaki araştırmanın önemli olmadığı anlamına gelmez.

Bu alanda, anlamsal bölümleme veya nesne algılama gibi araştırma ilerlemesi oldukça olgunlaşmıştır. ImageNet Büyük Ölçekli Görsel Tanıma Mücadelesinin (ILSVRC) nesne tespiti, kademeli olarak gözden kayboldu, çünkü yalnızca şirketler (genellikle yüksek kaliteli ve zengin veri kümelerine veya finansal kaynaklara sahip) bu zorlukta iyi bir sıralama için çabalamaya isteklidir.

Ama bu kötü bir şey değil! Aslında, özellikle robotik araştırmacılar için iyi bir zaman, çünkü araştırma topluluğu böyle bir düğüm geliştirdi: araştırmacılar için mevcut olan veri setinin dışında mümkün olduğunca daha yüksek performans elde etmek ve daha fazlasını başlatmak için Dikkat Robotik araçların kapsamlı kullanımı ve bu işlemle ilişkili "kolaylık işlevleri".

Araştırma topluluğu şimdi bu sistemleri daha hızlı eğitmek ve doğruluktan ödün vermeden daha hızlı ve daha etkili hale getirmek için çeşitli yeni teknolojiler kullanıyor.

Gerçek dünyaya ilgi duyan ve bu yeni teknolojileri sıklıkla kullanan biri olarak, özellikle akıllı telefonlar ve küçük otomatik robotlar gibi kaynak kısıtlı sistemlerde bu teknolojileri kullanan araştırmalarla ilgilendiğimi görüyorum. Bu araçların ve işlevlerin daha geniş bir şekilde uygulanmasını teşvik edin.

Web damıtma açısından, bazı harika işler buna değer Dikkat : Modeli eğittikten sonra, genel performans üzerinde çok az etkisi olan sinir ağının bölümlerini silmek için optimizasyon tekniklerini kullanın.Maliyeti yalnızca hesaplama miktarını artırmaktır.

"Piyango Bilet Hipotezi: Seyrek, Eğitilebilir Sinir Ağları Bulmak" başlıklı makale, küçük sinir ağlarını başlatmak ve eğitmek için budama ihtiyacından nasıl kaçınılacağına dair bazı ilginç fikirler öne sürüyor, ancak sonuçlar henüz çok çeşitli pratik etkiler üretmedi.

  • Kağıt adresi: https://arxiv.org/abs/1803.03635

Aynı zamanda, aşağıdaki "süper harika" GitHub yayını, farklı ağ budama yöntemlerinin tam bir listesini sağlar.

  • Posta adresi: https: // github .com / he-y / Müthiş Budama # 2019

Ağ derlemesini daha da hızlandırmak için özel donanım işlevlerini kullanan ilgili teknolojiler de vardır. "FastDepth: Gömülü Sistemlerde Hızlı Monoküler Derinlik Tahmini" makalesi, monoküler derinlik tahmini görevindedir Birleştirmek Bu teknikleri kullanmanın güzel bir örneği.

  • Kağıt adresi: http : //fastdepth.mit.edu/

Dördüncü, olgun teknoloji

Yeni teknolojilerin ve yeni alanların ilerlemesi heyecan verici, ancak bu teknolojilerle ilgili araştırmalar yavaşlamaya başlıyor ve buna da değer Dikkat . Pek çok araştırma alanı ön araştırma sonuçlarına ulaştığında, araştırmanın kendisi giderek daha ilginç hale geldi ve bu alanın ilerlemesini engelleyen gerçek zorluklar gittikçe daha net hale geldiğinden, araştırmacıları bu alanda daha derin araştırmalar yapmaya teşvik edecek. çalışma.

Robotik ve makine öğreniminin kesişme noktasındaki araştırmacılar için, çoğu insanın bakış açısının, ancak teknoloji yeterince güçlü hale geldiğinde, insanların gerçekte donanım kararları için bir temel oluşturabileceklerine inanabilecekleri olduğunu görüyorum.

Beş, grafik sinir ağı

Ben grafik sinir ağlarının büyük bir hayranıyım. "İlişkisel tümevarımlı önyargılar, derin öğrenme ve grafik ağları" nın yayınlanmasından bu yana, GNN öğrenimini kendi araştırma çalışmam için bir öğrenme arka ucu olarak nasıl entegre edebileceğimi derinlemesine düşünüyordum.

  • Kağıt adresi: https://arxiv.org/abs/1806.01261

Genel fikir basittir: düğümlerin çeşitli varlıklara (nesneler, uzamsal bölgeler, anlamsal konumlar) karşılık geldiği bir grafik oluşturun ve bunları karşılıklı etkilerine göre bağlayın. Kısacası benim fikrim, en kolay tanımlanmış hedef problemi üzerinde olabildiğince çok mimari kullanmak ve ardından derin sinir ağının bu yapıya dayalı olarak varlıklar arasındaki ilişkiyi öğrenmesine izin vermektir (bu, yukarıda bahsettiğimle aynıdır. Temsil öğrenme kavramları benzerdir).

AI'da onlarca yıldır grafik modelleri kullanılmaktadır, ancak yüksek boyutlu gözlemlerle nasıl başa çıkılacağı sorunu büyük bir darboğazdır.Bir süre için, sadece manuel tasarım özelliklerinin bu sorunu başarılı bir şekilde çözebileceği görülüyor.

Ancak GNN'nin gelişiyle birlikte, yüksek boyutlu girdi artık sorun olmaktan çıktı. Geçen yıl, diğer temsil öğrenme yöntemleri (kuantum kimyası gibi) için ilginç ve zorlu hedeflere ulaşmak için GNN kullanımında patlayıcı bir büyüme gördük.

Bu yıl, grafik ağları oluşturmak ve kullanmak için kullanılan araçlar olgunlaştıkça, araştırmacılar kendi sorunlarını çözmek için GNN'yi kullanmaya başladılar ve makine öğrenimi ve robotik çapraz araştırma yönünde bazı ilginç çalışmalar gerçekleştirdiler.

GNN'yi kullanmakla ilgilenen okuyucular, DeepMind tarafından sağlanan ve çok sayıda gösterim sonucu olan Collaboratory Defterini ziyaret edebilir.

  • İlgili adres: https://colab.research.google .com /

Aynı zamanda, robotun iyi navigasyonla ilgili karar verme yetenekleriyle (özellikle çevredeki çevre hakkında yalnızca eksik bilgi aldıklarında) ve Niko Sünderhauf tarafından yayınlanan "Graph Convolutional Networks aracılığıyla Belirsizlik Altında Otonom Keşif" ve "Nerede" ile de çok ilgileniyorum vardır "Anahtarlar?" Ve diğer belgeler çok düşündürücüdür. İlgili belgeler için lütfen aşağıdaki adrese bakın:

  • Kağıt adresi: https://arxiv.org/abs/1803.03635

6. Açıklanabilir AI

Derin öğrenme ve temsil öğrenme yöntemlerinin beklentileri beni çok heyecanlandırsa da, bu teknolojiler tarafından üretilen sistemlerin anlaşılması genellikle zor. Bu sistemler yavaş yavaş insanlarla yüz yüze geldikçe anlaşılmaz özellikleri bir sorun haline gelecektir.

Neyse ki, insanların yorumlanabilir yapay zeka algısı Dikkat Derecesi kademeli olarak arttı ve bazı ilerlemeler kaydedildi ve AI yönünde insanların inanmaya ve bir arada var olmaya istekli olabileceği yönünde genel çabalar gösteriliyor.

Son zamanlarda bana neden oldu Dikkat Yorumlanabilir AI alanındaki en ilginç makalelerden biri, Duke Üniversitesi'ndeki Cynthia Rudin Laboratuvarı'nda bulunan Chenhaofan Chen ve Oscar'dır. Li " Bu Şöyle Görünüyor: Yorumlanabilir Görüntü Tanıma için Derin Öğrenme.

  • Kağıt adresi: https://arxiv.org/pdf/1806.10574.pdf

Bu makalede yazar, mevcut görüntünün hangi alanlarının diğer görüntülerde benzer alanlarla eşleştiğini belirleyerek ve ikisi arasındaki sınıflandırmayı eşleştirerek bir görüntü sınıflandırma hattı oluşturur. Bu sınıflandırma yöntemi özellikle eğitim setindeki benzer görüntülerin ve özelliklerin doğrudan karşılaştırılmasını sağladığından, bu sınıflandırma yöntemi benzer performansa sahip diğer tekniklerden daha yorumlanabilirdir.

Aşağıdaki resim kağıttan ve sistemin kil renkli serçe resimlerini nasıl sınıflandırdığını gösteriyor:

şekil 2 " Bu Şuna Benziyor: Yorumlanabilir Görüntü Tanıma için Derin Öğrenme, makaledeki görüntü sınıflandırma yöntemlerine bir örnek.

Bu yıl Cynthia Rudin, "Yüksek Riskli Kararlar için Kara Kutu Makine Öğrenimi Modellerini Açıklamayı Bırakın ve Bunun Yerine Yorumlanabilir Modelleri Kullanın" adlı kitabını da yayınladı. Kitapta, kara kutu modelinin verdiği kararları gerçeğin ardından "açıklamayı" bırakmamızı ve yapısal olarak yorumlanabilir modeller oluşturmamız gerektiğini önerdi.

Kara kutu modellerinin kullanımının derhal durdurulması gerektiğine kesinlikle katılıp katılmadığımı bilmiyorum, ancak makalesinde kara kutu modellerinin geliştirilmesinin ana akım olduğu mevcut AI alanı için çok önemli olan bazı tamamen makul noktaları ortaya koydu.

  • Kağıt adresi: https://arxiv.org/pdf/1811.10154.pdf

Geçen yıl, arkadaşım ve meslektaşım Leilani H. Gilpin ve Cecilia Testart'ın yazdığı "Topluma Açıklamaları Açıklamak" gibi, toplum için ne tür bir model açıklamasının en yararlı olduğunu incelemeye adanmış bazı iyi çalışmalar yapıldı. Ve mevcut derin öğrenme sistemlerinin çıktı sonuçlarının sınırlamaları gibi ilgili sorunları nasıl çözeriz.

  • Kağıt adresi: https://arxiv.org/pdf/1901.06560.pdf

Kısacası, 2019'dan bu yana en büyük kazanımlarımdan biri, özellikle araştırmacıların, modeller geliştirdiğimizde ve sistemler kurmaya çalıştığımızda, onları olabildiğince yorumlanabilir şekilde tasarlamamız gerektiğinin farkında olmaları gerektiğidir.

Kısa bir süre önce "Deepmind's Alphazero and the Real Word" yazdım.Onda bahsedilen uygulamalardan bazılarıyla çok ilgileniyorum.Araştırma topluluğundaki daha fazla insanın yorumlanabilir sistem tasarımına öncelik vermesini umuyorum.

  • Kağıt adresi: http : // www. cachestocaches .com / 2018/12 / doğru-gerçek-alfazero / # bilinmeyen-ortamlarda gezinme

7. Simülasyon araçlarının sürekli büyümesi ve simülasyondan gerçeğe geçiş

Veriler yeterince çeşitli değilse, simülasyon çok kullanışlı bir araçtır çünkü veriler ucuz ve etkilidir.

2018'de, gerçek dünya işlevlerini gerçekleştirmek için doğrudan kullanılması amacıyla, çoğu gerçek ortamı simüle ederek birçok gerçekçi görüntü sağlayan çok sayıda simülasyon aracı ortaya çıktı.

Bu ortamlar arasında ultra büyük ölçekli, çok sensörlü, gerçekçi iç mekan veri seti InteriorNet ve GibsonEnv "1447 kat ve toplam 211.000 metrekarelik alandan oluşan 572 tam bina" veri seti yer alıyor.

Bu yıl, bu alandaki çocuklar, yeni etkileşimli Gibson ortamı ve Facebook tarafından yayınlanan şaşırtıcı AI Habitat ortamı da dahil olmak üzere gelişmeye devam etti.

Gerçek dünyada, giderek daha fazla simülasyon aracı teknolojisi ortaya çıktı ve iyi performansa ulaşabilir. Alan rastgele seçiminde, simüle edilen sahnenin öğeleri (doku, ışıklandırma, renk, vb.) Rastgele değiştirilir, bu nedenle öğrenme algoritması genellikle alakasız olan ayrıntıları görmezden gelmeyi öğrenir. Elbette, etki alanı randomizasyonunun olasılıkları hakkında hiçbir zaman (tamamen) iyimser olmadım.

Pek çok robot uygulaması için, belirli dokular ve ışıklandırma aslında planlama için çok önemli olabilir ve belirli alan teknolojileri daha uygun ve rasgele hale getirilebilir, örneğin bazı veri geliştirme işlemleri, kendi problemlerinden bazılarını ortaya çıkarabilir. Geçtiğimiz yıl araştırmacıların çabaları ("Sim-to-Real via Sim-to-Sim" makalesi dahil) ve bu teknolojilerin performansı iyileştirmek için çeşitli alt alanlarda yaygın olarak kullanılması, bana izin verin. Bu teknolojilerin pratikliğine inanıyorum.

  • Kağıt adresi: https://arxiv.org/pdf/1812.07252.pdf

OpenAI ayrıca yapay zekanın Rubik Küpü'nü çalıştırmayı öğrenmesine izin vermek için görsel görünüme ve fiziğe etki alanı randomizasyonu uygulayarak robot ellerinin insanlarımızdan çok daha esnek olduğunu kanıtlıyor.

  • Kağıt adresi: https: // openai .com / blog / çözme-rubiks-cube /

Bu bağlamda, 2019 RSS konferansında "Robotik Manipülasyon için Sim2real Transferde Gerçeklik Açığını Kapatma Çalıştayı" nda bir makale. Okumaya değer, okuma adresi aşağıdaki gibidir:

  • Kağıt adresi: https://sim2real.github.io/

Geçen yıl, randomizasyona ek olarak, çeşitli alanlar arasında bilgi aktarımı yapan etki alanına uyarlanabilir algoritmaların çalışılmasında bazı ilerlemeler kaydedildi. "Sim-Gerçek Döngüyü Kapatmak: Simülasyon Randomizasyonunu Gerçek Dünya Deneyimiyle Uyarlamak" gibi işlerle özellikle ilgileniyorum Makale, RL aracısının simülasyondaki deneyimini ayarlamasını sağlamak için bazı gerçek dünya muhakemeleri kullanıyor.

  • Kağıt adresi: https://arxiv.org/pdf/1810.05687.pdf

Sekiz, acı tatlı ders

"Acı dersler" hakkında bir tartışma yoksa, 2019'daki yapay zeka tartışması eksik kalacaktır.

Yapay zeka endüstrisinde saygın ve tanınmış bir araştırmacı olan Rich Sutton, insanlar tarafından tasarlanan bu model tabanlı yöntemlerin yapay zekanın tarihsel gelişiminde ve kariyerinde nasıl tekrarlandığını tartışmak için web sitesinde bir blog yazısı yayınladı. Derin öğrenme gibi modele dayalı olmayan yöntemlerle değiştirildi.

Nesne tespiti için "SIFT" özellik algoritmasını örnek olarak gösterdi "SIFT" özellik algoritması 20 yıldır popüler olmasına rağmen, derin öğrenme algoritmanın elde ettiği tüm sonuçları kolayca alabilir.

O devam etti:

Bu önemli bir ders. Yapay zeka alanında, aynı hataları yapmaya devam ettiğimiz için hala tam olarak anlamıyoruz. Bu hataları görmek ve etkili bir şekilde önlemek için, bu hataların arkasındaki teşvikleri anlamalıyız. Acı veren dersi öğrenmeliyiz: Uzun vadede, fikirlerimizi temel alan düşünme tarzımızın işe yaramayacağına dair ağır dersi almalıyız. Acı veren dersler tarihsel gözlemlere dayanmaktadır: 1) Yapay zeka araştırmacıları genellikle aracılarına bilgi (aracıya) eklemeye çalışırlar; 2) Bu kısa vadede yararlıdır ve araştırmacıları memnun eder , Ama 3) Uzun vadede, bu, araştırmayı durduracak ve hatta daha fazla gelişmeyi engelleyecektir ve 4) Bununla birlikte, nihai atılım ilerlemesi, çoğu kez benimsenmesine dayanan tamamen zıt yöntemden kaynaklanmaktadır. aramak Ve ölçeklendirme hesaplama yöntemini öğrenmek. Algoritmanın başarısı kişisel tercihlere ve insan merkezliliğe dayandığından, nihai sonuç genellikle acıyla doludur ve genellikle insanlar tarafından tam olarak kabul edilmez. Acı veren dersten öğrenilmesi gereken bir şey şudur: genel yöntemler (örneğin aramak Ve iki yöntemi öğrenmek) çok güçlüdür, mevcut hesaplamalar çok büyük olsa bile, hesaplama miktarı arttıkça bu yöntemler genişlemeye devam edecektir.

  • https://staff.fnwi.uva.nl/m.welling/wp-content/uploads/Model-versus verileri-AI-1.pdf

Benim fikrim? Öğrenme algoritmalarımızda her zaman bazı ön varsayımlar vardır ve verilerin ve öğrenme özelliklerinin genelleme yeteneklerine nasıl dönüştürüldüğüne dair sadece biraz anlayışa sahibiz.

Temsili öğrenme ve derin öğrenmenin klasik planlama teknikleriyle kesişimi konusunda bu kadar heyecanlanmamın nedenlerinden biri budur. Yapay zeka sistemi, yalnızca ajanın bilgiyi yeniden kullanma yeteneğinin nasıl kodlanacağını açıkça ifade eden kod aracılığıyla, karmaşık çok sıralı planlama görevlerinde güvenilir genelleme elde etmeyi umabilir. Yapay zekanın insanlar gibi kombinatoryal genelleme yeteneklerini gösterebilmesini ve veri setlerini katlanarak artırmadan etkili genelleme yapmasını beklemeliyiz.

Dokuz, sonuç

2019'da AI alanında çok fazla ilerleme kaydedilmiş olsa da, önümüzdeki birkaç yıl içinde büyümek için hala birçok olgun alan olacak. Yapay zeka teknolojisinin, temsilcinin geleceği tahmin edebilmesi için çevresini derinlemesine anlamasını gerektiren daha "kısmen gözlemlenebilir alanlarda" uygulanmasını umuyorum Bu, aktif olarak araştırdığım bir şey.

Ayrıca ömür boyu yapay zeka olarak adlandırılan yapay zekanın, yani sistem çevreleyen çevreyle etkileşimde bulunmak için daha fazla zaman harcadığında öğrenmeye ve büyümeye devam edebilen YZ'nin daha fazla ilerleme sağlayabileceğini görmeyi seviyorum.

Şu anda, gerçek dünya ile etkileşime giren birçok sistemin gürültüyle zarif bir şekilde başa çıkması zordur ve sensör verilerinin artmasıyla, en basit uygulamalar dışında bu gürültü işleme yöntemleri çoğu öğrenme modelinde başarısız olacaktır.

Yazarın Notu: Bu makale şüphesiz bu alandaki bireysel örneklere dayalı ilerlememdir ve her şeyi etkili ve kapsamlı bir şekilde ele almak imkansızdır. Jeff Dean'in "Deep_Learning_for_Solving_Important_Problems" bölümünde belirttiği gibi, Machine Learning ArXiv'de her gün yaklaşık 100 makine öğrenimi makalesi yayınlanıyor.

Aynı zamanda, bu çalışmaların hangi yönleriyle bu alandaki ilerlemeyi teşvik ettiği görüşüm herkesten farklı olabilir.

Today Paper | Haber öneri sistemi; çok kanallı kodlama; bilgi ile zenginleştirilmiş ön eğitim modeli vb.
önceki
DeepMind açık kaynak AlphaFold, protein tahmin modeli "Nature" üzerinde
Sonraki
AAAI 2020 | Bilgisayar Teknolojisi Enstitüsü'nden WeChat AI: Eğitim hedeflerini iyileştirin ve otoregresif olmayan modellerin (açık kaynaklı) çeviri kalitesini iyileştirin
Bayesci sinir ağları anlamsız mı? Barut dolu Twitter ve Reddit ikili savaş alanı tartışması
ICLR 2020 | 15.000 sinir ağını eğitin, NAS'ı hızlandırın ve aramayı yalnızca 0,1 saniyede tamamlayın
AAAI 2021 konferansının yeni başkanı olarak, Profesör Yang Qiang'ın düşündüğü "makine öğreniminin sınır sorunları" nelerdir?
AAAI 2020 | Kuaishou: Görüntü estetiğinin değerlendirmesini yeniden inceleyin ve vurguların odağını bulun
Yapay sinir ağı çok ilkel. "Bilim" in yeni çalışması, nöronların dendritlerinin aynı zamanda hesaplama gücü anlamına geldiğini ortaya koyuyor.
Deep Transformer, NLP'de nasıl etkin bir şekilde kullanılır?
Paper Today | Küçük örnek öğrenme; görsel duyarlılık sınıflandırması; sinir mimarisi araması; doğal görüntü anahtarlama vb.
2020'de AI akademik topluluğunda ani bir tartışma: Derin öğrenme nedir?
AAAI 2020 | Pekin Üniversitesi ve Şanghay Jiaotong Üniversitesi: Aktif hedef takibi elde etmek için tutum destekli çoklu kamera işbirliği
Kalp Atışı Anormalliği Tespit Yarışması: 2020'de sağlığa bir adım daha atın
Today Paper | Sivrisinek çağrısı veri seti; konuşma tanımanın doğruluğunu artırın; ikili dikkat öneri sistemi vb.
To Top