"Blockbuster" AI otomatik olarak makine öğrenimi sistemlerini geliştirir, DeepMind algoritmaların takviye öğrenmeyi öğrenmesine izin verir (kağıtlarla)

1Xinzhiyuan Orijinal

2011 yılında Silikon Vadisi'nin en etkili teknoloji yatırımcısı olan Marc Andreessen, "Yazılım Neden Dünyayı Yiyor" yazısıyla sektörü şok etti. Altı yıl sonra, mobil, bulut bilişim ve büyük verinin üç ana teknolojik dalgası birçok sektörü büyük ölçüde değiştirdi.

Yeni bir teknoloji dalgası vurdu ve bu yapay zeka. Son yıllarda, yapay zeka yetenekleri için verilen savaş yoğunlaştı ve makine öğrenimi uzmanlarının maaşları şaşırtıcı bir seviyeye yükseldi.

ancak, En iyi yapay zeka uzmanları, son zamanlarda en zor işlerinden birinin Makine öğrenimi sisteminin tasarımı da yapay zeka sistemi aracılığıyla otomatik olarak yapılabilir. .

Google'ın son zamanlarda AI Frontiers konferansındaki teknoloji tanrısı Jeff Dean'e göre, yapay zeka alanındaki sorunları çözmek için gereken şey makine öğrenimi teknolojisi, hesaplamalar ve verilerdir. Bu teknolojiye olan talebin kendisini azaltabilir miyiz? Bunun mümkün olduğunu düşündü. "Otomatikleştirilmiş makine öğrenimi" yönü, geldiği Google Brain ekibinin aktif olarak araştırdığı en umut verici alanlardan biridir.

Ve DeepMind'in araştırması, bu alandaki ilerlemenin derin öğrenme sisteminin gerektirdiği veri miktarını da azaltabileceğini buldu. Bu, sürücüsüz arabalar gibi senaryolarda çok kullanışlıdır.

Yoshua Bengio, mevcut araştırmanın çok fazla bilgi işlem gücü gerektirdiğine işaret etti (Google Brain'in deneyi 800 yüksek yapılandırmalı GPU kullanıyor), bu yüzden pratik değil. Ama bu gerçekten heyecan verici bir yön.

18 Ocak'ta Tom Simonite, Google Brain, OpenAI, MIT, Berkeley ve DeepMind'den öğrenmeyi öğrenme alanındaki en son araştırma sonuçlarını toplayan "MIT Technology Review" da "AI Software Learns to Make AI Software" adlı bir makale yayınladı.

TechCrunch tarafından yazılan aşağıdaki makale, birçok senaryoda, AI sistemi tarafından geliştirilen AI sisteminin insan uzmanları yakaladığı veya hatta onları geçtiği sonucuna vardı. Bu, AI teknolojisinin demokratikleşmesini büyük ölçüde hızlandıracak. Kıt insan araştırma kaynakları da serbest bırakılabilir ve daha önemli konuları incelemeye çevrilebilir.

Daha sonra, bu alanda ne kadar ilerleme kaydedildiğini görmek için ilgili belgeleri birlikte derinlemesine analiz edeceğiz.

Algoritmanın kendi kodunu yazmasına izin verin

Berkeley'den Ke Li ve Jitendra Malik, yakın zamanda gönderdikleri "Optimize Etmeyi Öğrenmek" başlıklı makalesinde önerdiler Algoritmanın kendi kendini optimize etmesine izin verin Yöntemler. Makalenin özetinde, "Algoritma tasarımı, genellikle çok sayıda yinelemeli düşünme ve doğrulama gerektiren zahmetli bir süreçtir. Bu makalede, otomatik algoritmaların tasarımını tartışıyor ve otomatik optimizasyon algoritmalarını öğrenmek için bir yöntem öneriyoruz." Takviye öğrenme perspektifinden başlayarak, Ke Li ve Jitendra Malik, yapay zekanın algoritmaları optimize etmeyi öğrenmesine izin vermek için rehberli strateji araştırması kullandılar ve tasarlanan algoritmalarının yakınsama hızı ve / veya nihai hedef değer açısından mevcut manuel programlama geliştirmeden üstün olduğunu kanıtladılar. Algoritma.

Algoritmaların kendi kodlarını yazmalarına izin verme çabaları akademide bitmiyor. Ünlü yabancı bilim ve teknoloji muhabiri Steven Levy, geçtiğimiz Haziran ayında BackChannel'da yayınlanan "Google Kendini Nasıl" Önce Makine Öğrenimi "Şirketi Olarak Yeniden Düzenliyor? Başlıklı makalesinde bahsetti. Ardından, Google Brain'in başkanı Jeff Dean, Google'ın altyapısını şimdi yeniden yazacak olsaydı, kodun çoğunun insanlar tarafından kodlanmayacağını, ancak makine öğrenimi tarafından otomatik olarak oluşturulacağını söyledi.

Jeff Dean, "Daha önce, sistemin birkaç alt bileşeninde makine öğrenimini kullanabilirdik," dedi: "Artık her parça için daha iyi bir makine öğrenimi modeli yapmaya çalışmak yerine, tüm sistemi değiştirmek için makine öğrenimini kullanıyoruz. "

Google'ın kod hatası tahmin sistemi bir puanlama algoritması kullanır ve taahhütler eskidikçe, değerleri gittikçe küçülür.

Google, bir kod satırının kusurlu olup olmadığını belirlemek için makine öğrenimi ve istatistiksel analizi kullanan bir hata tahmin programı geliştirdi.

Bir Google mühendisi ve W3C eş başkanı Ilya Grigorik de, yaklaşık 30.000 kez indirilen hata tahmin aracının açık kaynaklı bir sürümünü geliştirdi. Açık kaynak adresi: https://github.com/igrigorik/bugspots

Ajanın sinir ağını tasarlamasına izin verin

Yaklaşık aynı zamanda, MIT Media Lab'den araştırmacılar Otomatik olarak sinir ağı mimarisi oluşturun Yöntemler. "Takviyeli Öğrenmeyi Kullanarak Sinir Ağı Mimarileri Tasarlamak" başlıklı makalede Bowen Baker ve diğerleri, evrişimli bir sinir ağı (CNN) mimarisinin mevcut tasarımının insan uzmanlığı ve emeği gerektirdiğini ve yeni bir mimari tasarımının çok sayıda deney ve manuel kodlama gerektirdiğini öne sürdü. Bazı mevcut ağ mimarileri değiştirildi.

Bu amaçla, belirli bir öğrenme görevi için otomatik olarak yüksek performanslı bir CNN mimarisi oluşturmak için pekiştirmeli öğrenmeye dayalı bir meta modelleme yöntemi önerdiler. Aracı, olası mimarileri aşar ve öğrenme görevlerinde iyileştirilmiş performansa sahip tasarımları yinelemeli olarak keşfeder. Görüntü sınıflandırma karşılaştırmasında, aracı tarafından tasarlanan ağ (yalnızca standart evrişimli katman, havuzlama katmanı ve tamamen bağlı katmandan oluşan), aynı katman türü ile tasarlanan mevcut ağdan daha iyi performans gösterir. Yapı ile karşılaştırıldığında sonuçlar da karşılaştırılabilir.

Öğrenme algoritmasını tekrarlayan bir sinir ağı olarak temsil edin

OpenAI'nin bu konudaki çabalarından bahsedeyim.

Kısa bir süre önce sunulan "RL2: Yavaş Güçlendirmeli Öğrenme Yoluyla Güçlendirmeli Öğrenme" başlıklı makalede, Yan Duan ve OpenAI'den diğerleri, Öğrenme algoritmasını tekrarlayan bir sinir ağı olarak temsil edin (RNN) ve verilerden öğrenin . Bu yönteme RL2 adı verilir ve araştırmacılar, algoritmanın RNN'nin ağırlıklarında kodlanmasına izin verir ve genel "yavaş" ("yavaş") RL algoritması aracılığıyla yavaşça öğrenir (baştan "hızlı" bir RL algoritması tasarlamak yerine) .

RNN, gözlemler, eylemler, ödüller ve sonlandırma işaretleri dahil olmak üzere tipik bir RL algoritmasının alabileceği tüm bilgileri alır RNN, durumunu belirli bir Markov Karar Sürecinde (MDP) korur. RNN'nin aktivasyonu, mevcut MDP'deki "hızlı" RL algoritmasının durumunu depolar. OpenAI'nin araştırma lideri Ilya Sutskever ve Berkeley'den Pieter Abbeel de makalenin yazarları.

Derin pekiştirmeli öğrenme (derin RL), karmaşık davranışları otomatik olarak öğrenmede başarılı olmuştur. Ancak, bu öğrenme süreci çok fazla deney gerektirir. Bunun aksine, dünya hakkında önceden bilgi sahibi olunması sayesinde, hayvanların yeni görevleri öğrenmek için yalnızca birkaç deneye ihtiyacı vardır. Bu makale, bu boşluğu doldurmaya çalışmaktadır.

Araştırmacılar, RL2'nin küçük ve büyük ölçekli problemlerdeki performansını değerlendirmek için deneyler kullandılar. "Küçük ölçekli problemlerde, onu rastgele oluşturulmuş çok kollu haydut problemlerini ve sınırlı MDP'yi çözmesi için eğitiyoruz. RL2 eğitildikten sonra, yeni MDP problemlerindeki performansı insanlar tarafından tasarlananlara yakın. Optimal algoritma. Büyük ölçekli problemler için, RL2'yi vizyona dayalı bir gezinme görevi ile test ediyor ve yüksek boyutlu problemlere genişletiyoruz. "

DeepMind çok çalışıyor: öğrenebilen ve akıl yürütebilen bir makine oluşturmak için pekiştirmeli öğrenmeyi kullanmak

Nöral Program Tercümanı (NPI)

2015 yılında, DeepMind ekibi, basit programları kendi başına öğrenip düzenleyebilen bir "Sinirsel Programlama Tercümanı" (NPI) geliştirdi ve sıralama genelleştirme yeteneği de diziden diziye LSTM'den daha yüksek. Bu araştırmayı anlatan "Nöral Programcı-Tercümanlar" makalesi, ICLR'16'nın en iyi makalesi olarak seçildi.

NPI, programları karakterize etmeyi ve yürütmeyi öğrenebilen özyinelemeli bir sentetik sinir ağıdır. NPI'nin çekirdek modülü, LSTM'ye dayalı bir dizi modelidir Bu modelin girdisi, öğrenilebilir bir program yerleştirmeyi, çağıran program tarafından geçirilen program parametrelerini ve ortamın karakterizasyonunu içerir. Bu çekirdek modülün çıktısı, daha sonra hangi programın çağrılacağını belirten bir anahtar, klasik bir algoritma programının bir parametresi ve programın durup durmayacağını belirten bir bayrak içerir. Yinelemeli çekirdeğe ek olarak, NPI çerçevesi ayrıca öğrenme programları için gömülü bir anahtar-değer belleği içerir. Bu program-bellek yapısı, programların sürekli öğrenilmesi ve yeniden kullanılması için son derece önemlidir.

Farklı uzunluklardaki dizileri sınıflandırmak için NPI ve diziden diziye LSTM'nin doğruluğu karşılaştırılır En uzun dizi 20 dizi içerir.

NPI, öğrenme yeteneklerine sahip üç bölümden oluşur: biri bilinmeyen görevlere sahip özyinelemeli bir çekirdek, diğeri sürekli anahtar-değer program belleği ve üçüncüsü, belirli bir alana dayalı bir kodlayıcıdır.Bu kodlayıcı, algısal olarak farklı birçok ortamda tek bir tane oluşturabilir. NPI çok farklı işlevler sağlar. NPI, üst düzey programları ifade etmek için düşük düzeyli programları sentezleyerek, örnek karmaşıklığını azaltır ve diziden diziye LSTM'ye göre genellemesi daha kolaydır. Mevcut programlar temelinde inşa ederek, program belleği ek görevleri verimli bir şekilde öğrenebilir. NPI, ortamı hesaplamaların ara sonuçlarını önbelleğe almak için de kullanabilir, böylece yinelemeli gizli birimin uzun vadeli depolama yükünü azaltır.

O zamanlar, DeepMind ekibi NPI'yi eğitmek için denetimsiz öğrenme yöntemlerini kullanmıyordu ve modeli, yalnızca 3B modellerin eklenmesi, sıralanması ve düzenli hale getirilmesi gibi bir dizi basit prosedürü sentezlemeyi öğrenebiliyordu. Bununla birlikte, tek bir NPI bu prosedürleri ve ilişkili 21 alt rutinin tamamını uygulamayı öğrenebilir.

Diferensiyellenebilir Bilgisayar (DNC)

Ekim 2016'da, Google DeepMind ekibi Nature'da tasarladıkları farklılaştırılabilir sinir bilgisayarı (DNC) sinir ağı modelini açıklayan bir makale yayınladı. DNC, sinir ağlarını ve okunabilir ve yazılabilir harici belleği birleştirir, deneme yanılma yoluyla öğrenebilir veya sinir ağları gibi örnek eğitim alabilir ve geleneksel bilgisayarlar gibi verileri işleyebilir.

Deneyde DNC, soy ağacını anlayabilir, iki Londra Metro istasyonu arasındaki en hızlı rotayı önceden bilgi sahibi olmadan hesaplayabilir ve bulmaca labirentini çözebilir. Alman araştırmacı Herbert Jaeger, bunun şu anda dijital bir bilgisayara en yakın sinirsel hesaplama sistemi olduğunu ve bu sonucun sinirsel sembol işleme sorununu çözmesinin beklendiğini söyledi.

DNC mimarisi

Yazar, makalenin özetinde, tıpkı geleneksel bilgisayarlar gibi, DNC'nin karmaşık veri yapılarını temsil etmek ve işlemek için harici belleği kullanabileceğini, ancak aynı zamanda, sinir ağları gibi, bunu veriden öğrenebileceğini yazdı. "Denetimli öğrenme ve eğitimi kullandıktan sonra, DNC yapay olarak sentezlenmiş soruları başarıyla yanıtlayabilir ... Belirli noktalar arasındaki en kısa rotayı bulmayı öğrenebilir, rastgele oluşturulmuş grafiklerden eksik bağlantıları ve diğer görevleri çıkarabilir ve ardından bu yeteneği genelleştirebilir Trafik rotası haritaları, şecere vb. Gibi belirli haritalar için kullanılır. Pekiştirme öğrenme eğitimini kullandıktan sonra, DNC, sembol dizisinin sürekli değişen bir oyun hedefi vereceği hareketli bulmacalardan oluşan bir bulmaca oyununu tamamlayabilir. Özetle, sonuçlarımız gösterilir. Bu nedenle DNC, harici okunabilir ve yazılabilir bellek olmadan sinir ağları için zor olan karmaşık ve yapılandırılmış görevleri çözme yeteneğine sahiptir. "

Derin meta-pekiştirmeli öğrenme

Son zamanlarda, DeepMind araştırmacıları, "Pekiştirmeyi öğrenmeyi öğrenme" algoritmasını önermek için UCL sinirbilimcileriyle de işbirliği yaptılar. Son yıllarda, derin pekiştirmeli öğrenme (RL) sistemleri, birçok zorlu görev alanında insanüstü performans elde etti. Bununla birlikte, bu tür uygulamaların temel sınırlaması, büyük miktarlarda eğitim verisine ihtiyaç duymalarıdır. Bu nedenle, mevcut temel hedef, yeni görevlere hızla adapte olabilen derin DL yöntemleri geliştirmektir.

"Mevcut çalışmamızda, bu zorluğun üstesinden gelmek için yeni bir yöntem getirdik. Derin meta-pekiştirmeli öğrenme . Önceki çalışma, yinelemeli ağların (RNN) tam denetimli bir bağlamda meta öğrenmeyi destekleyebileceğini göstermiştir. Bu yöntemi RL ayarlarına genişletiyoruz. Buradan çıkan şey, bir RL algoritması ile eğitilmiş bir sistemdir, ancak yinelemeli gücü tamamen bağımsız başka bir RL sürecinden gelir. Bu bağımsız, öğrenilmiş RL algoritması, herhangi bir şekilde orijinal algoritmadan farklı olabilir. Daha da önemlisi, eğitim yoluyla öğrenildiği için bu algoritma, eğitim alanındaki yapıyı kullanmak üzere yapılandırılmıştır. "

Makale, araştırmacıların yukarıdaki noktaları, her biri derin meta-RL'nin önemli bir yönünü inceleyen yedi kavram kanıtı deneyinden oluşan bir seride gösterdiklerini açıklıyor. Ayrıntılar için https://arxiv.org/pdf/1611.05763v2.pdf okuyabilirsiniz (makalenin sonundan indirin)

Makine öğrenimi geliştiren programcılar işsizlik riskiyle karşı karşıya mı?

Makine bu adıma ulaştığında, yazılımın rol oynayabileceği tüm alanlarda yıkıcı bir değişim yaşayacaktır. .

Yapay zekanın temel zorluklarından biri, makinelere yeni programları öğrenmeyi, mevcut programlardan hızlı bir şekilde yeni programlar yazmayı ve çok çeşitli görevleri çözmek için bu programları belirli koşullar altında otomatik olarak çalıştırmayı öğretmektir.

Bu, makine öğrenimini geliştiren programcıların bile işlerini kaybetme tehlikesiyle karşı karşıya olduğu anlamına mı geliyor?

Cevap hayır, en azından şimdilik - eşdeğer performansa sahip veya insan tasarımını aşan bir makine öğrenimi programı oluşturmak için çok fazla bilgi işlem gücü gerekir. Örneğin, Google Brain bir görüntü tanıma sistemi geliştirmek için AI kullanır. İnsanları yenmesine rağmen, çok büyük GPU kümeleri, bu birçok anlamda önemli bir ek yüktür.

Ancak buna rağmen, AI yazılımı geliştirmek için AI kullanmanın avantajları çok açıktır ve büyük miktarda kaynak ek yükü çeşitli yöntemlerle azaltılabilir. Makine öğrenimi sistemleri geliştirmenin ağır görevini makinelere devretmek, bu alandaki uzmanlığa sahip ciddi yetenek eksikliğini çözmeye yardımcı olacaktır. Yapay zeka endüstrisi uzmanları, makine öğrenimi yazılımının geliştirilmesinin başlangıçtan itibaren büyük bir insan gücü yatırımı gerektirdiğini, ancak işin bir kısmını diğer makine öğrenimi sistemlerine devretmenin başlangıç ve tüm süreç için gereken insan gücünü büyük ölçüde azaltabileceğini belirtti.

Şu anda, akademi ve girişimlerden makine öğrenimi yeteneklerini toplama savaşı yoğunlaşıyor. Buna ek olarak, makinelerin kendi makinelerini tasarlamasına izin vermek, insan araştırmacıları zamanlarını büyük veri kümeleri kullanarak yapay zeka sistemlerini tekrar tekrar eğitmek yerine daha önemli sorunları çözmek için harcamaları için serbest bırakabilir.

Yapay zekanın yapay zekayı sürekli olarak optimize etmesine izin vermenin başka bir potansiyel faydası daha vardır; bu, yapay zeka sisteminin öğrenme eğrisini iyileştirmektir, bu da anlamlı sonuçlar üretmek için gereken veri miktarını azaltabilir. Bir yandan bu, kendi kendini süren otomobil sistemleri gibi endüstrilerin gelişimini büyük ölçüde desteklemeye yardımcı oluyor - otonom sürüş teknolojisinin geliştirilmesi için, seyahat edilen milyonlarca mil yalnızca gerçek dünya verilerini toplamanın başlangıcı olarak kabul edilebilir - diğer yandan Yapay zeka ürünleri için pazarlama süresini büyük ölçüde kısaltacaktır.

Ancak bunların tümü, makine öğrenimi teknolojisinin algoritmalarla yer değiştirmesi olasılığını ortadan kaldıramaz.

[Xinzhiyuan'ın resmi hesabını girin, makalede bahsedilen makaleyi indirmek için iletişim kutusuna "0124" girin]

Referans

  • https://techcrunch.com/2017/01/19/ai-software-is-figuring-out-how-to-best-humans-at-designing-new-ai-software/

  • https://arxiv.org/pdf/1606.01885v1.pdf

  • https://arxiv.org/pdf/1611.02779v2.pdf

  • https://arxiv.org/pdf/1611.05763v2.pdf

  • https://arxiv.org/pdf/1611.02167v2.pdf

  • https://arxiv.org/pdf/1511.06279v4.pdf

  • Xinzhiyuan İşe Alım

    Operasyon Direktörü

    Yıllık maaş pozisyonu: 360.000-500.000 (maaş + ikramiye)

    İş yeri: Pekin-Haidian Bölgesi

    Departman: Operasyon Departmanı

    Raporlama nesnesi: COO

    Astların sayısı: 2

    Yaş gereksinimi: 25 ila 35 yaş arası

    Cinsiyet gereksinimleri: sınırsız

    Çalışma yılları: 3 yıldan fazla

    Dil: İngilizce seviye 6 (denizaşırı geçmiş tercih edilir)

    iş tanımı

  • Büyük ölçekli fuar sponsorlarından ve katılımcılardan, potansiyel müşterilere, vb. Genişleme, dokunma, yapay zeka ve robotik endüstri yönü sorumlusu

  • Pazarları açmada ve potansiyel müşterilerle iyi kişiler arası ilişkiler kurmada iyidir

  • Yapay zeka ve robotik endüstrisi ile ilgili piyasa koşullarının derinlemesine anlaşılması ve pazar trendlerini yakından takip edin

  • Departmanlar arasında proje işbirliğini aktif olarak koordine edin, departmanlar arası işbirliği organize edin ve iyi bir etkiye sahip olun

  • Ekibe satış hedefini tamamlamak ve proje durumunu izlemek ve yönetmek için liderlik edin

  • Şirketin platform operasyonları için stratejik planların ve işbirliği planlarının formülasyonundan ve uygulanmasından sorumlu

  • iş gereksinimleri

  • Lisans derecesi veya üstü, yüksek lisans derecesi tercih edilir, yüksek İngilizce iletişim becerileri gereklidir

  • 3 yıldan fazla iş geliştirme deneyimi, ekip yönetimi deneyimi, işletme departmanının genel yönetimine aşina

  • Geleneksel halkla ilişkiler, geleneksel entegre iletişim genel planları ve stratejik genel planlar hakkında derinlemesine bilgiler

  • Keskin pazar bilgisi ve doğru müşteri analizi yetenekleri, güçlü ekip yönetimi yetenekleri ile

  • Mükemmel zaman yönetimi, stres direnci ve çoklu görev planlama ve yürütme yeteneklerine sahip olun

  • TMT alanında geniş ağ kaynakları, Parti A'nın pazarlama departmanında çalışma deneyimi tercih edilir

  • Medya reklamcılığı departmanı, pazarlama departmanı, ilk20 halkla ilişkiler şirketi pazar geliştirme departmanı tercih edilir

  • Xinzhiyuan, yüksek ideallere sahip kişilerin görüşmeye gelmesini memnuniyetle karşılıyor. Daha fazla işe alım pozisyonu için lütfen Xinzhiyuan'ın resmi hesabını ziyaret edin

    RMB arka arkaya on düşüşünün sonuna kadar hangi sinyali gönderiyor? Renminbi'yi tahmin eden yarı analist bir tahminde bulunur
    önceki
    Şeyler değerlidir! Hangi tanıdık altı silindirli modeller sessizce yanınızda kalıyor?
    Sonraki
    Fil Derneği'nden Huang Zhangjin: Derinlemesine uzun metin nasıl afyona benziyor?
    Dünyadaki birçok ülke İran'a ödeme yapmak için ABD doları kullanamayabilir ve Çin'in petrol fiyatları 8 yuan dönemine girebilir
    İkinci el araba alırken dolandırılmayı önlemek için hangi detaylara dikkat edilmelidir!
    "Temmuz ve Ansheng" in drama versiyonu burada çekildi, Zhejiang'daki küçük bir ilçe, Ulusal Günde kısa bir gezi için en iyi yer.
    Gelecek korkunç değil, anlamazsan korkunç olacak İnsan 2.0
    2018'deki en tehlikeli gizli fotoğraf, mutsuzluğumu iyileştirdiğini izledikten sonra
    Elde tutma oranının altı kuralı, size her zaman söyleyin
    Lakeside Üniversitesi'nden Jiang Nanchun: Ana akımı takip etmektense, ana akım olmak daha iyidir
    Acemi İpuçları: Lastiğin üretildiği tarihi nasıl görebilirim?
    40 yıllık zaman hikayesinde var mı?
    Lanchi Ventures Zhu Tianyu: 10 yıllık bir ölçekte AI girişimciliğine bakış, tek boynuzlu atların nasıl keşfedileceği Xinzhiyuan Röportajı
    Otomobil fuarında araba satın alma indirimi büyük mü? Beklemeye değer mi?
    To Top