Makinelere otonom öğrenme becerisinin nasıl kazandırılacağı, yapay zeka alanında her zaman bir araştırma noktası olmuştur. Gittikçe daha karmaşık gerçek dünya senaryolarında, büyük ölçekli girdi verilerinin soyut temsillerini otomatik olarak öğrenmek için derin öğrenme ve geniş öğrenmenin kullanılması gerekir ve problem çözme stratejilerini optimize etmek için bu temsile dayalı kendi kendini motive eden pekiştirmeli öğrenmeye ihtiyaç vardır. Oyunlar, robot kontrolü, parametre optimizasyonu ve makine görüşü alanlarında derinlik ve genişlik güçlendirme öğrenme teknolojisinin başarılı bir şekilde uygulanması, genel yapay zekaya doğru ilerlemenin önemli bir yolu olarak görülmesini sağlamıştır.
Çin Otomasyon Topluluğu, 31 Mayıs - 1 Haziran 2018 tarihleri arasında Çin Bilimler Akademisi Otomasyon Enstitüsünde Akıllı Otomasyon üzerine 5. Sınır Çalıştayı düzenleyecektir. Konusu "Derin ve Genişlik Güçlendirmeli Öğrenme". Bu atölye, Çin Otomasyonu tarafından düzenlenecektir. Derneğin Başkan Yardımcısı ve Makao Üniversitesi Başkanı Profesör Chen Junlong ve Tsinghua Üniversitesi Profesörü Song Shiji, akademik direktör olarak görev yapıyor.
Chen Junlong
Makao Üniversitesi Başkanı Profesör, Çin Otomasyon Derneği Başkan Yardımcısı
National Thousand Scholars, IEEE Fellow, AAAS Fellow, IAPR Fellow
Rapor konusu: Kapsamlı pekiştirmeli öğrenmeden kapsamlı pekiştirmeli öğrenmeye: yapı, algoritma, fırsat ve meydan okuma
Rapor özeti: Bu panel, Markov karar verme süreci, pekiştirmeli öğrenmenin matematiksel ifadeleri, strateji oluşturma, tahmin ve gelecekteki getirilerin tahmini dahil olmak üzere pekiştirmeli öğrenmenin yapısını ve teorisini tartışır. Ayrıca, öğrenme sürecini ve özellik çıkarımını stabilize etmek için derin sinir ağı öğreniminin nasıl kullanılacağını ve pekiştirmeli öğrenmeyle birleştirmek için genişlik öğrenme yapısının nasıl kullanılacağını tartışacaktır. Son olarak, derin ve geniş pekiştirmeli öğrenmenin getirdiği fırsatları ve zorlukları tartışacağız.
Şarkı Shiji
Tsinghua Üniversitesi Profesörü ve Doktora Danışmanı
Ulusal CIMS Mühendislik Teknolojileri Araştırma Merkezi Araştırmacısı
Rapor konusu: Derin deniz robotu, takviye öğrenmeye dayalı akıllı arama ve hareket kontrol yöntemi
Rapor özeti: Algoritma araştırmasını ve derin deniz robotlarının akıllı arama ve hareket kontrolü alanında takviye öğreniminin uygulamasını açıklar ve hidrotermal duman ve derin deniz robotunun hareket kontrolünün akıllıca aranmasının iki yönünden çalışır. Hidrotermal dumanlar için akıllı arama açısından, takviye öğrenmeye ve tekrarlayan ağlara dayanan duman izleme algoritmaları üzerine araştırma. Sensör tarafından toplanan akış alanı ve hidrotermal sinyal bilgileri kullanılarak, robotun hidrotermal menfezi arama süreci, durum davranış alanında sürekli bir Markov karar süreci olarak modellenir ve robot başlığının optimum kontrol stratejisi, takviye öğrenme algoritması ile elde edilir. Derin deniz robotlarının hareket kontrolünde, takviye öğrenmeye dayalı yörünge izleme ve optimal derinlik kontrol algoritmaları üzerine araştırma. Robot sistemi modeli bilinmediğinde, kontrol problemi, sürekli durum eylem uzayında bir Markov karar süreci olarak modellenir ve bir değerlendirme ağı ve bir strateji ağı oluşturulur.Optimal kontrol stratejisi, deterministik strateji ve sinir ağı öğrenimi yoluyla elde edilir.
Hou Zhongsheng
Pekin Jiaotong Üniversitesi Profesörü ve Doktora Danışmanı
Otomatik Kontrol Departmanı Direktörü, Beijing Jiaotong Üniversitesi
Rapor başlığı: Veriye dayalı uyarlanabilir öğrenme kontrolü
Rapor özeti: Bu rapor aşağıdaki 4 bölüme ayrılmıştır: 1. Bölüm temelde yinelemeli eksende öğrenme denetimini tanıtmaktadır; 2. Bölüm temelde model uyarlamalı denetim olmadan zaman ekseninde öğrenme denetimini tanıtmaktadır; Bölüm 3 temel olarak öğrenme denetimini tanıtmaktadır Birleşik çerçeve; Bölüm 4 sonuçtur.
Zhao Dongbin
Araştırmacı, PhD süpervizörü, Otomasyon Enstitüsü, Çin Bilimler Akademisi
Çin Bilimler Akademisi Üniversitesi Post Profesörü
Rapor konusu: Derin Pekiştirmeli Öğrenme Algoritması ve Uygulaması
Rapor özeti: Pekiştirmeli öğrenmeyi (RL: Takviyeli Öğrenme), "karar verme" yeteneği ve derin öğrenmeyi (DL: Derin Öğrenme), yapay hale gelen derin bir pekiştirmeli öğrenme (DRL: Derin RL) yöntemi oluşturmak için "algılama" yeteneği ile birleştirmek AI'nın (Yapay Zeka) ana yöntemlerinden biri. 2013 yılında Google DeepMind ekibi, video oyunlarında insan oyunculara yakın veya onlardan daha iyi olan bir tür DRL yöntemi önerdi ve sonuçlar "Nature" 2015 sayısında yayınlandı. 2016 yılında, Avrupa Go şampiyonu ve süper sınıf Go oyuncusu Lee Sedol 5: 0'ı mağlup eden ve Go AI seviyesini benzeri görülmemiş bir seviyeye getiren gelişmiş DRL tabanlı Go algoritması AlphaGo'yu arka arkaya yayınladı. 2017'nin başlarında, AlphaGo'nun yükseltme programı Master, yenilmemiş bir rekora sahip 60 en iyi insan Go oyuncusu ile rekabet etti. Ekim 2017'de DeepMind ekibi, insan Go puanlarını kullanmadan en yüksek AlphaGo seviyesini tamamen yenen AlphaGo Zero'yu önerdi ve insanların anlayışını bir kez daha tazeledi. Ayrıca, en iyi satranç ve Japon shogi yapay zekasını aşan genel bir Alpha Zero algoritması oluşturdu. DRL'nin video oyunları, masa oyunları, otonom sürüş, tıbbi tedavi ve diğer alanlarda kullanımı artmaktadır. Bu rapor, pekiştirmeli öğrenmeyi, derin öğrenmeyi ve derin pekiştirmeli öğrenme algoritmalarını ve bunların çeşitli alanlardaki tipik uygulamalarını tanıtacaktır.
Chen Badong
Xi'an Jiaotong Üniversitesi profesörü ve doktora danışmanı
Shaanxi Eyaletinden "Yüz Yetenek Programı" nın Seçkin Profesörü
Rapor konusu: Nükleer Uyarlanabilir Filtreleme ve Genişlik Öğrenimi
Rapor Özeti: Çekirdek Uyarlanabilir Filtreler, son yıllarda ortaya çıkan Yenilenebilir Çekirdek Hilbert Uzayında (RKHS) uygulanan doğrusal olmayan uyarlanabilir filtreler sınıfıdır. Topolojisi doğrusal olarak büyüyen bir single'dır. Gizli katman nöron ağı. Temel fikir şudur: ilk önce giriş sinyalini yüksek boyutlu çekirdek uzayına eşleyin; ardından, doğrusal filtreleme algoritmasını çekirdek uzayına itin; son olarak, orijinal sinyal uzayında doğrusal olmayan filtreleme algoritmasını elde etmek için çekirdek numarasını kullanın. Geleneksel doğrusal olmayan filtre ile karşılaştırıldığında, çekirdek uyarlamalı filtre aşağıdaki avantajlara sahiptir: (a) Kesin pozitif kesin Mercer çekirdek işlevi seçilirse, evrensel yaklaşım yeteneğine sahiptir; (b) performans yüzeyi yüksek boyutlu çekirdek uzayında dışbükeydir, bu nedenle Teoride, yerel uç değer yoktur; (c) gizli düğümler, veriye dayalı olarak üretilir ve manuel katılımı azaltır; (d) aşırı uyumu etkin bir şekilde önleyebilen kendi kendini düzenleme ile. Bu nedenle, nükleer uyarlanabilir filtreleme kavramı, önerildikten sonra yurtiçi ve yurtdışındaki araştırmacılar tarafından büyük ilgi uyandırmıştır ve birçok alanda giderek daha fazla ilgili algoritma önerilmiş ve uygulanmıştır. Çekirdek uyarlamalı filtreleme, geniş öğrenmenin (Geniş Öğrenme) yakın zamandaki yükselişiyle yakından ilgilidir ve bir tür çekirdek tabanlı genişlik öğrenme algoritması olarak kabul edilebilir. Bu rapor, temel fikirleri, ana algoritmaları, performans analizini ve nükleer uyarlanabilir filtrelemenin tipik uygulamalarını kapsamlı ve sistematik bir şekilde açıklayacak ve bunu genişlik öğrenimi ile birleşik bir çerçeveye nasıl entegre edeceğinizi açıklayacaktır.
Liu Yong
Zhejiang Üniversitesi Profesörü ve Doktora Danışmanı
Zhejiang Üniversitesinden Gerçeği Arayan Genç Bilgin
Rapor konusu: Düzenli derin öğrenme ve robot ortam algısında uygulaması
Rapor özeti: Son yıllarda yapay zeka teknolojisinin hızla gelişmesiyle birlikte derin sinir ağı teknolojisi, görüntü analizi, konuşma tanıma ve doğal dil anlama gibi zor problemlerde çok önemli uygulama sonuçları elde etti. Bununla birlikte, bu teknolojinin robot algısı alanında uygulanması hala nispeten olgunlaşmamış olup, esas olarak derin öğrenmenin aşırı uydurmaktan kaçınmak ve genelleme yeteneğini geliştirmek için genellikle çok sayıda eğitim örneği gerektirmesi ve böylece test örneklerindeki genelleme hatasını azaltması nedeniyle hala olgunlaşmamıştır. Robot ortamı algılamasında yer alan görevler ve ortamlar çeşitli özelliklere sahiptir ve büyük ölçüde robot donanım platformuna dayanmaktadır.Bu nedenle, robotun her algılama görevi için çok sayıda etiketli örnek sağlamak zordur; ikincisi, benzersiz olmayan kötü koşullu sorunları çözmek için, büyük miktarda eğitim verilse bile Veriler, derin öğrenme yöntemleri de test verileri üzerinde ideal tahminler sağlamak zordur ve robot algılama görevinde yer alan mesafe tahmini ve model yeniden yapılandırma sorunları tipik kötü koşullu problemlerdir.Giriş, benzersiz çıktıya karşılık gelen yeterli bilgi içermez. . Yukarıdaki sorunlara yanıt olarak, bu rapor derin öğrenmenin genelleme yeteneğini geliştirmeyi amaçlamaktadır, bir araç olarak önceki bilgilerle gömülü düzenleştirme yöntemlerini kullanmakta ve uygulama arka planı olarak robot ortamı algısını tanıtmaktadır.
Xu Xin
National University of Defence Technology Profesörü ve Doktora Danışmanı
Ulusal savunma bilimi ve teknolojisinde olağanüstü genç yetenekler
Rapor konusu: Öz değerlendirme öğrenim kontrolünde özellik gösterimi ve sürekli optimizasyon
Yang Ying
CRRC'nin baş uzmanı, profesör düzeyinde kıdemli mühendis
CRRC Zhuzhou Electric Locomotive Co., Ltd. Baş Mühendis Yardımcısı
Raporun konusu: PHM teknolojisinin raylı ulaşım araç tahmini ve sağlık yönetiminde (PHM) uygulanması
Ji Xiangyang
Tsinghua Üniversitesi Profesörü ve Doktora Danışmanı
Değerli Genç Akademisyenler Ulusal Bilim Fonu Kazananı
Rapor konusu: Güçlendirmeli öğrenme ve akıllı kontrol ve karar verme
Sen Keyou
Tsinghua Üniversitesi Doçent ve Doktora Danışmanı
Ulusal Mükemmel Gençlik, Binlerce Ulusal Gençlik
Rapor konusu: Dağıtılmış optimizasyon algoritması ve öğrenme
İlk olarak bu çalıştay için 200 kişi rapor edilecek ve rapor dolduğunda sona erecek;
Şu andan itibaren 29 Mayıs 2018'e kadar (dahil) WeChat, personel eklemek veya danışmak ve kaydolmak için çağrı kodu taramak.
Öğretmen Zhou / Bay Xin
Telefon: 010-62522472
Cep: 18811748370
E-posta: caa_assia@163.com
Personel eklemek için WeChat'i tarayın
Bu arada, insanları işe alıyoruz, öğrenelim mi?
BAT kıdemli algoritma mühendisleri için özel araştırma ve geliştirme kursları
Hayata ve işe en yakın eğlenceli pratik projeler
Profesyonel öğretim asistanları ile sınıf yönetimi yardımı
Bir teklif almak için öğrendiklerinizi uygulayın ve bitirdikten sonra istihdam önerin
Kodu tarayın veya öğrenmek için orijinal metni okumak için tıklayın!
( 0 ) Paylaşmaya hoş geldiniz, yarın görüşürüz!