Fotosistem tekrarlayan bir sinir ağı çalıştırıyor! Fransız yeni sistemi, insan davranışını% 100 doğrulukla tanıyor

Akıllı şeyler (genel hesap: zhidxcom) Editör | Wei Shiwei

Son zamanlarda 14 Kasım'daki akıllı şeyler haberleri, Fransız araştırmacılar, mevcut donanım yöntemlerinden daha hızlı olan, tekrarlayan bir sinir ağını çalıştırmak için fotonik donanım kullanma yöntemini önerdiler. Sinir ağının 16.384 düğümü vardır ve yüz binlerce düğüme genişletilebilir.

Aynı zamanda, sistem Rezervuar Hesaplama paradigmasına dayanmaktadır.Eğitimden sonra, orijinal çerçeveyi girdi olarak kullanabilir veya KTH insan davranışı veritabanından altı kişiyi eğitmek ve tanımak için bir dizi özelliği çıkarmak için Oriented Gradients Histogramını kullanabilir. Hareketler.

Araştırma sonuçları, ABD saatiyle 12 Kasım 2019'da "Büyük beyinden ilham alan fotonik bilgisayarlarla insan eylemini tanıma" başlıklı en iyi akademik dergi "Nature Machine Intelligence" 'de yayınlandı. büyük ölçekli bir beyinden ilham alan fotonik bilgisayar ile) ".

Araştırmacılar bildiride raporun sınıflandırma doğruluğunun% 91,3 olduğunu ve bu da son teknoloji ürünü dijital uygulamalarla karşılaştırılabilir olduğunu belirtti. Aynı zamanda, fotonik yapının sağladığı muazzam paralel işleme kabiliyetleri nedeniyle, bu çalışmanın basit ve yeniden yapılandırılabilir gerçek zamanlı video işleme ve enerji tasarrufu çözümlerinin daha iyi geliştirilmesine yol açmasını bekliyorlar.

Bu makalenin araştırmacıları, Lorraine Üniversitesi'nden Piotr Antonik, Nicolas Marsal, Daniel Brunner ve Damien Rontani, Burgundy-Franche-Comté Üniversitesi, Paris Merkez Politeknik-Elektrik Enstitüsü, Besançon Optik Laboratuvarı ve LMOPS EA 4423 laboratuvarı.

1. İnsan davranış araştırmalarının zorluklarını belirlemek için derin öğrenme

Son yıllarda, insan davranışını tanıma, bilgisayarla görme alanında en popüler araştırma alanlarından biri haline geldi. Bu gelişmenin arkasındaki itici güç, izleme, kontrol ve analiz gibi alanlardaki potansiyel uygulamalardır.

Bunlar arasında izleme, esas olarak bir veya daha fazla nesnenin izlenmesi ve belirli davranışların zaman içinde tespit edilmesiyle ilgilidir.Örneğin, insanlar arabaların çalınmasını önlemek için park alanlarını izler.

Ve kontrol, esas olarak oyunlarda, sanal ortamlarda veya uzak cihazlarda kontrol işlevleri sağlamak için yakalanan hareketi kullanan sistem kontrolü ile ilgili uygulamayı ifade eder.

Buradaki analiz, esas olarak ortopedik hastalar üzerinde klinik araştırmalar için veya sporcuların performanslarını iyileştirmelerine yardımcı olmak için kullanılabilen spor kendi kendine analizini ifade eder.

Bu bakış açısına göre, insan faaliyetlerini video dizilerinden tanımlamak şüphesiz bir zorluktur.Araştırmacıların arka plandaki karmaşayı, ölçeği veya bakış açısı değişikliklerini, ışığı ve görünümü aşması gerekir.

Günümüzde derin öğrenme, konuşma tanıma, doğal dil işleme ve öneri sistemlerine başarıyla uygulanmaktadır. Aynı zamanda, video tabanlı insan davranışı tanıma araştırmasına da dahil edilmiştir.Orijinal video girişi sayesinde, sistem otomatik olarak özellik çıkarımı yapabilir ve karmaşık davranışları tanıyabilir.

Bununla birlikte, bu yöntemin de eksiklikleri vardır, büyük bir veri seti, hiperparametrelerin önemsiz olmayan şekilde ayarlanması (hiperparametrelerin önemsiz olmayan şekilde ayarlanması) ve zaman alıcı ve emek yoğun eğitim süreci gerektirir. Bu işlemler genellikle GPU'lar gibi özel üst düzey donanım gerektirir.

2. Optik yöntemler ve rezervuar hesaplamaları ile foton hesaplama ekipmanının yapımı

İnsan davranışını tanıma araştırmalarında derin öğrenmenin zorluklarına yanıt olarak, araştırmacılar, insan davranışını videoya dayalı olarak sınıflandırabilen bir optik sinyal işleme sistemi yöntemi önerdiler.

Aslında, optik hesaplama bilim adamları tarafından onlarca yıldır inceleniyor.

Fotonlar ısı üretmedikleri için indüksiyon ve kapasitans etkilerinden etkilenmeyecek ve sinyal bozulmasına neden olmayacaktır. Bu nedenle, optik sinyal iletimi gibi görevlerde yüksek derecede paralelliğe sahiptir ve paralel sinyal iletimi, sinir ağlarına büyük faydalar sağlayacaktır.

Aynı zamanda, modern bilgi işlem sistemlerinde optik ara bağlantıların kullanımı artmaktadır, bu da paralel sinyal iletiminin fotoniğin güçlü özelliklerinden biri olduğunu göstermektedir.

Bu nedenle, yüksek hızlı ve enerji tasarrufu sağlayan foton hesaplama cihazları oluşturmak için optik yöntemler kullanılabilir.

Araştırmacılar, deneysel optik sistemi rezervuar hesaplama paradigması altında Sığ Tekrar-Kirala Sinir Ağı oluşturmak için kullandılar. Bunların arasında rezervuar hesaplaması, yapay sinir ağlarını tasarlamak ve eğitmek için kullanılan bir dizi makine öğrenme yöntemidir.

Zaman serilerini işlemek ve yalnızca doğrusal bir çıktı katmanını eğitmek için stokastik tekrarlayan sinir ağının dinamiklerini kullanmayı planlıyorlar. Bu, eğitilmesi daha kolay, yalnızca okuma katmanının bir doğrusal denklem sistemi çözülerek optimize edildiği bir sistemle sonuçlanır.

Ek olarak, sistem eğitim sürecinde geçmişe göre daha az parametreye sahip olduğundan, araştırmacılar ağı daha küçük bir veri seti üzerinde aşırı uyum riski olmadan eğitebilirler.

Aynı zamanda, elektronik, optoelektronik, optik ve entegre devreler alanlarında rezervuar hesaplama üzerine çok sayıda deney, kablosuz kanal eşitleme, fonem tanıma ve kaotik zaman serisi evrimi gibi bir dizi kıyaslama görevindeki diğer dijital algoritmalarla karşılaştırılabilir.

Deneysel sonuçlar, foton depolama bilgisayarının okuma katmanının, dijital mikro ayna ekipmanı aracılığıyla optik eğitim için kullanılabileceğini göstermektedir.

Deneyde, araştırmacılar bir Optoelektronik Rezervuar Bilgisayarından bahsetti. Sistem, uzamsal olarak genişletilmiş düzlem dalgasını faz modüle etmek için bir uzaysal ışık modülatörü (SLM) kullanır.

Araştırmacılar, rezervuar bilgisayarının düğümleri üzerinde eşzamanlı optik işlem gerçekleştirerek önemli paralelleştirme potansiyeli sağlar ve SLM'nin fiziksel çözünürlüğü en büyük ağ ölçeğini tanımlar.

Sonuçlardan, bu yöntem yalnızca ağın ölçeklenebilirliğini önemli ölçüde iyileştirmekle kalmaz, aynı zamanda bilgisayar görüşündeki zorlukları başarıyla çözmek için de gereklidir.

Ek olarak, deneysel cihaz 16.384 düğümü barındırabilir ve konseptin fiziksel sınırı 262144 nörona kadar yüksektir ve algoritma ayrıca giriş katmanı, çıktı katmanı ve ağın özyinelemesini gerçekleştirir.

3. KTH veritabanını tanımlamanın doğruluğu% 100'e kadar yüksektir

Araştırmacılar, kağıda foton hesaplama sisteminin, 25 denek tarafından gerçekleştirilen yürüyüş, koşu, koşma, boks, el sallama ve alkış gibi altı farklı eylemin video kayıtlarını içeren popüler KTH veritabanına dayandığını gösterdi.

Ön işleme aşamasında, araştırmacılar, tek bir video karesinden uzamsal ve şekil bilgilerini çıkarmak için Yönlendirilmiş Degradelerin Histogramı (HOG) algoritmasını kullanıyor ve ardından ilgili HOG özelliklerini elde etmek için altı hareket türünü sınıflandırmak için Foton Rezervuar bilgisayarını kullanıyor.

Her denek dört tekrar gerçekleştirdi ve boyutları 24 ila 239 kare arasında değişen çeşitli uzunluklarda 600 video dizisi veri seti üretti.

Ardından, araştırmacılar tüm videoları bir araya getirdiler ve orijinal video akışını elde etmek için bunları ayrı karelere böldüler ve ardından ön işleme aşamasına girdiler.

Tedavi tamamlandıktan sonra araştırmacılar rezervuar bilgisayarını eğitecekler. Eğitim, 450 video dizisinden oluşan bir alt kümede gerçekleştirilir ve her video dizisi ayrı bir hareket dizisi içerir.

Eğitim süreci sırasında, araştırmacılar rezervuar çıktısı ile hedef kategori arasındaki hatayı en aza indirmek için normalleştirilmiş bir ortalama kare hata (NMSE) maliyet fonksiyonu kullandılar.

Son olarak, araştırmacılar, diyagonal elemanların toplamı ile verilen rezervuar bilgisayarının performansını ölçmek için bir indeks hesaplamak için bir kafa karışıklığı matrisi kullandılar. Sonuçlardan rezervuar bilgisayarının performansı 600 puandır, yani bilgisayarın veri setindeki altı eylemi belirleme doğruluğu% 100'dür.

Ayrıca araştırmacılar, bu yöntemin 1024 ila 16384 düğüm arasında değişen ağ boyutları altında ölçeklenebilirliğini araştırdılar ve sınıflandırma doğruluğunun% 92'ye kadar çıktığını bildirdi.

Bu, basit bir fotonik sistemin kullanımının mevcut bilgisayarla görme görevlerinin karşılaştığı zorlukları etkili bir şekilde çözebileceğini göstermektedir.

Sonuç: Görüntü ve video işlemenin zorluklarını çözmek için yeni fikirler getirin

Genel olarak, araştırmacılar tarafından tasarlanan fotonik sistem nispeten basit olmasına rağmen, KTH veri setindeki performansı en son derin öğrenme yöntemleriyle karşılaştırılabilir ve gradyan LSTM ağından daha iyidir.

Araştırmacılara göre, bu çalışmada önerilen video bilgi işlem donanım çözümü, eğitim süresi ve karmaşıklığı açısından derin öğrenmeden daha üstün olabilir.

Her teknik araştırmanın akademik dünyadan endüstriyel dünyaya kademeli olarak inmesi uzun zaman alsa da, pratik yapmak ve optimize etmek uzun zaman alacaktır. Bununla birlikte, bu yöntemin önerisi, güvenlik, Nesnelerin İnterneti ve AI alanlarında görüntü işleme ve video işlemedeki mevcut zorlukları çözmek için yeni fikirler ve talimatlar da getiriyor.

Makaleye bağlantı: https://www.nature.com/articles/s42256-019-0110-8 Makale kaynağı: Nature

"Shan Hai Jing" "Qing Ming Shang Nehri" Hua Mulan ... resim kitabındaki Çin unsurları vaaz vermiyor
önceki
"Şişman Bebek" yanıyor! Ayaklarımı yıkarken ayaklarım titredi, netizenler: vatanın "etli"
Sonraki
Ams, iki optik sensörü zorlar: ana özellikler ultra küçük boyut ve artefakt ortadan kaldırmadır
Xiaominin makro fotoğrafçılıktan ultra geniş açıya kadar 100 megapiksel cep telefonu kamera deneyiminin etkisi nedir?
Ulusal Pekin Operası Tiyatrosu, Pekin Operası ustası Li Shaochun'un 100. doğum yıldönümünü anmak için sempozyum düzenledi.
Fabrikalarda yapay zeka savaşları, McDonald's için enerji tasarrufu sağlamak için SIoT kullanın, Lenovo TechWorld kuru mallar burada
İlk 3D baskılı tam kalp Milyon Ödülünü kazandı, TOHUM ÖDÜLÜ açıklandı
Cool Music Research Institute | Çay markaları büyük amiral gemisi mağazaları açmaya neden bu kadar hevesli?
"Kasım ayındaki Şangay-Pekin Sergisi için önerilir" Kargaşa içinde ilerleyen, manzaraların bazen görünüp kaybolduğu bir Çin
Bytedance ilk cep telefonu! Flash Capsule, Big Bang, TNT ... Nut Pro 3 sistem deneyimi
Arabanın kapısı bir bisikletçiye çarpar, çocuk korkar ...
Microsoft'un en güçlü Çinli yöneticisi Shen Xiangyang ayrıldı! Yapay zeka işini yönettikten sonra, Çinlilerin ışığı giderek azaldı
Lanzhou-Sincan yüksek hızlı demiryolunun Sincan bölümünün açılmasının beşinci yıldönümü
Pacific Future Technology, görünüş olarak güneş gözlüklerine benzeyen ve 6588 yuan fiyatıyla yeni AR gözlükleri piyasaya sürdü
To Top