g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Bir dizüstü bilgisayarla somatosensoriyel oyunlar oynayabilirsiniz! TensorFlow.js somatosensory dövüş öğreticisini gerçekleştirir

Xiaocha Derleyin ve organize edin

Qubit Üretildi | Genel Hesap QbitAI

Çocukken, oyunda kolu ovduğunuzda, gerçekte "Savaşçıların Kralı" nın hareketlerini taklit eder miydiniz? Oyun karakterlerini kontrol etmek için bedeni kullanan somatosensoriyel oyunlar uzun zamandır ortaya çıkmıştır, ancak bir somatosensoriyel tutamaç (Wii) veya somatosensoriyel kamera (Microsoft Kinect) gerektirir. Ve şimdi, dizüstü bilgisayar tüm bunları sizin için yapabilir!

Son zamanlarda adında bir kişi vardı Minko Gechev Dizüstü bilgisayarda oynamayı fark eden yazılım mühendisleri "Ölümüne kavga" (Mortal Kombat), sadece bir ön kameraya ihtiyacınız var.

5 yıl kadar erken bir zamanda, somatosensoriyel dövüş oyunları oynamanın proje sonuçlarını göstermişti:

O zamanlar uygulama planı çok basitti ve popüler AI teknolojisi kullanılmıyordu. Ancak bu algoritma mükemmel olmaktan uzaktır çünkü referans olarak tek renkli bir arka plana ihtiyaç duyar ve kullanım koşulları serttir.

Son beş yılda, hem web tarayıcısı API'si hem de WebGL önemli ilerleme kaydetti. Bu yüzden mühendis, oyun programını geliştirmek için TensorFlow.js kullanmaya karar verdi ve kişisel blogunda eksiksiz bir eğitim yayınladı.

Qubit makaleyi derledi, ana içerik modeli "Mortal Kombat" ı tanıması için eğitmektir. Bu oyunda ağırlıklı olarak boks ve tekme vardır ve model çıktısı aracılığıyla ilgili eylemleri yapmak için oyun karakterlerini kontrol eder.

Aşağıdaki blogunun ana içeriği:

Giriş

Bir eylem sınıflandırma algoritması oluşturmak için TensorFlow.js ve MobileNet kullanımıyla ilgili bazı deneyimlerimi paylaşacağım. Tam metin aşağıdaki bölümlere ayrılacaktır:

Görüntü sınıflandırması için veri toplayın
Veri iyileştirme için imgaug kullanın
MobileNet aktarım öğrenimini kullanın
İkili sınıflandırma ve N-ary sınıflandırma
Tarayıcıda görüntü sınıflandırmasını eğitmek için TensorFlow.js modelini kullanın

Eylem sınıflandırması için LSTM kullanımı hakkında kısa tartışma

Kullanıcının yumruk attığını, tekmelediğini veya herhangi bir şey yapmadığını ayırt etmek için dizüstü bilgisayar kamerasından gelen görüntüleri kullanan denetimli bir derin öğrenme modeli geliştireceğiz. Nihai gösteri etkisi aşağıdaki gibidir:

Bu makalenin içeriğini anlamak, temel yazılım mühendisliği ve JavaScript bilgisi gerektirir. Bazı temel derin öğrenme bilgilerine sahip olmanız yararlıdır, ancak bu bir gereklilik değildir.

Veri toplama

Derin öğrenme modellerinin doğruluğu büyük ölçüde eğitim verilerinin kalitesine bağlıdır. Bu nedenle, birincil hedefimiz zengin bir eğitim veri kümesi oluşturmaktır.

Modelimizin karakterlerin boks ve tekmelemesini tanıması gerekir, bu nedenle görseller aşağıdaki üç kategoriden toplanmalıdır:

boks
Atmak
diğer

Bu deney için, resim toplamama yardımcı olacak iki gönüllü buldum. Her biri 2-4 boks hareketi ve 2-4 tekme hareketi içeren toplam 5 video kaydettik. Toplanan video dosyası bir video dosyası olduğundan, onu kare kare bir resim çerçevesine dönüştürmek için de ffmpeg kullanmamız gerekir:

ffmpeg -i video.mov $ dosyaadı% 03d.jpg

Sonunda, her dizinde aşağıdaki gibi yaklaşık 200 resim topladık:

Not: Boks ve tekme atmaya ek olarak, resim kataloğunun büyük bir kısmı "diğer" kısmıdır ve temelde yürüme, dönme ve video kayıtlarını değiştirmeye ilişkin bazı resimlerdir. Bu bölümde çok fazla içerik varsa, eğitilen modelin önyargılı olma riski vardır.İlk iki kategoriye ayrılması gereken resimler "diğer" olarak sınıflandırılır, bu nedenle resmin bu kısmının miktarını azalttık.

Aynı ortamın ve aynı kişilerin bu 600 fotoğrafını kullanırsak, yüksek doğruluk elde edemeyeceğiz. Tanıma doğruluğunu daha da iyileştirmek için, örneği genişletmek için veri artırmayı kullanacağız.

Veri geliştirme

Veri artırma, mevcut verileri yeni örneklerle bütünleştiren bir tekniktir ve bu, veri setlerinin örnek boyutunu ve çeşitliliğini artırmamıza yardımcı olabilir. Orijinal görüntüyü işleyip yeni bir görüntüye dönüştürebiliriz, ancak süreç çok yoğun olmamalıdır, böylece makine yeni görüntüyü doğru bir şekilde sınıflandırabilir.

Görüntüleri işlemenin yaygın yolları arasında döndürme, renkleri tersine çevirme, bulanıklaştırma vb. Bulunur. İnternette hazır yazılım var.Python'da yazılmış bir imgaug aracı kullanacağım (proje adresi için eke bakınız) Veri geliştirme kodum aşağıdaki gibidir:

np.random.seed (44) yani tohum (44) def main (): aralıktaki i için (1, 191): draw_single_sequential_images (str (i), "diğerleri", "diğerleri-aug") aralıktaki i için (1, 191): draw_single_sequential_images (str (i), "hits", "hits-aug") aralıktaki i için (1, 191): draw_single_sequential_images (str (i), "tekmeler", "başlama-aug") def draw_single_sequential_images (dosya adı, yol, aug_path): image = misc.imresize (ndimage.imread (yol + "/" + dosya adı + ".jpg"), (56, 100)) bazen = lambda aug: iaa. Bazen (0.5, aug) seq = iaa.Sequential ( ), iaa.Sharpen (alfa = (0, 1.0), hafiflik = (0.75, 1.5)), # görüntüleri keskinleştir iaa.Emboss (alfa = (0, 1.0), kuvvet = (0, 2.0)), # kabartma resimleri iaa.AdditiveGaussianNoise (loc = 0, scale = (0.0, 0.01 * 255), per_channel = 0.5), # görüntülere gauss gürültüsü ekleyin iaa.Add ((- 10, 10), per_channel = 0.5), # görüntülerin parlaklığını değiştir (orijinal değerin -10 ila 10'u kadar) iaa.AddToHueAndSaturation ((- 20, 20)), # tonu ve doygunluğu değiştir # ya tüm görüntünün parlaklığını değiştirin (bazen # kanal başına) veya alt alanların parlaklığını değiştirin iaa.OneOf (), iaa.ContrastNormalization ((0.5, 2.0), per_channel = 0.5), # kontrastı iyileştirin veya kötüleştirin >, random_order = Doğru ) >, random_order = Doğru ) im = np.zeros ((16, 56, 100, 3), dtype = np.uint8) aralıktaki c için (0, 16): im = resim aralıktaki im için (len (ızgara)): misc.imsave (aug_path + "/" + dosya adı + "_" + str (im) + ".jpg", ızgara)

Her resim nihayet 16 resme genişletildi.Eğitim ve değerlendirme sırasındaki hesaplama miktarını daha sonra dikkate alarak resmin boyutunu küçülttük ve her resmin çözünürlüğü 100 * 56'ya sıkıştırıldı.

Modelleme

Şimdi bir resim sınıflandırma modeli oluşturmaya başlıyoruz. CNN (Convolutional Neural Network) resimleri işlemek için kullanılır.CNN, görüntü tanıma, nesne algılama ve sınıflandırma için uygundur.

Transfer öğrenimi

Transfer öğrenimi, eğitilmiş ağları kullanmamızı sağlar. Herhangi bir katmandan çıktı alabilir ve onu yeni bir sinir ağının girdisi olarak kullanabiliriz. Bu şekilde, yeni oluşturulan sinir ağını eğitmek, daha yüksek bir biliş seviyesine ulaşabilir ve kaynak modelin daha önce hiç görmediği resimleri doğru şekilde sınıflandırabilir.

Bu makalede, VGG-16 kadar güçlü, ancak tarayıcıda daha küçük boyut ve daha kısa yükleme süresine sahip MobileNet sinir ağını kullanacağız (kurulum paketi adresi için eke bakın).

Modeli tarayıcıda çalıştırın

Bu bölümde, ikili bir sınıflandırma modeli eğiteceğiz.

Öncelikle, eğitilmiş modeli tarayıcımızın oyun betiği MK.js'de çalıştırıyoruz. kod aşağıdaki gibi gösterilir:

Yukarıdaki kodda bazı değişkenler ve işlevler hakkında yorumlar:

video: sayfadaki HTML5 video öğesi
Katman: Çıktıyı aldığımız ve bunu modelimizin girdisi olarak kullandığımız MobileNet katmanının adı
mobilenetInfer: MobileNet'ten örnekler alın ve başka bir işlev döndürür. Döndürülen işlev girdiyi kabul eder ve ilgili çıktıyı belirli bir MobileNet katmanından döndürür.
canvas: Alınan kareyi HTML5 tuvaline yönlendirin
ölçek: sıkıştırılmış çerçevenin tuvali

İkinci adımda, video elementinin kaynağı olarak kameradan video akışını elde ediyoruz. Elde edilen görüntü üzerinde gri tonlamalı filtreleme yapın ve içeriğini değiştirin:

İlgili bilgi

Bir bakışta şok oldum: Canları için para ödemeyen utanç verici insanların resimlerinden oluşan bir koleksiyon (410)

King of Glory büyük bir dalga oynadı! Tüm kahramanları ve görünümleri, ayrıca nakit ve baskısız görünümleri gönderin!

Milan'ın sezonun gol kralı bugün 20. yaş günü

ArXiv akran değerlendirmesi web sitesi oluşturuldu, akran değerlendirmesini daha güvenilir hale getirebilir mi?

Dota2: Çin ekibi ortadan kayboldu! EG 2: 0, LGD'yi süpürdü! Netizen: 20 final oyu çıktı

Çin Futbol Federasyonu yine mağlup oldu! Japon lise ligi oyuncuları doğrudan AFC takımı tarafından atanır

DOTA2: Kazanıyor! LGD2: 0FNC ilerleyen tek Çinli ekip oldu! Oyuncu: Devlet tamam

Bekarlar "ilk gösteri" izni! Wang Manyu 4-1 Japon parçalayıcı ikinci turda Liang Xiayin ile oynayacak

Dota2: Çin takımı yine LGD'de kaldı! Ehome 2: 0 elendi! Oyuncu: Hala çok genç

Apple Watch aslında eski bir şirket "makinesidir"

Öğreticiler