Beş dakikanızı ve sonraki saniyenizi görün: Yapay zeka eylemleri insanların yapmasına ne yardımcı olabilir?

Görüntü kaynağı @Visual China

Metin | Beyin Kutupsal Gövdesi

E-sporu anlayan insanların "önyargı" kelimesine çok aşina olması gerektiğine inanıyorum. Oyunda, oyuncular rakibin bir sonraki hamlesini tahmin edebilir ve savaşta zengin deneyimlerle önceden tepki verebilir. Basketbol, futbol, dövüş, boks ve diğer aktivitelerde de aynısı geçerlidir Ustalar için rakibin beli rakibin sol aparkat yapacağını bilecek ve önceden blok hamleler yapabilecektir.

Tabii ki, bu yetenek herkese açık değildir ve genellikle "ustalarla sınırlıdır". Ancak büyük miktarda tecrübe biriktirilerek ve güçlü tepki kabiliyeti ile gerçekleştirilebilir, özellikle bu tür bir yetenek bilinçaltı reaksiyon ve sezgiye doğru önyargılıdır ve sistematik bir şekilde daha fazla insana öğretmek zordur.

Bunu söyledikten sonra, birçok insanın bir soru düşüneceğine inanıyorum, hareketi tahmin etme yeteneğini kopyalamak için yapay zekanın gücünü kullanabilir miyiz? Yapay zeka tıbbi görüntü okuma, yapay zeka fotoğrafçılığı ve diğer teknolojilerde, yapay zekanın uzmanların yeteneklerini yakaladığını ve kopyaladığını görebiliyoruz.

Aslında birçok araştırmacı bunu daha önce denedi. Yaygın yöntem, sabit noktalarda insan eylemlerini toplamak, eylemleri verilere dönüştürmek, modeli makine öğrenimi yöntemleriyle eğitmek ve tahmini veriler aracılığıyla insanların bir sonraki eylemini simüle etmek için Kinect ekipmanını kullanmaktır. . Ancak insanlar kısa sürede bu tür bir ekipman toplama tarzı eylem tahmininin yararlı olmadığını keşfettiler, çünkü eşleştirme ekipmanı insan eylemlerini büyük ölçüde engelleyecekti ve veri toplama maliyeti nispeten yüksekti.

Bilim adamları, AI eylem tahminini gerçekleştirmek için başka yöntemler kullanmaya çalışıyorlar.

Örneğin sesle konuşarak

Başkalarıyla konuşurken, özellikle kamuya açık konuşmalarda, insanlar ifadelerini zenginleştirmek için genellikle jestler kullanırlar. Peki bu jestleri tahmin etmek mümkün mü? UC Berkeley ve MIT'nin araştırmasında bu, sağlam bir dil ile elde edilir.

Araştırmacılar, 10 kişiden 144 saatlik konuşma videosu topladılar. Bir yandan görüntüdeki konuşmacının parmaklarının ve kollarının hareketlerini belirlemek için video akıllı analiz algoritmasını kullandılar. Öte yandan, konuşmacının konuşma ses dalgalarını ve hareketlerini dönüştürmek için modlar arası dönüştürme teknolojisini kullandılar. Dönüşümler birbirine karşılık gelir. Bu şekilde AI, insan eylemlerinin bir sonraki adımını tahmin etmek için sesi kullanabilir.

Veya ayrıntılı insan pozlarını tahmin etmek için RGB görüntüleri kullanın

Donanım eylem koleksiyonunun güvenilmezliğini keşfettikten sonra, insanlar yavaş yavaş diğer yöntemleri denemeye başladılar.Örneğin, Tokyo Institute of Technology bu yıl IEEE üzerine bir makale yayınladı ve bunu basit bir arka planda (örneğin nispeten küçük bir yeşil ekran) fark etti. 2D görüntüler aracılığıyla hareket yakalama ve doğru tahmin.

Bu yöntem, insan duruş görüntüsünü bir tür 2D "konum bilgisine" dönüştürmek için artık ağı kullanır ve daha sonra, konum bilgisinin tahminini gerçekleştirmek için LSTM aracılığıyla zaman serisi konumunu öğrenir. Bu yöntem, tahmin edilen nesnenin arka planı için gereksinimlere sahip olmasına rağmen, tahmin yeteneği çok doğrudur ve 15 karelik tahmin çerçevesinden sonra, yani 0,5 saniye sonra eylemi gerçekleştirebilir.

Hatta önümüzdeki beş dakika içinde dünyayı doğrudan tahmin et

Bazı insanlar ayrıntılı hareket tahmini peşinde koşuyor, ancak Almanya'daki Bonn Üniversitesi daha kapsamlı bir yöntemle daha uzun süreli bir hareket tahmini gerçekleştiriyor. Geçmişte, AI tarafından elde edilen hareket tahmini genellikle "tek adımlı bir tahmin" dir. Örneğin, AI, top ele dokunduğunda aşağıya doğru bastırılması gerektiğini bilerek, ancak top vurulduktan sonra dripling, şut vb. Tahmin edemez. aksiyon.

Bonn Üniversitesi'nin çalışmasında, araştırmacılar, yalnızca eylemin ayrıntılarını değil, aynı zamanda farklı etiketlerin sırasını da tahmin ederek farklı eylemleri etiketlemek için RNN ve CNN'yi birleştirdiler. Bu şekilde, yapay zeka, insanlar sadece iki saatlik öğrenimle salata hazırlarken eylemlerin kalan% 80'ini tahmin edebilir.

"Nasıl düşünülür" den "nasıl yapılır" a: Yapay zeka eylem tahmini hangi sorunları çözebilir?

Yapay zeka eylem tahmini teknolojik olarak giderek daha eksiksiz hale geldikçe, bu teknolojinin daha fazla uygulama senaryosu geliştirilmektedir. Şu anda, AI eylem tahmini için aşağıdaki kullanımları bulabiliriz.

Temel bir bakış açısına göre, AI hareket tahmini, insanların spor eğitimini daha verimli bir şekilde yürütmesine yardımcı olabilir.

Tokyo Teknoloji Enstitüsü örneğinde, kullanıcıların yapay zekanın yürürken, kavga ederken, kavga ederken ve hatta önlerindeki kişiye görüntü biçiminde bir top atarken insan hareketlerini tahmin etme yeteneğini yansıtmak için yalnızca VR gözlükleri takması gerekir. Şu anda, egzersiz eğitimi sıradan insanların hareket mantığını daha üç boyutlu bir şekilde anlamalarına yardımcı olabilir. Futbol gibi sporlara gelince, taktik analiz için kullanılabilir.

Daha derin bir perspektiften, yalnızca eylemleri tahmin etmek için yapay zekayı kullanma becerisinde ustalaşarak, eylemin ayrıntılarıyla videonun doğru ve yanlışını tespit edebilirsiniz.

Bir videoyu birkaç fotoğraf ve bir kayıtla taklit edebileceğimiz birçok durum gördük. O halde, yapay zeka eylem tahminiyle, insan eylemi alışkanlıklarını öğrenmek ve daha gerçekçi videolar oluşturmak mümkün değil mi? Aslında, yalnızca eylemleri tahmin etmek için AI teknolojisini geliştirdikten sonra, videodaki içeriğin gerçekliğini tersine tespit etmek için karşıt ayrımcılar oluşturabiliriz.

Son olarak, yalnızca AI insan eylemlerini tahmin etme yeteneğine sahip olduğunda, insan-makine işbirliği daha verimli olacaktır.

Çoğu zaman yapay zekanın insanlarla yakın olmak istediğini ve insanların ne düşündüğünü ve düşündüğünü anlaması gerektiğini düşünüyoruz. Aslında, bunu başarmak için YZ'nin insanların ne "düşündüğünü" bilmesine gerek yok, sadece insanların "nasıl" yaptığını bilmeye ihtiyacı var. Almanya'daki Bonn Üniversitesi tarafından önerilen fikir, yapay zekanın insan eylemlerini tahmin ettikten sonra insanlarla işbirliği yapmak için ilgili yanıtlar vermesine izin vermektir. Örneğin, salatayı karıştıran insanların hareketlerini tahmin ederek, yarı bitmiş salatayı karıştırmalarına yardımcı olarak.

Özellikle yaşlı bakımı, çocuk arkadaşlığı vb. Sahnelerde bu nesneler çeşitli kısıtlamalar nedeniyle robotla etkileşim için dili kullanamayabilir.Bu sırada robotun hareket tahminiyle aktif hizmetleri gerçekleştirmesi gerekli hale gelir.

İnsan vücudunun yürümesi ve yürümesi ruh tarafından kontrol edilir ve kaslar, beynin çalışmasıyla elektromiyografik sinyallerin iletilmesi yoluyla uzuvları hareket ettirmek için hareket ettirilebilir. Hem insanlar hem de yapay zeka için, beynin nasıl çalıştığını anlamak zordur, ancak onu "yarı yolda" durdurursanız ve fiziksel eylemlerin mantığını doğrudan kavrarsanız, bu da iyi bir çözüm olabilir.

Daha heyecan verici içerik için Titanium Media WeChat ID'yi (ID: taimeiti) takip edin veya Titanium Media Uygulamasını indirin

Etkileşimli drama "Idol Love" savaşını başlatıyor
önceki
Xiaomi, CC9 mobil e-ticaret sayfasındaki Apple tanıtım videosunun ekran görüntüsüne yanıt veriyor: yükleme hatası | Titanium News
Sonraki
Erken tıbbi yatırım ve Çin'in hızı hakkındaki gerçek
Çinliler SaaS kullanmayı sevmiyor mu?
Titanium Medianın "Chang'an Twelve Hours" filminin yönetmeniyle diyalogu: "American TV 24 Hours" olarak filme alınmaktan nasıl kaçınılır
Akülerle "kaçırılan" yeni enerji araçları bu yolu seçebilir mi?
Sadece dört yumurta ağırlığında titanyum gümüş teknolojisi şemsiyesi, muhteşem güneş koruması
Başka bir P2P platformu derin bir gök gürültüsü krizinde: Netcom, 6,25 milyar yuan'ın anapara ve faizini ödemeyi bekliyor ve iyi niyetle geri çekileceğini söylüyor | Titanium News
Sephora, Watsons, Wanning, Yanli yeni kanal araştırması: Trilyonlarca güzellik pazarından nasıl yararlanılır?
ASUS yeni marka ARTONE deri dizüstü bilgisayarı piyasaya sürdü, akıllı dokunmatik yüzey gelişiyor
Evcil Hayvan Ekonomi Raporu 2019 · Gıda: 30 yıllık gebelik, kalıp aniden değişiyor | Titanium Media "Potansiyel Yatırım"
29 yıl ellerimi kaybettikten sonra, akıllı protez elimle "evrim geçirdim": Titanium Media Video "Online"
Gelin ve en güzel "sahne" ile karşılaşın
Wang Junkai'nin sütlü çay dükkanını kimsenin bilmediği sektörün acımasız gerçekliğinin ardında bulmak zor
To Top