Evet, AR aslında AI'dır

Lei Feng'in web sitesine göre: AR / VR genellikle ikiz kardeşler olarak karşılaştırılır ve genellikle yeni bir uygulama katmanı teknolojisi veya "akıllı giyilebilir cihaz" olarak kabul edilir. Yapay zekanın "algoritma" etiketi ile karşılaştırıldığında, yeterince derin değildir ve içerik bakımından zengin değildir. Yukarıda AR ile yapay zeka arasındaki ilişki nedir? AR mevcut algımızdaki yapay zekaya mı ait? Bu makale Liangfengtai tarafından sağlanmıştır ve Leifeng.com tarafından yetkilendirilerek yayınlanmıştır.

Önce AR'nin temel teknolojisini kısaca sıralayalım

AR (Artırılmış Gerçeklik) sanal bilgiyi gerçek dünyada üst üste koymak, yani gerçekliği "geliştirmek" içindir. Bu geliştirme görme, işitme ve hatta dokunma yoluyla gelebilir. Asıl amaç gerçek dünyayı ve sanal yapmaktır. Dünya bir araya geldi.

Bunların arasında, gerçek dünyanın bilişi esas olarak vizyona yansır, bu da bilgi elde etmeye yardımcı olmak için kameraların kullanılmasını ve görüntüler ve videolar biçiminde geri bildirim gerektirir. Video analizi yoluyla, sahnenin 3B yapısı, hangi nesnelerin içinde ve mekanın neresinde olduğu gibi üç boyutlu dünya ortamının algılanmasını ve anlaşılmasını gerçekleştirin. 3B etkileşimli anlayışın amacı, sisteme neyin "geliştirileceğini" bildirmektir.

Şekil. Tipik AR süreci

Birkaç önemli nokta var:

Birincisi, 3B çevre anlayışıdır. Ne gördüğünüzü anlamak için, esas olarak nesne / sahne tanıma ve konumlandırma teknolojisine güveniyorsunuz. Tanıma esas olarak AR tepkisini tetiklemek için kullanılırken, konumlandırma AR içeriğinin nereye bindirileceğini bilmektir. Konumlandırma aynı zamanda farklı doğruluğa göre kaba konumlandırma ve ince konumlandırma olarak ikiye ayrılabilir Kaba konumlandırma, alan ve eğilim gibi kaba bir konum vermektir. İnce konumlandırmanın, 3B koordinat sistemindeki XYZ koordinatları ve nesnenin açısı gibi noktaya doğru olması gerekebilir. Farklı uygulama ortamlarına göre, her iki boyutta konumlandırmanın AR'de uygulama gereksinimleri vardır. AR alanında, yaygın algılama ve tanıma görevleri; insan yüzü algılama, yaya algılama, araç algılama, hareket tanıma, biyometrik tanıma, duygu tanıma, doğal sahne tanıma vb.

Gerçek 3B dünyayı algıladıktan ve onu sanal içerikle birleştirdikten sonra, bu sanal ve gerçek füzyon bilgisini belirli bir şekilde sunmak gerekiyor.Burada ihtiyaç duyulan şey AR'deki ikinci anahtar teknoloji: görüntü teknolojisi. Şu anda çoğu AR sistemi perspektif kullanıyor Video perspektifi ve optik perspektife bölünmüş başa takılan ekran.Diğer temsilciler arasında ışık alanı teknolojisi (esas olarak Magic Leap ile ünlü), holografik projeksiyon (genellikle bilim kurgu filmlerinde ve televizyon drama çalışmalarında görülen) vb.

AR'deki üçüncü anahtar teknoloji, insanların üst üste binen sanal bilgilerle etkileşime girmesine olanak tanıyan insan-bilgisayar etkileşimidir. AR, ses, jestler, jestler ve yüzler gibi dokunmatik düğmeler dışında doğal insan-bilgisayar etkileşimi yöntemlerini izler. Daha fazla ses ve hareket kullanın.

Yapay zeka ve artırılmış gerçeklik arasındaki teknik bağlantı

Derin öğrenme (DL) ve makine öğrenimi (ML) gibi yapay zeka alanında sıklıkla bahsedilen birkaç kavram vardır.Akademik alanda, yapay zeka (AI) dahil olmak üzere birçok alanın kendi araştırma sınırları vardır. Bu anlamda, "makineleri insanlara benzeyen" teknolojinin tüm uygulama yönlerini kapsayan, genel olarak yapay zeka hakkında sık sık konuşuyoruz.

Bu resimden, üçü arasındaki ilişkiye de basit bir göz atabilirsiniz. Derin öğrenme, makine öğrenimini gerçekleştirmenin teknik bir yoludur ve makine öğrenimi, makineleri akıllı hale getirmek ve yapay zeka elde etmektir. Yapay zekanın nihai hedef olduğu ve makine öğreniminin bu hedefe ulaşmak için genişletilmiş teknik bir yön olduğu söylenebilir. Bunların arasında, esas olarak makinelerin insanlar gibi nasıl "görülebileceğini" incelemek olan bir başka önemli bilgisayar görüşü (CV) kavramı vardır.Güncel yapay zeka kavramının önemli bir dalıdır.Bu aynı zamanda insanların bilgi edinmesi için en önemli şeydir. Yollardan biri vizyon. Şu anda, bilgisayar görüşü, yüz tanıma gibi ticari pazarda değerini zaten uygulamıştır; otomatik sürüş, trafik sinyallerini okur ve navigasyon için yayalara dikkat eder; sorunları tespit etmek ve süreçleri kontrol etmek için endüstriyel robotlar kullanılır; üç boyutlu ortam yeniden yapılandırma görüntü işleme ve daha fazlası. Bu kavramların hem ayrımı hem de örtüşmesi vardır.

Bunların arasında, 2006'dan itibaren Hinton'un tetiklediği derin öğrenme patlaması yayılmaya başladı ve bu da bir dereceye kadar yapay zekanın yeniden yükselişine neden oldu.Son on yılda konuşma tanıma, bilgisayarla görme ve doğal dil işleme dahil olmak üzere birçok alanda önemli başarılar elde edildi. Uygulama alanındaki yenilikler ve uzantılar tüm hızıyla devam ediyor.

AR'nin temel teknolojileri arasında, 3B çevre anlayışı, 3B etkileşimli anlayış, bilgisayarla görme ve derin öğrenme yakından ilişkilidir. Akademide 3 boyutlu çevre anlayışı esas olarak bilgisayarla görme alanına karşılık gelir ve son yıllarda derin öğrenme bilgisayarla görmede yaygın olarak kullanılmaktadır. Etkileşim açısından, donanım terminallerinde jest ve ses gibi daha doğal etkileşim yöntemlerinin kullanılması, son yıllarda ilgili alanlarda derin öğrenmedeki atılımlardan faydalanmıştır. AR'de derin öğrenmenin uygulanmasının temelde anahtar vizyon teknolojilerinde olduğu da söylenebilir.

Şu anda AR, Tencent QQ-AR meşale kampanyası, Alipay Wufu, vb. Gibi çoğu AR pazarlamasında görüldüğü gibi, üst üste binmiş içeriğe sahip görüntüleri taramak ve tanımak için cep telefonlarını kullanmak, ancak ana araştırma ve geliştirme yönü hala 3D nesnelerdir. Tanıma ve 3B sahne modelleme.

Gerçek nesneler, farklı açılara ve uzamsal yönelimlere sahip 3B formda bulunur. Yani doğal bir uzantı 2D görüntü tanıma 3B nesne tanıma için, nesnenin kategorisini ve duruşunu tanımak için burada derin öğrenme kullanılabilir. Meyve tanımayı örnek alırsak, farklı meyve türleri tanınır ve nesne tanıma ve algılama işlevlerini bütünleştiren konumlandırma alanı verilir.

3B sahne modelleme , 3B nesnelerin tanınmasından daha büyük ve daha karmaşık 3B alanlara genişletme. Örneğin, sahnede ne olduğunu, bunların uzamsal konumunu ve karşılıklı ilişkisini belirlemek, vb. Bu, AR'nin temel teknolojisi olan 3B sahne modellemedir. Bu, şu anda popüler olan SLAM'ı (gerçek zamanlı konumlandırma ve harita oluşturma) içerir. Bir sahneyi tarayıp ardından sanal bir savaş alanı gibi üç boyutlu sanal içeriği üst üste bindirerek. Yalnızca sıradan 2B görüntü tanımaya dayanıyorsa, belirli bir resim gerekir ve resim görünmediğinde tanıma başarısız olur. SLAM teknolojisinde, belirli bir düzlem olmasa bile, çevreleyen 3D ortamın yardımı nedeniyle uzamsal konumlandırma hala çok doğrudur.

Burada derin öğrenme ve SLAM teknolojisinin entegrasyonunu tartışmak istiyorum.Bilgisayar görüşü kabaca iki okula bölünebilir, bu, özellik çıkarma-özellik analizi-sınıflandırma gibi öğrenmeye dayalı bir fikir. Şu anda, derin öğrenme teknolojisi bu yolda başı çekiyor. Cinsel durum. Diğer rota türü, nesnelerin uzamsal yapı bilgilerini çizgiler, kenarlar ve 3B şekillerden çıkaran geometrik vizyona dayanır Temsili teknoloji SFM / SLAM'dir. Öğrenme yönünde derin öğrenme temelde dünyaya hakimdir, ancak geometrik görüş alanında hala çok az ilerleme vardır. Akademiden, derin öğrenme teknolojisinin araştırma ilerlemesinin her geçen gün değiştiği söylenebilirken, SLAM teknolojisinin son on yılda ilerlemesi nispeten küçüktür. Son yıllarda diğer görme alanlarında derin öğrenmenin hızla gelişmesine dayanan en büyük uluslararası vizyon konferansı olan ICCV 2015 tarafından düzenlenen SLAM teknoloji sempozyumunda, bazı uzmanlar SLAM'de derin öğrenmeyi kullanma olasılığını önerdiler, ancak henüz olgun bir fikir yok. . Genel olarak, derin öğrenme ve SLAM'ın kısa vadede birleşmesi, çalışmaya değer bir yöndür.Uzun vadede, anlamsal ve geometrik bilgileri birleştirmek çok değerli bir eğilimdir. Bu nedenle, SLAM + DL dört gözle beklemeye değer.

Etkileşim açısından en önemlileri konuşma tanıma ve jest tanımadır. Konuşma tanıma büyük ilerleme kaydetmiştir. Baidu, iFLYTEK ve Yunzhisheng gibi yerel şirketler en iyiler arasındadır. AR şirketleri atılımlar yapmak istiyor. Liangfengtai tarafından sergilenen derin öğrenme tabanlı bir jest tanıma sistemi gibi, jest tanımanın olgun ticarileştirilmesi, esas olarak altı hareketi yukarı, aşağı, sola ve sağa, saat yönünde ve saat yönünün tersine tanımlar. İlk olarak, insan ellerinin algılanması ve konumlandırılması gerçekleştirilir ve ardından tanıma İlgili jest yörüngesi, insan hareketlerinin tanınmasını gerçekleştirir. Yüz tanıma gibi diğer popüler yapay zeka alanları da AR'de kullanılmaktadır, ancak bunlar AR şirketlerinin önemli bir araştırma ve geliştirme yönü değildir.

AR'nin altında yatan teknolojinin veya temel kısmının bilgisayar vizyonu ve ilgili alanların entegrasyonu olduğunu ve popüler derin öğrenme ile AR'nin birleşiminin de algoritma mühendislerinin yönü olduğunu yukarıdan görmek zor değil. Bu aynı zamanda bilgisayar görüşü ile insan-bilgisayar etkileşiminin kesişme noktasıdır AR'nin temeli yapay zeka ve bilgisayar vizyonunun temelidir.

Şekil: Bilgisayar Görüşü ve AR Süreç Derneği

Geçen yıl Toutiao tarafından yayınlanan "Yapay Zeka Etki Raporu" nda, şirketler ve büyük Ar-Ge kurumları dahil olmak üzere yapay zeka bilim adamlarının yüz tanıma, konuşma tanıma, robotik, AR ve çipler alanlarında dağılımını da saydı. Ar-Ge personelinin dağılımı, AI alanındaki segmentasyonun yönünü de göstermektedir.

AR yapay zeka mı?

AR uygulayıcıları için ideal durum, akıllı telefonları daha akıllı AR terminalleri ile değiştirmektir.Bu nedenle kullanıcılar için AR kullanımından ilk etkilenecek şey içeriktir, ardından terminal gelir, AR endüstri zinciri kabaca bölünmüşse teknoloji tedarikini içerir. Şirketler, akıllı terminal Ar-Ge şirketleri ve AR içerik sağlayıcıları. Artırılmış gerçeklik (AR) ekipman sağlayıcıları kaçınılmaz olarak, temel yongalar, piller, optik lensler vb. Gibi donanım teknolojilerine ve donanımın kendisinin performans optimizasyonuna dikkat ederken, içerik sağlayıcılar mevcut teknolojilere dayalı olarak içeriği ve performansı optimize etmeye daha meyillidir. Dolayısıyla AR teknoloji sağlayıcılarının veya altta yatan algoritmaların araştırma ve geliştirilmesinde belirli başarılara sahip AR şirketlerinin yapay zeka şirketleri olduğunu söyleyebiliriz.

Şirketler, özellikle de yeni başlayanlar için, temel teknolojiyi, ticari hedeflere ulaşmak için dronlar, AR akıllı terminaller, robotlar vb. Veya endüstri çözümleri olabilecek olgun ürün veya hizmetlere dönüştürecekler. Kaynayan sesin ardından medyanın, işletmelerin ve halkın yapay zeka şirketleri için beklenti ve ihtiyacı haline geldi. Yakın gelecekte, Yapay Zeka Endüstrisi Geliştirme İttifakı (AIIA) tarafından yayınlanan "Yapay Zeka Dalgası: Teknolojinin Hayatı Değiştiren 100 Son Teknoloji Yapay Zeka Uygulaması" kitabı yayınlanacak ve ticarileştirme alanındaki mevcut devlerin ve yeni girişimlerin en son başarılarını kapsayacak. Ayrıca, yapay zekanın mevcut ana ticarileştirme yönünü de doğrudan yansıtır.

Teknoloji odaklı bir iş alanı olarak, ister AR ister yapay zeka olsun, diğer birçok yönden, teknolojinin tamamen olgunlaşmadan önce kat etmesi gereken uzun bir yol var.Tüm endüstri zinciri, ticarileştirmeye odaklanırken yavaş yavaş gelişirken, daha fazlasının yapılması gerekiyor. Şirketler teknolojik sınırları genişletmeye, temel rekabet gücünü oluşturmaya ve endüstrinin daha büyük bir değer ve potansiyel ile patlamasına izin vermeye devam ediyor.Bu şekilde, Çin'in yapay zeka çağında virajı geçmesi beklenebilir.

Zhang Yimou'nun "Gölge" Özel Sürümü Hikayenin Kökenini Açıklıyor
önceki
Bu sadece resmi mikroblogun yeniden adlandırılması değil, Nokia ile Microsoft arasındaki ilişki sona ermiş gibi görünüyor
Sonraki
Fabrika müdürünün hayranları, uzi canlı odasında büyük bir yaygara kopardı ve her iki tarafın azarlaması yükselmeye devam etti! Uzi çirkin görünüyor!
Atez araba kullanırken gürültü yapıyor mu? Xiaobian testi size cevabı verecek!
ICRA 2018 ödüllerinin tamamı açıklandı ve Hong Kong Üniversitesi ekibi en iyi konferans makalesini kazandı
Merkez Bankası Samsung Note 7 hala yeni aygıt yazılımını zorluyor:% 60 ücret sınırı, "ölü aygıt yazılımı" yok
Huya berbat mı ediyor? "Feng Timo" nun erkek versiyonunu yaratın! Netizen: Huya neden Douyu ile tekrar bara vurdu?
Double Twelve geliyor Piyasadaki en popüler cep telefonları hangileri?
İş aramanın zirvesi büyük ölçüde ilerlemiştir
"Sahilden Başlamak" Zhou Fangjun: Bu benim hayatım, neslimizin hayatı
Belki Chevrolet'nin marka olduğunu bilmiyorsundur
Kasıtlılığın ticari markası var mı? "Sicong ile Evlilik" kör tarih yazılımı tüm ağda başlatıldı, ancak Wang Sicong kayıtsız
Yu Chengdong bir atış daha yaptı: Xiaomi çok güçlüydü, bugün nereye gitti?
TicWatch Pro 4G sürümü deneyimi: bağımsız aramalar gerçekten güzel kokulu
To Top