Tam yığın 3D görsel etkileşim teknolojisi olan Untouch, akıllı cihazlara insanlarla ve sahnelerle görsel olarak etkileşim kurma yeteneği verir

Lieyun.com (WeChat: ilieyun) Pekin 10 Temmuz'da bildirildi (Du Baojie tarafından)

Yarım asırdan fazla süren teknolojik yinelemelerden sonra, insan-bilgisayar etkileşimi yöntemi giderek daha insancıl hale geliyor.Sektör, yapay zeka çağında klavye, fare ve dokunma işlemlerinden sonra, yapay zeka ses etkileşiminin Yeni nesil ana akım insan-bilgisayar etkileşimi olarak, insanlar etraflarındaki akıllı cihazları çeşitli teknik yollarla giderek daha insan benzeri yapmaya çalışıyorlar.

Bu aşamada sesli etkileşim teknolojisi küresel bir çılgınlığa dönüştü Akıllı cihazlar kademeli olarak dinleme ve konuşma yeteneği ile donatılır, ancak ses teknolojisinin uygulama senaryoları sınırlıdır, cihazlar bu üç boyutlu dünyayı nasıl görebilir ve tanıyabilir? Untouch, bu adımı kendi geliştirdiği 3B görsel yapay zeka etkileşimli teknolojisi ile mümkün kılar.

Untouch'un kurucusu ve CEO'su Sun Zheng şunları söyledi: "Neden bu projeyi yapmayı seçtik? Aslında bu, 2010 gibi erken bir tarihte gördüğümüz bir teknoloji trendi. O zamanlar hem akademi hem de endüstrinin bir tahmini vardı. Yani, gelecekteki istihbarat "bulut ve terminal" olarak yansıtılacaktır. "Terminal" tarafında iki önemli teknik yön-vizyon ve ses olacaktır. Şimdi terminal cep telefonlarının, robotların, dronların vb. Sözde zekası ekipman kabiliyetidir. Dünyayı insanlar gibi algılayın. Yapay zeka henüz insanların beklentilerine ulaşmamış olsa da, en azından insanlarla etkileşim kurmak daha uygun olabilir. İnsanların kulakları ve gözleri var. Gözler hakkında daha çok düşünüyoruz. "

Untouch (Weidong Technology) 2014 yılında kurulmuş bir toB teknoloji şirketidir, Şirketin konumlandırması, yeni tüketici düzeyinde akıllı cihazlara insanlarla ve sahnelerle görsel olarak etkileşim kurma yeteneği veren akıllı görsel etkileşim teknolojisine dayanıyor. Birkaç gün önce Untouch, 43D görsel etkileşimli ürününü piyasaya sürdü: Riemann platformu-3D hareket tanıma, Euler platformu-3D yüz tanıma, Kartezyen platform-hareket izleme SLAM ve Gauss platform-sahne yeniden yapılandırması.

Riemann platformu-3D hareket tanıma

Derinlik haritasına dayalı olarak, Riemann platformu verimli ve doğru 3B hareket etkileşimini gerçekleştirebilir.Akıllı telefonlar, robotlar / dronlar, AR / VR ve diğer cihazlar için maksimum kare hızı ile 23 el eklemi tanıma ve 26 derece serbestlik takibi sağlayabilir. 90 fps, Android, Linux, Windows ve diğer işletim sistemlerini destekler, hareketlerle insan-bilgisayar etkileşimini tamamlar.

Geleneksel hareket tanıma teknolojisi ile karşılaştırıldığında Riemann platformu, hareket eylemini bir zaman dizisi olarak ele alan derin öğrenme algoritması LSTM'yi (Uzun Kısa Süreli Bellek) kullanır; bu, düşük gecikme süresi ve kendine dirençle tanıma doğruluğunu ve hesaplama verimliliğini büyük ölçüde geliştirir. Oklüzyon, önceden tanımlanmış hareketleri destekler ve özelleştirilebilir. Buna ek olarak, geleneksel hareket tanıma ürünleri PC'lere dayalıdır ve Riemann platformu derin algoritma uyarlamasına ve mühendislik optimizasyonuna tabi tutulmuştur, böylece 3D hareket tanıma cep telefonları gibi mobil cihazlarda sorunsuz ve doğru bir şekilde çalışabilir.

Dünyaca ünlü bir ToF derinlik sensörü üreticisi olan PMD'nin, müşterilere temassız etkileşimli bir çözüm sunmak için Untouch'un Riemann platformunu bir ara yazılım olarak seçtiğini açıkladığı bildirildi.İki taraf, eksiksiz bir hareket tanıma yazılımı ve donanım entegre çözümü başlatmak için işbirliği yaptı. PMD, cep telefonlarına başarılı bir şekilde derinlik sensörleri yerleştiren dünyadaki tek ToF teknoloji sağlayıcısıdır ve aynı zamanda Google Tango projesi için 3D algılama modüllerinin ana tedarikçisidir.

Euler platformu: 3D yüz tanıma

Euler platformu, insan yüzlerinin gerçek zamanlı modellemesini ve 3D özellik tanımasını, gerçek zamanlı izlemeyi, insan yüzlerinin 3D ifadelerini tanıma ve analizini yüksek tanıma doğruluğu ve güçlü aldatma önleme ile gerçekleştirebilir. Euler platformu, kimlik doğrulama ve yüz ifadesi analizine ek olarak, kullanıcıların daha ilginç ve eğlenceli bir sosyal deneyim yaşamak için kendi avatarlarını oluşturmalarına da olanak tanır.

Bu teknolojinin uygulama senaryoları nelerdir? Örneğin, Sun Zheng şunları söyledi: "Yabancı medya kaynaklarına göre, Apple'ın iPhone 8'i bir 3D derinlik kamerası ile donatılacak. Mobil terminal etkileşim yöntemini daha da yükseltmenin yanı sıra, 3D yüz tanıma, şifreleme teknolojisi açısından nispeten daha güvenli. 3D'nin yüzle doğru bir eşleşme oluşturması gerekiyor. Analiz testini geçmek için, 3D yüz tanıma teknolojisi cep telefonu fotoğrafçılığında ve görüntü güzelleştirmede de çok kullanışlıdır. "

Kartezyen platform: Hareket izleme (SLAM)

Kartezyen platformu, mekansal hesaplama ve konum izleme işlevlerini gerçekleştirebilir ve akıllı telefonlar, robotlar / dronlar, AR / VR vb. İçin santimetre düzeyinde doğruluk ve düşük gecikme süresiyle 6 DoF içten dışa konum izleme ve yol planlama yazılımı ve donanım çözümleri sağlayabilir. , Düşük güç tüketimi özellikleri. Lazer konumlandırma ve navigasyona kıyasla hangi görüş teknolojisinin daha fazla avantajı var? Sun Zheng, görsel navigasyon teknolojisinin algoritmasının daha karmaşık olduğunu, ancak daha ucuz olduğunu ve lidarın maliyetinin çok pahalı olduğunu söyledi.İki teknolojinin kendi avantajları ve dezavantajları var ve birbirlerini tamamlayabilirler.Örneğin, otonom araçların yalnızca vizyon ve Lazer konumlandırma ve navigasyon ayrıca ultrason, kızılötesi, vb. Gerektirebilir. Avantaj ve dezavantajların, yine de ürünün özel ihtiyaçlarına göre belirlenmesi gerekir.

Gauss platformu: sahne yeniden inşası

Derinlik kamerası ve RGB kamerasına dayanan Gauss platformu, engellerden kaçınma, AR izleme, 3B yeniden yapılandırma ve diğer işlevleri gerçekleştirmek için gerçek zamanlı mekansal hesaplamayı gerçekleştirebilir, gerçek fiziksel sahne yapısını yeniden oluşturabilir ve işleyebilir ve hesaplama ekipmanı için güvenilir yargı ve karar verme sağlar. Üç boyutlu sahne bilgisi. Örneğin, robotun iç mekandaki masadan bir su bardağı alması gerekiyor Robotun önce masanın nerede olduğunu bilmesi gerekiyor? Bir içki bardağı nedir? Gaussian platformu, engeller olduğunda sadece kaçamak eylemlerden ziyade, robota görüş teknolojisi aracılığıyla tüm odanın 3B modelini taramasına izin vererek robota uzay ortamını görme ve algılama yeteneği verir.

Yapay zeka çağının evrimiyle birlikte, ses etkileşimi ve görsel etkileşim için hangi uygulama beklentileri daha iyi? Sun Zheng, "Terminallerin akıllı hale getirilmesi önümüzdeki 5 ila 10 yıl içinde yıkıcı değişikliklere uğrayacak. Sadece iki teknolojinin pazar alanı ve beklentilerinin tıpkı insan gözleri ve kulakları gibi çok büyük olduğu söylenebilir. Bunu söyleyemeyiz. Görünümü daha iyi, iki teknoloji aslında daha fazla işbirliğine dayalı ihtiyaçlar.

Untouch'un kurucusu ve CEO'su Sun Zheng'in ilk yıllarında Ulusal Matematik Olimpiyatları'nın birincisi olduğu, Pekin Üniversitesi Matematik Bölümü'ne önerildiği, uzun yıllar matematik alanında akademik araştırmalar yaptığı, keşfettiği matematik teoremlerine uluslararası matematiğin otoriter eserleri tarafından isimlendirildiği anlaşıldı. "Güneş Teoremi" dir. Daha sonra endüstride gelişmek için akademiden ayrıldı.Çok uluslu yüksek teknoloji şirketlerinde 17 yıllık çalışma tecrübesine sahip.İsveç'te Ericsson'da kıdemli sistem mühendisi, ZTE Batı Avrupa genel müdür yardımcısı, ZTE Finlandiya şubesi genel müdürü, Microsoft China Mobile Division genel müdürü olarak görev yaptı. CTO Wu Hao, Microsoft Research Asia'dan geliyor ve makine görüsü konusunda uzmandır.Araştırma ilgi alanları çok gözlü görme ve hesaplamalı fotoğrafçılığı kapsamaktadır. COO Liu Shasha, yüksek teknoloji şirketlerinde 10 yıldan fazla çalışma deneyimine sahiptir.Bir zamanlar Microsoft Global Consumer Products Group'un operatör kanalı departmanının direktörü olarak görev yapmıştır ve endüstri zinciri ve iş operasyonları hakkında derin bir anlayışa sahiptir. Ekip üyelerinin çoğu Microsoft, Çin Bilimler Akademisi, Tsinghua Üniversitesi, Pekin Üniversitesi vb. Ülkelerden geliyor.

Untouch, 2014 yılında kuruldu. 2015 yılında Inno Capital ve Dahe Capital liderliğindeki multi-milyon yuan melek tur finansmanını tamamladı. 2016 sonunda, multi-milyon dolarlık bir Pre-A tur finansmanı tamamladı ve Hanergy Ventures özel yatırım.

Ürünler: Riemann platformu, Euler platformu, Descartes platformu, Gauss platformu

Şirket: Beijing Weidong Technology Co., Ltd.

Web sitesi:

Bu makale Lieyun.com'dandır. Yeniden basıldıysa lütfen kaynağı belirtin:

Sıklıkla konuşulan bu şey ulaşılamaz durumdan Wuhan halkının günlük hayatına dönüşmüştür.
önceki
Meizu, yakında yeni Snapdragon 675'i sürpriz bir fiyatla piyasaya sürecek! Netizen: Yandaki 999
Sonraki
"Daha İyi Bir Size Ulaşmak İçin Burayı Seçin" ilk "Rong Piao" yetenek mikro filminin prömiyeri Chengdu'da yapıldı
Vivo APEX'in Waterdrop kod adlı yeni telefonu ilk kez ortaya çıktı! Netizen: Bu iyi hissettirmeli
Lei Jun: Huaweinin 48 megapiksel cep telefonu geldi! Redmi Note7 spot
Binlerce zanaatkar ve Huanhua Deresi kıyısındaki binlerce "Taş Oyma Du Şiirleri" yazıtları
Çok para saçma! İki Çinli yerel zorba bariyerden yaklaşık 1 milyon euro getirdi ve el konuldu
Yabancı medya ilk olarak Mi 9'un yeni özelliklerini ortaya çıkardı! Snapdragon 855'in birçok yeni modeli ortaya çıktı ve Porselen kralı yine burada
Şampiyonlar Ligi-Cristiano Ronaldo 2 gol Marcelo, Real Madrid'i 3-1 Paris'i tersine çevirdi, iblis kanadı şapka takıyor, Liverpool deplasmanda 5-0
Lao Hammer konferansı geliştirmek üzere! Ancak bu sefer cep telefonu yok, sadece bir mermi güncelleyin!
"Pacific Rim" mecha robotunun gerçek versiyonu, 4,2 metre yüksekliğinde ve saatte 32 kilometreyle şaşırtıcı bir şekilde ortaya çıktı
Huang Zhang forumu haberi verdi: Meizu Note948 milyon +6150 gerçekten yolda!
Gösteri başlıyor: Redmi, Honor V20 korkusu olmadan Snapdragon 845, 48MP kameraları kullanacak
Huawei Mate20Pro popüler bir ürün haline geldi! Huawei'in dahili çalışanları bunu satın alamaz!
To Top