Full Bloom Interactive'in CEO'su Dr.Zeng Xiangyong: Akıllı etkileşimin geleceği çok modlu entegrasyon olmalıdır

Birkaç gün önce, Apple'ın iPhone X cep telefonu insanların yüz tanıma teknolojisini etkilemesine neden oldu ve WeChat ve Weibo'nuz çeşitli şakalarla kaydırılmış olmalı. Peki, Çin'deki yüz tanımanın uygulama durumu nedir? Menlo Park'ın odaklandığı teknoloji şirketleri arasında Beijing Blooming Interactive, sektörde güçlü bir şirkettir. Bağımsız olarak, yüzler ve nesneler gibi 2000 ortak nesneyi ve 100 ortak sahneyi tanıyan bir yapay zeka platformu olan SKEye geliştirdiler.

Platformun akıllı donanım ve akıllı robotlara uygulanmasına ne dersiniz? Yerli bilgisayar vizyonu girişimlerinin nelere dikkat etmesi gerekiyor? Menlo Park muhabiri, pek çok şüpheyle Blooming Interactive'in CEO'su Dr. Zeng Xiangyong'u ziyaret etti ve ondan herkesle paylaşmasını istedi.

Beijing Bloom Interactive Technology Co., Ltd. CEO'su Dr.Zeng Xiangyong

Dr. Zeng Xiangyong, on yıldan fazla bir süredir bilgisayar vizyonu ve akıllı etkileşimli teknolojinin araştırma ve geliştirme ve uygulaması ile uğraşmaktadır ve esas olarak akıllı ürünler ve akıllı uygulamalar için görsel tanıma açık platformunda araştırma yapmaktadır.

Menlo Park : Dr. Zeng, merhaba! Firmanızın görsel tanıma teknolojisinin robotlara uygulanmasından bahseder misiniz?

Zeng Xiangyong : Merhaba, Monroe Park'ın arkadaşları ve okuyucuları! Bloom ekibi, 15 yıldan uzun süredir görsel tanıma ve akıllı etkileşim alanında derinlemesine çalışmaktadır ve geleneksel makine öğrenimi ve derin öğrenme teknolojilerinde zengin bir birikime sahiptir. Yüz tanıma, ifade analizi, hareket izleme, hareket analizi ve görüntü tanıma gibi görsel etkileşim teknolojilerini somatosensoriyel oyunlara ve eğlence deneyimlerine uygulayan Çin'deki ilk ekibiz.

Bir U Sihirli Ayna

2015 yılında çocukların akıllı donanımlarına ve akıllı robotlarına görme teknolojisini uygulamaya başladık. Örneğin, çocukların akıllı donanım ürünü "A U Magic Mirror" için grafiti resimleri, rastgele resimler, harf tanıma, sayı tanıma, tangram tanıma, kart tanıma, resimli kitap tanıma ve fiziksel nesne tanıma için eksiksiz bir görüntü tanıma algoritmaları seti sunuyoruz. Ayrıca donanım performansı ve uygulama senaryoları için özel algoritma optimizasyonları yaptık, kısıtlı koşullar altında sorunsuz ve kararlı çalışabilir, ürünün kullanıcı deneyimi de çok iyi geri dönüşler aldı.

Utu Robot

Çocukların akıllı robotları açısından, robot Utu'nun (eski adıyla Utuchi olarak biliniyordu) geliştirilmesiyle derinlemesine ilgileniyoruz ve ona çevrimdışı yüz tanıma, ortak nesne tanıma ve eksiksiz bir interaktif sistem seti sağlayarak bu ürünü bir "tanıma" yapıyoruz. Görsel yetenek "insan bilgisi" olan bir ev robotu.

2016'nın ikinci yarısında, hizmet robotu endüstrisindeki onlarca şirkete test ve değerlendirme için çiçek açan görsel tanıma SDK'sı ve API sağlamaya başladık. Şu anda, Kangliyoulan'dan Xiaoyou, Smart Butler'dan Pudding Doudou, Lei Dong Yunhe'den Lei Dabai, Shanghai Yuanqu, Shenzhen'den Haoeryou dahil olmak üzere deneme ve resmi uygulamada 30'dan fazla akıllı ürün var. Ruimans Xiaoman, Shenzhen Dayus Dali, Nanjing Avatarın i-bao vb. Aile arkadaşlığı ve eğitim robotlarının yanı sıra Kangliyoulanın Youyou, Evolverın Chubby, Muyenin Kuqi ve Zhongde Dikeın Alan'ı Ve Karel ve Happy Flying gibi ticari hizmet robotları. Ek olarak, çiçek açan yüz ve nesne tanıma teknolojisine de bağlanmış birçok mobil uygulama ve WeChat resmi hesabı vardır.

Başvurular

Menlo Park : Blooming Interactive'in bağımsız olarak açık bir yapay zeka platformu olan SKEye geliştirdiğini biliyoruz, avantajları nelerdir? Robotta nasıl bir performans sergiliyor? Bir sonraki yükseltme yinelemesi ne olacak?

Zeng Xiangyong : Mayıs 2017'de SKEye yapay zeka açık platformunu resmen başlattık, yaşam sahnelerine ve terminal uygulamalarına odaklandık ve yüz algılama, yüz tanıma, yüz analizi ve nesneler (2000 tür ortak günlük nesne) dahil olmak üzere akıllı etkileşim gerçekleştirdik. Sahneler (100 ortak sahne) gibi hedeflerin gerçek zamanlı olarak tanınması, çeşitli akıllı etkileşimli ürünlere ve uygulama terminallerine görsel yetenekler kazandırmıştır.

SKEye, "insan-bilgisayar etkileşimine" odaklanır ve temel avantajları kullanılabilirlik, kullanım kolaylığı, doğruluk ve hızdır. Çoklu platform SDK ve API aracılığıyla birden fazla donanımı (ARM / X86) ve sistemi (Andriod / Linux / Windows) destekler ve kolay erişim hizmetleri sağlayabilir.

Herkes, görme teknolojisinin endüstri, güvenlik, gözetim, finans, tıbbi bakım, otonom sürüş, insansız süpermarketler ve pan-eğlence gibi çeşitli alanlara giderek daha fazla uygulandığını biliyor. Vizyonun temeli görüntülerdir ve vizyon teknolojisi, uygulama senaryoları ve uygulama amaçlarıyla yakından ilişkilidir. Yerli robotlar ve ticari robotlar, sırasıyla ev ve kamusal alanlara hizmet etmektedir.Bu küçük veya özel senaryolarda, robotun birincil görevi "insan-bilgisayar etkileşimi" ve "kimlik doğrulama" ikincil görevdir. Başka bir deyişle, "etkileşim için tanımlayın" ve etkileşimin akıcılığı çok önemlidir.

Yüz tanıma açısından, "olabildiğince hızlı, yeterince doğru ve düşük güç tüketimi" hedefine ulaşmak için, SKEye derin öğrenmeye dayalı model boyutunu, hesaplama karmaşıklığını, tanıma oranını ve yanıt süresini optimize etti. Gerçek zamanlı olarak yerel olarak çalışan yüz tanıma için düşük profilli donanım çevrimdışı SDK. Yüz algılama, temel nokta konumlandırma, yüz karşılaştırma ve öznitelik analizi için tam model setinin kapasitesi 18 MB içindedir. Robot Pudding Doudou (RK3128) ve Xiaoyou (RK3188) gibi ARM platformlarında sorunsuz çok kişili yüz tanıma ve yüz analizi elde edilebilir ve performans Lei Dabai ve Dali (RK3288) ve üzeri konfigürasyonlarda daha iyidir.

Çok kişili yüz tanıma için Pudding Doudou robotu

Nesne tanıma açısından SKEye, özellikle günlük yaşamdaki yaygın nesneler için derin öğrenme modellemesi gerçekleştirmiştir. Robot APP ve mobil APP aracılığıyla veri toplamaya ve düzenlemeye, arka planda kullanıcıların hangi öğeleri almayı sevdiklerini veya robotun tanımasını istedikleri öğeleri analiz etmeye ve tanıma modelini sürekli yinelemeli olarak eğitmeye devam ediyoruz. "Ortak nesneler" tanıma yapmamızın nedeni, robotların belirli bir "görsel sağduyuya" sahip olmasına izin vermek ve gelecekte tüm robotların bu "sağduyuya" sahip olacağını ummaktır.

Daha sonra, çevrimdışı yüz tanıma, ortak öğe tanıma ve özel öğe tanıma yeteneklerini yinelemeli olarak optimize etmeye devam edeceğiz.Güler yüzlü hizmetler ve ayrıcalıklı fiyatlarla, daha akıllı ürünler ve akıllı uygulama şirketlerine hizmet vereceğiz, böylece arkadaşlarımızın ürünleri olacak Daha güçlü görsel zeka ve görsel sağduyuya sahip olun.

Ortak nesne tanıma

Menlo Park : Görsel tanıma artık yaygın olarak kullanılıyor, akıllı etkileşimin gelecekteki gelişme trendi sizce nedir?

Zeng Xiangyong : Geleneksel tek etkileşim modu ile karşılaştırıldığında, çok modlu füzyon teknolojisine daha fazla önem veriyoruz. Görme, işitme, dokunma ve koku gibi çoklu etkileşim yöntemlerini daha yüksek ifade verimliliği ve ifade edilen bilginin eksiksizliği ile bütünleştirir.Akıllı etkileşimin gelişme eğilimidir ve akıllı etkileşim, hizmet robotlarının sahnelenmesinde de vazgeçilmez bir bağlantıdır. Açık insan-bilgisayar etkileşiminde, özellikle çok yönlü insan-bilgisayar diyaloğunda konuşma tanıma, görüntü tanıma, anlambilimsel analiz, duygu analizi, hareket yakalama vb. Gibi birden fazla boyutu içerdiğinde, gelişme çok zordur ve şu anda hiçbir faydası yoktur. Sonuçlar ve uygulamalar. Ve sınırlı sahneler koşulu altında, insan-bilgisayar etkileşiminin zekasını ve deneyimini önemli ölçüde iyileştirme etkisini elde etmek için hedeflenen araştırma ve geliştirme ve çok modlu füzyon teknolojisinin uygulanması dört gözle beklemeye değer!

Multimodal füzyon teknolojisi

Menlo Park : Yapay zeka çağının temel teknolojilerinden biri görsel tanıma, yerli girişimler için fırsatlar neler? Pazarda nasıl rekabet edersiniz? Bir sonraki stratejik plan ve düzen nedir?

Zeng Xiangyong: Son yıllarda yapay zeka halktan büyük ilgi gördü ve hükümet de bunu ulusal stratejik düzeye yükseltti. Yapay zekanın hızlı gelişimi, görsel tanıma teknolojisinin yaygın olarak kullanılmasını sağlamıştır. Güvenlik, finans ve tıbbi bakım gibi "ciddi" uygulamaların yanı sıra hizmet robotları, cep telefonu uygulamaları ve yeni perakende gibi birçok "pan-istihbarat" uygulaması da bulunmaktadır. Çin'in büyük nüfusu ve büyük pazarı nedeniyle, herhangi bir alt bölüm veya dikey senaryo daha da büyüyebilir. Bu nedenle yerli CV (bilgisayar vizyonu) girişimleri, kendi teknolojilerini müşteri verileri ve uygulama senaryoları ile birleştirebildikleri sürece hala büyük gelişme fırsatları var.

Yapay zekanın gelişimi çok hızlı olmasına rağmen hala keşif aşamasındadır ve çeşitli alanlardaki rekabet ağırlıklı olarak teknolojiye odaklanmıştır. Blooming Interaction'ın geni, "pan-Intelligence" alanında teknolojik yeniliklere girişmektir. Asıl niyetimizi unutmayacağız, görsel tanıma ve akıllı etkileşim teknolojisinin araştırma ve geliştirmesine bağlı kalacağız ve "insan-bilgisayar etkileşimi" sahnesinde sürekli kendi avantajlarımızı sürdürmeye çalışacağız. Önde gelen ve köklü bir CV girişimi olun.

Monroe görünümü :

Görsel tanımanın geliştirilmesinden bu yana, akıllı interaktif teknolojinin hayati bir parçası haline geldi. Yıllar süren Ar-Ge ve yağışlardan sonra, Blooming Interactivein temel ürünleri düzinelerce akıllı ürüne uygulandı ve pazarın ve kullanıcıların testinden geçti. Şu anda, hala aktif olarak yeni akıllı etkileşim yöntemlerini araştırıyor ve geliştiriyorlar. Blooming Interactive'in önümüzdeki dönemde çeşitli akıllı ürünlerin araştırma ve uygulama kapsamını genişletmek için çok çalışacağına ve aynı zamanda toplumun tüm sektörlerinde yapay zekanın gelişimini teşvik edeceğine inanmak için nedenlerimiz var.

Harika Jill'im! Süper Lig için zafer kazanmak için Messi'yi tek başına savunun
önceki
RMB ödemeleri yabancı medyada dört ayın en düşük seviyesine düştü: RMB'nin en yüksek para birimine yükselmesi 15 yıla kadar sürecek
Sonraki
2019'da transfer! İşte koi'nin nazik vatanı ve Kobe'yi kaybetmeyen Hida bifteği
Kameranın yanından geçerken sık sık yanıp söner ve yanıp söner, sahibi: Fotoğrafı çekildi mi?
veda! Jiangxi'deki bu yaşlı adama veda edelim!
Trident bir "Üç Mızrak" olduğunda, Lippi gol atmak için yalnızca üç "üç yaşındaki adama" güvenebilir.
130.000 A sınıfı yeni araba mı yoksa B sınıfı kullanılmış araba mı seçiyor? Şaşkın? Usta size söyler!
Petrol ve doğalgazdan sonra bir sonraki enerji yaylası ortaya çıkıyor ve Çin bu alanda büyük bir atılım yaptı.
UCSB araştırması, bilgisayar görüşünü iyileştirmek için insan gözü arama stratejisini kullanarak bilgisayar ve insan görüşü arasındaki farkı buldu
Hangzhou-Huangzhou yüksek hızlı demiryolunun açılmasıyla aynı zamanda, zamanı yaklaşık 3 kat kısaltan bu en güzel buz karı hattı da var.
Arabalarla ilgili bu 5 soğuk bilgi, bilirsiniz 3 kişi geçer, bilirsiniz 5 kıdemli bir sürücü olarak kabul edilir
Ailesi öldürüldü ve 87 gün kaçırıldı ...
2019'da tüm dünyada gün doğumunu izlemek için size eşlik etmek istiyorum!
Petrol fiyatı çok mu yüksek? Bu hibrit arabalar yakıt "fobinizi" ortadan kaldırabilir
To Top