Vivo'nun en sevdiği yüz tanıma olan OPPO, AI şirketinin işi ne yapmalı?

Resim kaynağı: Visual China

Hiç şüphe yok ki, yüz tanıma, cep telefonu üreticileri için giderek daha önemli bir işlevsel modül haline geldi.

İster bu yıl vivo tarafından piyasaya sürülen amiral gemisi telefon X21, ister OPPO'nun amiral gemisi Find X, iPhone X 2017'de çıktığında 3D görsel algıya dayalı Face ID'den bahsetmeye gerek yok, yüz tanıma ile ilgili uygulama modülleri açıkça bir trend haline geldi.

Belirli uygulamalar açısından, ekran kilidi açma, yüz ödeme, portre çekimi ve güzellik rötuşlama gibi işlevlerin tümü 3D görüntü çözümleriyle desteklenir.

3B görsel çözüm nedir?

Titanium Medianın yazarı Kiwi_s tarafından OPPOnun 3B görüntü çözümünü sunarken bahsettiği gibi: Cep telefonlarını gözlerle karşılaştırırsak, geleneksel tanıma teknolojisinde cep telefonlarının "gözleri" düz bir dünya görürken, 3D Görüntü teknolojisi, cep telefonlarının düz görüşten stereo görüşe yükseltilmesine olanak tanıdı ve böylece yüz tanımanın hızını ve doğruluğunu niteliksel olarak iyileştirdi.

Şu anda, sektördeki üç ana akım 3D görüntü çözümü şunlardır: binoküler stereo görüş çözümleri, 3D yapılandırılmış ışık çözümleri ve TOF çözümleri.

Üç farklı 3B görüntü şemasında, her birinin farklı avantajları ve dezavantajları ve farklı kullanım senaryoları vardır. Bunların arasında, dürbün çözümü pasif edinmedir, 3B yapılandırılmış ışık ve TOF teknolojisi, 3B görüntüde farklı çekim mesafeleriyle uygulama senaryolarının alt bölümünü karşılayan aktif edinim çözümleridir.

Çin'de "Görsel Tanıma AI'nın Dört Ejderhası" ndan biri olarak bilinen Megvii Teknolojisi, bu cep telefonu üreticileri için yüz tanıma çözümleri sağlamada perde arkasında kilit rol oynuyor.

Bu yılın Haziran ayında Megvii, OPPO ve vivo için Android tabanlı 3D görsel algılama teknolojisi desteği sağlamada başı çekti ve kısa süre önce endüstrinin ilk "yumuşak ve sert entegre" mobil 3D algılama tam yığın çözümünü piyasaya sürdü.

Megviinin resmi açıklamasına göre, tam yığın çözüm olarak adlandırılan çözüm, algoritma yeniliği, uygulama geliştirme, ekipman üretiminden çözümlere kadar eksiksiz bir endüstriyel kapalı döngü oluşturmaktır. Özellikle, Megviinin entegre yazılım ve donanım mobil terminal akıllı 3D ürün çözümü Planda, en üst katman 3B uygulama katmanı, ardından yapay zeka algoritmaları, çözümler ve son olarak kameralar ve sensörler gibi donanım ekipmanı imalatı geliyor.

"Cep telefonu 3B vizyonu alanında birçok uygulama durumu türü olmasına rağmen, algoritmalar ve modüller dahil olmak üzere bu alandaki entegre yazılım ve donanım çözümleri hala yok. Megvii Teknolojisi yukarıdan aşağıya entegre olmaya çalışıyor. Program. "Megvii Teknoloji Bulut Bölümünün kıdemli başkan yardımcısı Wu Wenhao tanıtıldı.

Megvii Teknoloji Bulut Bölümü Kıdemli Başkan Yardımcısı Wu Wenhao

Daha verimli bir rol dağılımı oluşturmak için yepyeni bir ekolojiyi entegre etmek kolay değil, ancak Megvii'nin bu endüstri zincirinde "kurtarıcı" olmasının nedeni cep telefonu yapay zekasının uygulanmasından kaynaklanıyor. Tek başına zorluk; diğer yandan sektör müşterilerinden gelen taleptir.

Bir bütün olarak sektör açısından bakıldığında, cep telefonlarının yüz tanıma arkasındaki görsel algılama teknolojisi çözümü henüz emekleme aşamasındadır.

Apple, yüz tanıma çözümünün uygulanmasında büyük zorluklarla karşılaştı.Apple, 2016 yılında Face ID teknolojisini başlatmayı planladı ve çözümü doğrulamak için 40.000 iPhone X'i toplu üretti. Ancak daha az bilinen şey, Apple bir algoritma şirketi olmadığı için temeldeki teknoloji ve algoritmaların mükemmel olmadığıdır.Kullanıcı deneyimi nedeniyle Apple, testi bir yıl ertelemek ve 2017'de yayınlamak zorunda kaldı. Face ID ile donatılmış yeni nesil bir iPhone.

Sektör zincirindeki rollerin dağılımı, AI çözümlerinin cep telefonlarında uygulanmasının karşılaştığı ilk zorluktur. Wu Wenhao, Megvii'nin cep telefonu müşterileriyle projeleri tartıştığı sahneden bahsetti: Toplantıya bir düzineden fazla üretici katıldı. Bunlar dünyanın her yerinden geldiler ve sensörler, modüller ve optoelektronik gibi sektördeki farklı bağlantılara aitlerdi. Her biri izole edilmiş gibiydi. Parçalar, tüm endüstri seri olarak bağlanamaz.

"Herkes dağılmış durumda, donanım yapan pek çok kişi yazılımı anlamıyor ve yazılım yapanların donanım üzerinde yeterli kontrolü yok ve son inişin uygulamalar tarafından yönlendirilmesi gerekiyor. "Wu Wenhao, Titanium Media'ya örnek olarak yüz ödemesini aldığını söyledi. Bunlar arasında, yüz tanımanın doğruluğu, ödeme güvenliği standartları ve canlı iş gücü saldırılarını önleme becerisinin tümü, uygulama senaryolarının tersine çevrilmesini ve doğrulanmasını gerektiriyor ve endüstri zinciri tarafından belirleniyor. Roller birlikte tamamlanır.

Cep telefonlarında yüz tanıma için gerekli yapay zeka çözümüne göre Megvii, özellikle yazılım ve donanımı entegre eden bir mobil ürün matrisi oluşturmak için bir dizi iş ortağıyla birlikte çalıştı:

  • 3D uygulama: Megvii tarafından geliştirilen 3D yüz tanıma kilidi açma ve 3D portre ışık efekti büyük ölçekli hale geldi ve güvenli ödeme, 3D güzellik ve 3D plastik cerrahi alanlarında yer aldı.Megvii'ye göre bir sonraki adım olacak AR oyunlarına, sanal denemeye ve diğer uygulamalara yatırım yapın.
  • 3D algoritması: AI + 3D'nin temelindeki algoritmanın araştırılması ve geliştirilmesi açısından Megvii, iki ana tanıma ve yeniden yapılandırma kategorisine odaklanır. Tanıma, makinenin dünyayı algılama ve anlama yeteneğidir; yeniden yapılandırma, tanınan nesnelerin üç boyutlu yeniden yapılandırılmasıdır.İnsanlar ve nesneler için 3B görüntü uygulamalarının geliştirilmesinin özüdür.Megvii, Bellus 3D ve Altizure gibi 3B görüntü şirketleriyle başlatılmıştır. Ortak araştırma ve geliştirme işbirliği.
  • Çözüm: Megvii, farklı uygulama senaryolarında derinlik hesaplaması, derinlik restorasyonu, derinlik optimizasyonu, kalibrasyon, bozulma düzeltmesi ve diğer yetenekler için gereksinimlere dayalı olarak yapılandırılmış ışık, TOF, dürbün ve diğer farklı kamera ve sensör sistem mimarilerini entegre eder. İkili, üçlü ve derin çekimler için çözümler.
  • Donanım modülü: Mobil 3B endüstri zincirinin alt katmanı, kameralar, sensörler ve yongalar gibi donanım modüllerinin geliştirilmesini içeren donanım üretimidir. Yapılandırılmış ışık, TOF ve dürbün çözümleri, yüksek çözünürlüklü kameralar, IR projektörler, IR alıcıları, lazer yayıcılar ve diğer ekipmanların kombinasyonunu içerir.Megvii şu anda ams semiconductor gibi 3D donanım modülü üreticileri ile işbirliği yapmaktadır.

Megviinin en yeni 3D vizyon tam yığın çözümü, algoritma yeniliğinden uygulama geliştirmeye, ekipman üretiminden çözümlere kadar eksiksiz bir endüstri kapalı döngü oluşturur.

Tam yığın çözümün dört katmanında, Megvii'nin esas olarak 3 boyutlu uygulama katmanı ve algoritmaları içerdiği, Megvii'nin iyi olmadığı donanım ve çözümlerde ise 3 boyutlu teknoloji entegratörü Zhuke Innovation and Light Field'ı benimsediği görülüyor. Uygulama hizmet sağlayıcısı Folding Mirror Digital, sensör hizmet sağlayıcısı Ams Semiconductor ve diğer ortakların ortaklaşa geliştirdiği yöntemler; ayrıca, Megvii ayrıca daha uyarlanabilir algoritmalara sahip çipler geliştirmek için büyük çip üreticileriyle işbirliği yapacağını duyurdu. , Cep telefonunun 3B uygulama özelliklerini daha da optimize etmek için.

Cep telefonu üreticileri 3B görsel tanıma teknolojisini tercih ettiğinden, Endüstri zincirindeki bariz tutunma eylemini yenmek, aslında engeller oluşturmak için "ekolojik" kullanmanın bir yoludur. AI hizmeti cep telefonu sahnesinin savaş alanında, başka bir rakip olan SenseTime da sık sık hareket ediyor.

Bu yılın Mayıs ayında SenseTime, 2D yüz tanımadan 3D yapılandırılmış hafif yüz tanımaya yükseltmeyi gerçekleştirdi.Bu teknoloji, yeni çıkan Xiaomi Mi 8 Explorer Edition'da kuruldu.SenseTime Technology'nin kurucu ortağı ve Araştırma Enstitüsü Dekanı Wang Xiaogang Jiemian News'e verdiği röportajda ekolojik zincir hakkındaki görüşlerinden de bahsetti.

"Apple ve Samsung gibi üreticiler, yazılım ve donanımı entegre ediyor ve genel çözümler sunabiliyor; yerli cep telefonu şirketleri ve teknoloji sağlayıcıları ayrı, bu da yabancı üreticilerle rekabet edebilmek için her iki tarafın daha iyi bir kombinasyonunu gerektiriyor."

Spesifik işbirliği açısından, SenseTime'ın yaklaşımı, baş üreticinin SDK benzeri bir entegrasyon oluşturmak için uygulama planından sonra ilgili teknolojileri standartlaştırmak ve ardından bunu daha uzun vadeli müşterilere sağlamaktır. Bundan sonra SenseTime, daha kapsamlı hizmetler sunmak için kademeli olarak bir platform oluşturacaktır.

Bu bakış açısından SenseTime, teknolojik ürünleştirme ile oluşturulan "platforma" odaklanırken, Megvii bir "ekoloji" oluşturmaya odaklanır ve yazılım ve donanımı entegre eden bir hizmet sağlayıcı olur. Megvii Teknoloji Bulut Bölümünün kıdemli başkan yardımcısı Wu Wenhao, kişinin kendi eşiğini nasıl inşa edeceğiyle ilgili olarak şunları söyledi: "Zaman ve parayla tamamlanamayacak bir strateji yok. Ama önemli olan, önce değişmeye istekli olmanız. Bu bir konumlandırma. Bir sonraki sorun, kararlılık ve değişme yeteneği. " (Bu makale ilk olarak Titanium Media'da yayınlandı, yazar / Su Jianxun)

Daha heyecan verici içerik için Titanium Media WeChat ID'yi (ID: taimeiti) takip edin veya Titanium Media Uygulamasını indirin

Tesla, Autopilot 2.0'ı piyasaya sürdü. Bu sefer "otonom sürüş" elde edilebilir mi?
önceki
ÖzetMetro reklamları içerik odaklı ve bu yıl oynamanın birçok yolu var!
Sonraki
Lin Dan nasıl raydan çıktı? Makaleyi okuyun ve açıkça bir "geçiş faresi" olduğunuzu ve bunun maliyetini bildiğinizi söyleyin
Steam Madness Çarşamba: "The Witcher" serisi, "Armed Assault 3" tüm rekor seviyelerde düşük
Model oyun kontrolü: eski moda küçük sahne işleri, bugün ziyaret etmek yasaktır
MediaBroswerService'e dayalı Android Uygulaması uygulamasına genel bakış
Herkes için derlenen Nisan drama listesi, sıcacık çiçeklerle dolu bu mevsimden yararlanın ve keyfini çıkarın!
Qixi Festivalinde Hayatta Kalma Stratejisi! 900 milyon kızın kedi kulaklı güzel bir kız olma hayali Lifestyle
Banka soygunu hakkında konuşurken, bu filmin bu yılın en iyisi olduğunu söyleyebilirim.
Model oyun kontrolü: Temel Düello Gundam
Android ağ optimizasyonu DNS'yi optimize etmek için, prensipten OkHttp entegrasyonuna kadar HTTPDNS kullanın
"Star Wars" dan önce, bilim kurgu filmlerinin dünyada hiçbir varoluş hissi yoktu, bilim kurgu filmlerinde bir kilometre taşı
Tüketici teknolojisi çağı geldi, Titanium Medianın "Tech Life Festivali" yüz milyonlarca teknolojik inovasyon meraklısı için bir harita çiziyor
Model oyun kontrolü: boyama işleri, "YUZHIBOJUN" Ramba komuta ekibi Zhagutou sahnesi
To Top