Resim kaynağı: Visual China
Hiç şüphe yok ki, yüz tanıma, cep telefonu üreticileri için giderek daha önemli bir işlevsel modül haline geldi.
İster bu yıl vivo tarafından piyasaya sürülen amiral gemisi telefon X21, ister OPPO'nun amiral gemisi Find X, iPhone X 2017'de çıktığında 3D görsel algıya dayalı Face ID'den bahsetmeye gerek yok, yüz tanıma ile ilgili uygulama modülleri açıkça bir trend haline geldi.
Belirli uygulamalar açısından, ekran kilidi açma, yüz ödeme, portre çekimi ve güzellik rötuşlama gibi işlevlerin tümü 3D görüntü çözümleriyle desteklenir.
3B görsel çözüm nedir?
Titanium Medianın yazarı Kiwi_s tarafından OPPOnun 3B görüntü çözümünü sunarken bahsettiği gibi: Cep telefonlarını gözlerle karşılaştırırsak, geleneksel tanıma teknolojisinde cep telefonlarının "gözleri" düz bir dünya görürken, 3D Görüntü teknolojisi, cep telefonlarının düz görüşten stereo görüşe yükseltilmesine olanak tanıdı ve böylece yüz tanımanın hızını ve doğruluğunu niteliksel olarak iyileştirdi.
Şu anda, sektördeki üç ana akım 3D görüntü çözümü şunlardır: binoküler stereo görüş çözümleri, 3D yapılandırılmış ışık çözümleri ve TOF çözümleri.
Üç farklı 3B görüntü şemasında, her birinin farklı avantajları ve dezavantajları ve farklı kullanım senaryoları vardır. Bunların arasında, dürbün çözümü pasif edinmedir, 3B yapılandırılmış ışık ve TOF teknolojisi, 3B görüntüde farklı çekim mesafeleriyle uygulama senaryolarının alt bölümünü karşılayan aktif edinim çözümleridir.
Çin'de "Görsel Tanıma AI'nın Dört Ejderhası" ndan biri olarak bilinen Megvii Teknolojisi, bu cep telefonu üreticileri için yüz tanıma çözümleri sağlamada perde arkasında kilit rol oynuyor.
Bu yılın Haziran ayında Megvii, OPPO ve vivo için Android tabanlı 3D görsel algılama teknolojisi desteği sağlamada başı çekti ve kısa süre önce endüstrinin ilk "yumuşak ve sert entegre" mobil 3D algılama tam yığın çözümünü piyasaya sürdü.
Megviinin resmi açıklamasına göre, tam yığın çözüm olarak adlandırılan çözüm, algoritma yeniliği, uygulama geliştirme, ekipman üretiminden çözümlere kadar eksiksiz bir endüstriyel kapalı döngü oluşturmaktır. Özellikle, Megviinin entegre yazılım ve donanım mobil terminal akıllı 3D ürün çözümü Planda, en üst katman 3B uygulama katmanı, ardından yapay zeka algoritmaları, çözümler ve son olarak kameralar ve sensörler gibi donanım ekipmanı imalatı geliyor.
"Cep telefonu 3B vizyonu alanında birçok uygulama durumu türü olmasına rağmen, algoritmalar ve modüller dahil olmak üzere bu alandaki entegre yazılım ve donanım çözümleri hala yok. Megvii Teknolojisi yukarıdan aşağıya entegre olmaya çalışıyor. Program. "Megvii Teknoloji Bulut Bölümünün kıdemli başkan yardımcısı Wu Wenhao tanıtıldı.
Megvii Teknoloji Bulut Bölümü Kıdemli Başkan Yardımcısı Wu Wenhao
Daha verimli bir rol dağılımı oluşturmak için yepyeni bir ekolojiyi entegre etmek kolay değil, ancak Megvii'nin bu endüstri zincirinde "kurtarıcı" olmasının nedeni cep telefonu yapay zekasının uygulanmasından kaynaklanıyor. Tek başına zorluk; diğer yandan sektör müşterilerinden gelen taleptir.
Bir bütün olarak sektör açısından bakıldığında, cep telefonlarının yüz tanıma arkasındaki görsel algılama teknolojisi çözümü henüz emekleme aşamasındadır.
Apple, yüz tanıma çözümünün uygulanmasında büyük zorluklarla karşılaştı.Apple, 2016 yılında Face ID teknolojisini başlatmayı planladı ve çözümü doğrulamak için 40.000 iPhone X'i toplu üretti. Ancak daha az bilinen şey, Apple bir algoritma şirketi olmadığı için temeldeki teknoloji ve algoritmaların mükemmel olmadığıdır.Kullanıcı deneyimi nedeniyle Apple, testi bir yıl ertelemek ve 2017'de yayınlamak zorunda kaldı. Face ID ile donatılmış yeni nesil bir iPhone.
Sektör zincirindeki rollerin dağılımı, AI çözümlerinin cep telefonlarında uygulanmasının karşılaştığı ilk zorluktur. Wu Wenhao, Megvii'nin cep telefonu müşterileriyle projeleri tartıştığı sahneden bahsetti: Toplantıya bir düzineden fazla üretici katıldı. Bunlar dünyanın her yerinden geldiler ve sensörler, modüller ve optoelektronik gibi sektördeki farklı bağlantılara aitlerdi. Her biri izole edilmiş gibiydi. Parçalar, tüm endüstri seri olarak bağlanamaz.
"Herkes dağılmış durumda, donanım yapan pek çok kişi yazılımı anlamıyor ve yazılım yapanların donanım üzerinde yeterli kontrolü yok ve son inişin uygulamalar tarafından yönlendirilmesi gerekiyor. "Wu Wenhao, Titanium Media'ya örnek olarak yüz ödemesini aldığını söyledi. Bunlar arasında, yüz tanımanın doğruluğu, ödeme güvenliği standartları ve canlı iş gücü saldırılarını önleme becerisinin tümü, uygulama senaryolarının tersine çevrilmesini ve doğrulanmasını gerektiriyor ve endüstri zinciri tarafından belirleniyor. Roller birlikte tamamlanır.
Cep telefonlarında yüz tanıma için gerekli yapay zeka çözümüne göre Megvii, özellikle yazılım ve donanımı entegre eden bir mobil ürün matrisi oluşturmak için bir dizi iş ortağıyla birlikte çalıştı:
Megviinin en yeni 3D vizyon tam yığın çözümü, algoritma yeniliğinden uygulama geliştirmeye, ekipman üretiminden çözümlere kadar eksiksiz bir endüstri kapalı döngü oluşturur.
Tam yığın çözümün dört katmanında, Megvii'nin esas olarak 3 boyutlu uygulama katmanı ve algoritmaları içerdiği, Megvii'nin iyi olmadığı donanım ve çözümlerde ise 3 boyutlu teknoloji entegratörü Zhuke Innovation and Light Field'ı benimsediği görülüyor. Uygulama hizmet sağlayıcısı Folding Mirror Digital, sensör hizmet sağlayıcısı Ams Semiconductor ve diğer ortakların ortaklaşa geliştirdiği yöntemler; ayrıca, Megvii ayrıca daha uyarlanabilir algoritmalara sahip çipler geliştirmek için büyük çip üreticileriyle işbirliği yapacağını duyurdu. , Cep telefonunun 3B uygulama özelliklerini daha da optimize etmek için.
Cep telefonu üreticileri 3B görsel tanıma teknolojisini tercih ettiğinden, Endüstri zincirindeki bariz tutunma eylemini yenmek, aslında engeller oluşturmak için "ekolojik" kullanmanın bir yoludur. AI hizmeti cep telefonu sahnesinin savaş alanında, başka bir rakip olan SenseTime da sık sık hareket ediyor.
Bu yılın Mayıs ayında SenseTime, 2D yüz tanımadan 3D yapılandırılmış hafif yüz tanımaya yükseltmeyi gerçekleştirdi.Bu teknoloji, yeni çıkan Xiaomi Mi 8 Explorer Edition'da kuruldu.SenseTime Technology'nin kurucu ortağı ve Araştırma Enstitüsü Dekanı Wang Xiaogang Jiemian News'e verdiği röportajda ekolojik zincir hakkındaki görüşlerinden de bahsetti.
"Apple ve Samsung gibi üreticiler, yazılım ve donanımı entegre ediyor ve genel çözümler sunabiliyor; yerli cep telefonu şirketleri ve teknoloji sağlayıcıları ayrı, bu da yabancı üreticilerle rekabet edebilmek için her iki tarafın daha iyi bir kombinasyonunu gerektiriyor."
Spesifik işbirliği açısından, SenseTime'ın yaklaşımı, baş üreticinin SDK benzeri bir entegrasyon oluşturmak için uygulama planından sonra ilgili teknolojileri standartlaştırmak ve ardından bunu daha uzun vadeli müşterilere sağlamaktır. Bundan sonra SenseTime, daha kapsamlı hizmetler sunmak için kademeli olarak bir platform oluşturacaktır.
Bu bakış açısından SenseTime, teknolojik ürünleştirme ile oluşturulan "platforma" odaklanırken, Megvii bir "ekoloji" oluşturmaya odaklanır ve yazılım ve donanımı entegre eden bir hizmet sağlayıcı olur. Megvii Teknoloji Bulut Bölümünün kıdemli başkan yardımcısı Wu Wenhao, kişinin kendi eşiğini nasıl inşa edeceğiyle ilgili olarak şunları söyledi: "Zaman ve parayla tamamlanamayacak bir strateji yok. Ama önemli olan, önce değişmeye istekli olmanız. Bu bir konumlandırma. Bir sonraki sorun, kararlılık ve değişme yeteneği. " (Bu makale ilk olarak Titanium Media'da yayınlandı, yazar / Su Jianxun)
Daha heyecan verici içerik için Titanium Media WeChat ID'yi (ID: taimeiti) takip edin veya Titanium Media Uygulamasını indirin