Tencent AI Lab'ın iki ana algoritması, "temel araştırma + iniş uygulaması" yoluna bağlı kalarak yüz tanıma ve algılama kaydını yeniler.

Leifeng.com AI teknolojisi inceleme notu: 18 Aralık'ta Tencent AI Lab, geliştirdiği yüz algoritmalarının Face R-FCN ve Face CNN'nin sırasıyla yüz algılama platformu WIDER FACE ve yüz tanıma platformu MegaFace'in çoklu değerlendirmelerinde elde edildiğini duyurdu. şampiyon. Bu haberi öğrendikten sonra, Leifeng.com AI Technology Review, Tencent AI Lab Computer Vision Center Direktörü Dr. Liu Wei ile bir fikir alışverişinde bulundu.

Face R-FCN algoritması yüz algılama problemi için tasarlanmıştır, Face CNN ise yüz tanıma problemini çözmeye odaklanır. Dr. Liu Wei'ye göre, Face R-FCN'nin bazı teknik detayları arXiv'de duyuruldu ve Face CNN'in teknik detaylarının yorumlanması da gelecekte sunulacak.

Face R-FCN kağıt adresi: https://arxiv.org/abs/1709.05256

Face R-FCN, WIDER FACE'in üç testinde de birinci oldu

Leifeng.com AI Technology Review'e göre, Face R-CNN ve Face R-FCN bu yıl sırasıyla Haziran ve Eylül aylarında arXiv platformunda yayınlandı. Dr. Liu Wei'ye göre, Face R-CNN, Tencent AI Lab'ın erken bir araştırma sürümüdür ve mevcut yükseltilmiş sürümü Face R-FCN'dir.

Yüz R-FCN, yüz algılama problemini çözmek için esas olarak R-FCN (bölge tabanlı tam evrişimli ağ) çerçevesine dayanır. "R-FCN çerçevesi temelinde, ResNet'i (artık ağ) temel ağ olarak çok ölçekli eğitim ve test, Çevrimiçi Sert Örnek Madencilik gibi iyileştirmelerle birlikte kullanıyoruz ve yüz özelliklerine dayalı konuma duyarlı bir ortalama havuz tasarladık. Algılama doğruluğunu iyileştirme yöntemi. "

WIDER FACE, bir eğitim seti, bir doğrulama seti ve bir test seti içeren, Hong Kong Çin Üniversitesi tarafından yayınlanan bir yüz algılama kıyaslama veri setidir. Toplam 32.000 resim ve 393.000 elle etiketlenmiş yüz içerir Etiketli yüzlerin boyutu, duruşu, açısı ve kapanması büyük ölçüde değişir.

Tencent AI Lab'ın Face R-FCN algoritması, WIDER FACE test platformunda resmi olarak belirlenmiş eğitim setini kullanır ve kolay, orta ve zor modların (Kolay, Orta, Sert) üç test alt kümesinin hepsinde birinciliği elde etti.

WIDER FACE yüz görüntüsü örneği, yeşil kutu Tencent AI Lab algoritmasının algılama sonucudur ve kırmızı kutu resmi açıklama sonucudur.

Tencent AI Lab tarafından sağlanmıştır

"Benzer algoritmalarla karşılaştırıldığında, Face R-FCN zor yüz örneklerini tespit etmede bir avantaja sahiptir. WIDER FACE test sonuçlarından, Easy set'ten Medium set'e kadar test zorluğu arttıkça da görülebilir. Sabit set, algoritmamızın öncü tarafı genişliyor. Dr. Liu Wei, Leifeng.com AI Technology Review'a söyledi.

GENİŞ YÜZ doğrulama seti sonucu ve test seti sonucu

mmlab.ie.cuhk.edu.hk aracılığıyla

Face CNN, MegaFace MF2'de `` Grand Slam '' kazandı

"Face CNN için, Tencent AI Lab ağ modeli yapısında, kayıp fonksiyonunda ve eğitim örnek madenciliğinde yenilikçi iyileştirmeler yaptı. Benzer algoritmalarla karşılaştırıldığında, Face CNN'in avantajı, farklı yüz uygulama senaryolarına daha iyi uyum sağlayabilmesidir. Düzenli kimlik değerlendirmesi, çapraz yaş tanımlama değerlendirmesi, 1: N tanımlama (Yüz Tanımlama), 1: 1 doğrulama (Yüz Doğrulama) vb. Gibi. "Dr. Liu Wei, Leifeng.com AI Technology Review'e tanıttı.

Face CNN'nin teknik gücü, bir yüz tanıma değerlendirme platformu olan MegaFace'in Challenge 2 (MF2) ile doğrulandı. MegaFace, Washington Üniversitesi Bilgisayar Bilimi ve Mühendisliği Laboratuvarı tarafından yayınlanan ve sürdürülen, herkese açık bir yüz veri kümesidir. Veri kümesi bir milyon resim içerir ve 690.000 yüz içerir.

MegaFace, Challenge 1 (MF1) ve Challenge 2 (MF2) olmak üzere iki farklı Zorluk içerir. Rekabet algoritmasını eğitmek için herhangi bir harici sınırsız yüz verisini kullanabilen MF1'den farklı olarak, MF2, eğitim için resmi sabit eğitim seti FaceScrub ve FGNET test setinin kullanılmasını gerektirir.Veri seti göz önüne alındığında, algoritmanın test sonuçları daha fazladır. nesnellik.

Sistemin, aşağıdakiler dahil milyonlarca yüz verisine dayalı olarak iki ana göstergenin doğruluğunu değerlendirmesi gerekir:

  • 1: N tanımlama, yani Yüz Tanımlama, N kişisel veritabanından bir hedef yüz bulmaya ihtiyaç duyar;

  • 1: 1 doğrulama, yani Yüz Doğrulama, verilen iki yüzün aynı kimlik olup olmadığını karşılaştırır.

MF2 iki tür göreve bölünmüştür: geleneksel tanıma ve çapraz yaş tanıma ve iki ana göstergenin doğruluğu ayrı ayrı test edilir, yani dört küçük görev.

MegaFace'in resmi web sitesinden Leifeng.com AI Technology Review, MF2 düzenli tanıma görevlerinin (1: N) tanınma doğruluğunun, MF2 düzenli tanıma görevlerinin doğrulama doğruluğunun (1: 1) ve MF2'nin çapraz yaş tanıma görevlerinin olduğunu öğrendi. MF2'nin tanıma doğruluğu (1: N) ve MF2'nin çapraz yaş görevinin doğrulama doğruluğu (1: 1) dört görevi arasında, Tencent AI Lab'dan Face CNN birinci oldu.

MF2'nin ayrıntılı değerlendirme sonuçları için lütfen şu adrese bakın:

Tencent AI Lab'ın "Temel Araştırma + İniş Uygulaması"

Dr. Liu Wei, yüz teknolojisinin geliştirilmesinde standart değerlendirme veri setinin durumunu doğruladı. "Yüz teknolojisinin geliştirilmesinde, standart değerlendirme veri setlerinin önemi açıktır. Standart veri seti testine katılırken, araştırmacılar algoritmanın performansını sabit bir standart altında değerlendirebilir ve bu yönde teknolojinin sürekli gelişimini teşvik edebilirler. "

Ancak yüz tanıma ve yüz algılama platformunda şampiyonluğu kazanmak, Tencent AI Lab için yapılan araştırma çalışmalarının yalnızca bir parçası. Dr. Liu Wei, Lei Feng.com AI Technology Review'e, Tencent'in AI Laboratuvarı Bilgisayarla Görme Merkezi'nin şu anki odağının makinelerin gerçek görsel dünyayı anlamasını sağlamak olduğunu söyledi.

"Araştırma odaklarımız arasında görüntü veya video düzenleme, oluşturma, analiz ve anlama, nesne veya yüz algılama, izleme ve tanımanın yanı sıra metin tanıma, 3D vizyon, SLAM ve vizyon temelli pekiştirmeli öğrenme vb. Yer alıyor."

Temel ve en ileri araştırma açısından, CV ekibi orta seviye ve üst seviye vizyona, özellikle video gibi görsel yapı verilerinin derinlemesine anlaşılmasına odaklanır ve ayrıca vizyon + NLP, vizyon + bilgi alma gibi önemli kesişen alanlar üzerinde çalışmaktadır. Liu Wei, Tencent AI Lab'ın devam eden veya planlanan araştırma projeleri, ultra büyük ölçekli görüntü sınıflandırma, video düzenleme ve oluşturma, zaman serisi veri modelleme ve artırılmış gerçeklik dahil olmak üzere hem zorlu hem de ilginç. Bu projeler Kolombiya'yı cezbetti. Ve Tsinghua ve yurtiçi ve yurtdışındaki tanınmış üniversitelerden diğer seçkin stajyerler katıldı. "

Aynı zamanda Dr. Liu Wei, Leifeng.com AI Technology Review'e, Tencent'in araştırma sonuçlarını uygulama açılış aşamasına hızlı bir şekilde ilerletmek ve yineleme süresini kısaltmak için "AI sonuçlarını akademi ve endüstri ile paylaşma" geliştirme yoluna bağlı kaldığını söyledi.

Yüz teknolojisi artık Tencent'in hükümet işleri, finans ve güvenlik gibi çeşitli iş senaryolarına entegre edildi.Tencent AI Lab'a göre, günlük teknoloji çağrılarının sayısı 600 milyonu aştı. Yüz teknolojisinin tipik uygulama senaryosu İnternet + kamu hizmeti alanındadır.Kullanıcılar otomatik tanımlamanın "yüz tabanlı hizmetini" tamamlamak için yüz doğrulamasından geçebilirler.

Dr. Liu Wei ayrıca Tencent AI Lab'ın diğer uygulamalarını Leifeng.com'un AI Technology Review'e tanıttı. "Yüz teknolojisine ek olarak, görüntü ve video gerçek zamanlı filtreleme ve vücut hareketi izleme gibi teknolojiler de araştırma geliştirildikten hemen sonra geliştirilecek. Uygulama senaryosu ile iyi bir örnek. "

SIGGRAPH ASIA 2016'nın katılımcı konuşmasında, Tencent AI Lab, gerçek zamanlı video stili dönüşümünün ilgili araştırma sonuçlarını gösterdi, yani derin bir ileri sinir ağını eğiterek videonun her karesini belirli bir sanatsal stile nasıl dönüştüreceğini öğrendi. Sistem, bir video çerçevesinin nasıl artistikleştirileceğini öğrenmenin yanı sıra, sanatsalleştirmeden sonra çerçeveler arasında tutarlılığın nasıl korunacağını da öğrendi. Uygulama düzeyinde, Tencent AI Lab, yerinde birçok farklı filme video sanatı filtreleri eklemenin etkisini gösterdi.

ai.tencent aracılığıyla

Ve son zamanlarda, mobil QQ'da yeni başlatılan "yüksek enerjili dans odası" işlevi, Tencent AI Lab tarafından geliştirilen "vücut hareketi izleme" mobil terminaline ilk inen işlevdir. İnsan vücudunun 22 temel noktasının gerçek zamanlı ve yüksek hassasiyetli tespiti sayesinde, sistem insan vücudunun hareketini tahmin edilen hareketle karşılaştırır ve ardından puanlar. Bunun aynı zamanda AI alanında Qualcomm ile yapılan ilk işbirliği olduğu bildirildi. Qualcomm Snapdragon Sinirsel İşleme Motoru (SNPE) SDK aracılığıyla, QQ "Yüksek Enerjili Dans Stüdyosu" uygulaması, tanıma verimliliğini ve çalışmayı iyileştirmek için QQ'nun karşılık gelen AI sinir ağını bulutta çalıştırmaya gerek kalmadan doğrudan cep telefonunda olabilir. zaman.

Tencent aracılığıyla

Nisan 2016'da kurulan Tencent AI Lab, temel yapay zeka araştırmaları ve iniş uygulamalarının kombinasyonuna odaklanarak bir yıldan uzun süredir "Her Yerde Yapay Zeka Yap" vizyonuna bağlı kalıyor. Araştırma yönleri arasında makine öğrenimi, bilgisayarla görme, konuşma tanıma ve Doğal dil işlemenin dört yönü ve teknoloji uygulamaları, içerik, oyunlar, sosyal etkileşim ve platform aracı yapay zekasının dört yönüne odaklanır. Tencent AI Lab'ın resmi tanıtımına göre, mevcut araştırma çalışmaları WeChat, QQ, Daily Express ve QQ Music gibi yüzlerce Tencent ürünü üzerinde uygulandı. Sektörde, Go AI "Fine Art" ve AI + tıbbi projesi "Tencent Miying" gibi projelerde atılımlar yapıldı.

Tencent AI Lab'ın yıllık seri inceleme özetine gelince, Leifeng.com bunu Bahar Festivali çevresindeki okuyuculara sunacak, bu yüzden bizi izlemeye devam edin.

Chen Zhipeng'in yeni görünüşü on santimetre boyunda! Netizen: Bu giymek için en normal zaman!
önceki
Hangzhou'daki bu metro reklamları yanıyor! Tüm bu değişiklikler Alibaba Cloud ile ilgilidir ...
Sonraki
Python dili - yapay zeka ile patlayan en güzel dil
Kırmızı halıda Zhou Xun, Wang Baoqiang ve diğerleri Liu Ruoying'e yardım etti.
Zhang Ruoyun'un Yeni Yıl Planı! Fotoğraf savaşı!
Yang Mi Chen Qiaoen'i "kapıyor" mu? Film ve televizyon dramasının oyuncu kadrosu ne kadar derin
"Cyberpunk 2077" Devasa Zeka: Anlatı ve ayrıntılar başarıyı veya başarısızlığı belirler
"Eski Çin Tıbbında" bir kaplan karısı var, ama onun hayatta karısı olmasını beklemiyordu!
Honor yönlendirme 2S, yeni akıllı yönlendirme ve geleneksel yönlendirmenin çakışması olan TP-LINK ile buluşuyor
Eski iPhone'un yavaşlamasına kasıtlı olarak Apple neden oldu; JD.com, önümüzdeki üç yıl içinde 1 milyar düzeyinde bir yatırımla ikinci el bir e-ticaret şirketine girdi; Faraday yeni bir şirket kurmak
Guo Degang, Pekin Operası'nı desteklemek için şahsen savaşa gitti! Başka bir geleneksel kültür havaya uçmak üzere!
Altın Hafta boyunca lazer TV satışlarındaki beş kat artışın arkasında: büyük ekranlar ve göz koruması tüketicilerin talebi haline geldi
Sabit TV'nin üç büyük dezavantajı vardır. Modüler TV, AI döneminin sıkışmış ve modası geçmiş olmamasını sağlar
Bu tür bir drama açıkça düşük değerli, garip oyunculuk, ama gerçekten izlemek istiyorum
To Top