g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

ECCV 2018 10 makale + 5 dünyada ilk, Megvii Teknolojisi ECCV'nin yolculuğunu hatırlayın

14 Eylül'de, yerel saatle, ECCV 2018, Avrupa'daki en iyi bilgisayarla görme akademik konferansı, Almanya'nın Münih kentinde başarıyla sona erdi. ECCV 2018'in 776 bildiriye katılan ve alan yaklaşık 3.200 katılımcıyla benzeri görülmemiş bir ölçeğe sahip olduğu bildirildi; ayrıca 43 Atölye ve 11 Öğretici var. Megvii Bilim ve Teknoloji Araştırma Enstitüsü, dekanı Dr. Sun Jian'ın önderliğinde etkinliğe gitti ve dünya çapında bilgisayar vizyonunun teknik alışverişini ve ürün uygulamasını teşvik etmek için çok çalıştı.

Uzun bir süredir, bilgisayar vizyonunun en iyi üç akademik konferansı olan CVPR, ECCV ve ICCV, endüstri, akademi ve araştırma taraflarından temsilcilerin teknik güçlerini göstermelerine ve akademik alışverişleri geliştirmelerine yardımcı olacak bir platform olarak çok önemli bir rol oynadı. Küresel yapay zeka tek boynuzlu atının temsilcisi olan Megvii Technology, bilgisayarla görmenin üç "C-bit" konferansında aktif bir katılımcıdır. ICCV 2017 Megvii Technology, Google ve Microsoft'un tekelini kırdı ve COCO şampiyonasını kazanan ilk Çinli şirket oldu; CVPR 2018'de Megvii Technology tam ölçekli bir ilerleme kaydetti.Sektör-üniversite-araştırma alışverişlerinde bir patlama başlatan birçok makale, demo, zorluk ve kokteyl partisi vardı.

Bu ECCV 2018'de Megvii Technology, yüksek düzeyde katılımı sürdürdü ve çok şey kazandı:

1. ECCV 2018, Megvii Araştırma Enstitüsü'nden birçok CV alt alanını kapsayan 10 makale içeriyordu;

2. 2018 COCO + Mapillary Challenge'da dört dünya ilki kazandı ve en çok ECCV şampiyonasına sahip şirket oldu;

3. Yüz tanıma teknolojisinin derin birikimine dayanan Megvii, 2018 WIDER Face Challenge dünya şampiyonunu kazandı.

Aşağıda Megvii Teknolojisinin ECCV yolculuğunun anları sunulacaktır.

Kabul edilen 10 makale, teknik olarak güçlü gücü tam olarak gösterir

ECCV 2018 resmi web sitesi bilgilerine göre Megvii Technology'nin toplam 10 kabul edilmiş bildirisi bulunmaktadır. İçerik açısından bakıldığında, makale yeni bir temsil önerisinden yeni bir modelin tasarımına ve hatta sinir ağı tasarım ilkelerinin ve yeni görevlerin, yeni yöntemlerin ve hatta yeni zayıf denetimli öğrenmenin formülasyonuna kadar birçok CV teknolojisini kapsıyor. Daha fazlasını keşfedin.

Megvii Teknolojisi özellikle aşağıdaki teknik alanlarda yeni atılımlar gerçekleştirdi: ağ mimarisi tasarımı (1 makale), genel nesne algılama (2 makale), anlamsal bölümleme (3 makale), sahne anlama (1 makale), metin tanıma ve algılama ( 2 makale), yüz tanıma (1 makale).

Sinir ağı mimarisi tasarımı alanında, ShuffleNet V2: Verimli CNN Mimari Tasarımı için Pratik Yönergeler onlara yalnızca balıkları öğretmekle kalmaz, aynı zamanda onlara balıkları da öğretir.Mobil terminalde derin öğrenme için, en yüksek hız ve doğruluğa ulaşmak için ikinci nesil evrişimli sinir ağı ShuffleNet V2 önerilmiştir. Sinir ağı mimarisi için optimum ödünleşmeler ve dört pratik tasarım kriteri de verilmiştir. Bu, şüphesiz, mobil tarafta derin öğrenmeye dayalı bilgisayarla görme teknolojisinin tam olarak uygulanmasını hızlandıracaktır. Ek olarak, makale ayrıca ağ mimarisi tasarımının FLOP'lar gibi dolaylı göstergeler yerine hız gibi doğrudan göstergeleri dikkate alması gerektiğini önermektedir.

Genel nesne algılama açısından, Megvii Teknolojisi, 1) yeni bir omurga ağı DetNet ve 2) hedef konumlandırma için yeni bir mimari olan IoU-Net tasarlayarak bu alanın gelişimini destekler.

DetNet: Nesne Algılama için Omurga ağı, görüntü sınıflandırma ve nesne algılama görevleri arasındaki boşluktan ilham alır. Ayrıntılı olarak, DetNet, farklı boyut ve ölçeklerdeki nesneler için FPN gibi daha fazla aşama kullanır; Öyle olsa bile, daha fazla özellik haritası çözünürlüğünü korumak açısından ImageNet eğitim öncesi modelinden daha üstündür. Ancak bu, sinir ağının hesaplama ve bellek maliyetlerini artıracaktır. Verimliliği sağlamak için, Megvii araştırmacıları, hem daha yüksek çözünürlüğe hem de daha geniş alıcı alana sahip, karmaşıklığı düşük Genişletilmiş Darboğaz'ı piyasaya sürdü. DetNet yalnızca sınıflandırma görevleri için optimize edilmemiştir, aynı zamanda konumlandırmaya da uygundur ve COCO'da nesne algılama ve örnek segmentasyon görevlerinde mükemmel sonuçlar göstermiştir.

Doğru Nesne Algılama için Yerelleştirme Güveninin (IoU-Net) Edinilmesi, bilgisayarla görmenin temel taşı olarak hedef algılama teknolojisinin altında yatan orijinal buluşu gerçekleştirmiştir. Spesifik olarak, gerçek hedefe karşılık gelen IoU'yu tahmin etmeyi öğrenerek, IoU-Net'in algılayabileceği sınırlayıcı kutunun "sabit konum güvenilirliği", IoU kılavuzlu bir NMS sürecini gerçekleştirir, böylece daha doğru sınırlayıcı kutunun bastırılmasını önler. IoU-Net sezgiseldir ve çeşitli farklı algılama modellerine kolayca entegre edilerek konumlandırma doğruluğunu büyük ölçüde artırır. MS COCO deneysel sonuçları, bu yöntemin etkinliğini ve pratik uygulama potansiyelini göstermektedir. Araştırmacılar ayrıca bu yeni bakış açılarının gelecekteki hedef tespit çalışmalarına ilham verebileceğini umuyorlar.

Megvii Teknolojisi, anlamsal bölümleme alanında en yüksek kağıt oranına sahiptir: 1) Gerçek zamanlı anlamsal bölümlemeyi gerçekleştiren çift yönlü bir ağ olan BiSeNet; 2) Anlamsal bölümleme özelliği füzyon sorununu çözmek için yeni ExFuse yöntemini optimize etti; ve 3) Örnek düzeyinde belirginlik algılama ve grafik bölümleme ile gerçekleştirildi Zayıf bir şekilde denetlenen anlamsal bölümleme için yeni bir yöntem.

BiSeNet: Gerçek Zamanlı Anlamsal Bölümleme için İkili Segmentasyon Ağı, üç ana akım gerçek zamanlı anlamsal bölümleme modeli hızlandırma yöntemine dayanır ve özellik füzyon modülü ve dikkat optimizasyon modülü yardımıyla gerçek zamanlı anlamsal bölümleme performansı yeni bir seviyeye yükseltilir .

ExFuse: Anlamsal Bölümleme için Özellik Füzyonunun Geliştirilmesi, anlamsal bölümlemenin ana akım yöntemlerinin yüksek ve düşük özellikleri doğrudan entegre ettiği sorununu çözmek için önerilmiştir. Yenilikçi bir şekilde düşük seviyeli özelliklerdeki semantik bilgileri sunar ve özellik birleştirme problemini optimize etmek için yüksek seviyeli özelliklere uzamsal bilgileri yerleştirir.

Zayıf Denetlenen Anlamsal Bölümleme için Görüntü Arası Belirgin Örnekleri İlişkilendirme Belirginlik algılama ve grafik bölümleme algoritmalarını entegre ederek, anlamsal bölümlemenin gelişimini hızlandırmak için yeni bir tür zayıf denetimli öğrenme yöntemi önerilmiştir. En önemli özelliği, her bir belirginlik örneğinin kendine özgü özelliklerini kullanmasıdır. Ayrıca, tüm veri kümesindeki farklı önemli örneklerin karşılıklı ilişkilerini araştırır.

Megvii, sahne anlayışını optimize etmek için birleşik bir algı analizi ağı olan UPerNet'i kullanır. Sahne Anlama için Birleşik Algısal Ayrıştırma, makine görme sisteminin bir görüntüden olabildiğince çok görsel kavramı tanımasını gerektiren UPP adlı yeni bir görev önerir; ayrıca karışık ek açıklamaları öğrenmek için eğitim stratejileri geliştirmek için çok görevli bir UPerNet çerçevesi önerir. UPP karşılaştırma testi sonuçları, UPerNet'in çok sayıda görüntü konseptini etkili bir şekilde bölümlere ayırabildiğini göstermektedir.

Metin tanıma ve algılama açısından, Megvii Teknolojisi iki teknik noktaya katkıda bulunmuştur: 1) yeni bir uçtan uca eğitilebilir ağ Mask TextSpotter ve 2) TextSnake, rastgele şekillere sahip esnek bir metin temsili.

Mask TextSpotter: Mask R-CNN'den Esinlenilen Rasgele Şekillerle Metin Bulmak için Uçtan Uca Eğitilebilir Bir Sinir Ağı, metin bölgelerini segmentlere ayırarak tespit edebilir ve herhangi bir şeklin metni için yetkin olabilir.Ayrıca, diğer yöntemlere kıyasla, Mask TextSpotter da yapabilir Anlamsal bölümleme yardımıyla hassas metin algılama ve tanıma gerçekleştirin.

TextSnake: Rasgele Şekillerdeki Metni Algılamak İçin Esnek Bir Temsil, herhangi bir şeklin metnine sığabilir, şekli dış ortama uyum sağlamak için bir yılan gibi değiştirebilir; Bu gösterime dayanarak, birkaç farklı içeren etkili bir sahne metni algılama yöntemi ortaya çıkmıştır. Formdaki metin veri seti (yatay, çok yönlü, eğri) mevcut en iyisidir.

GridFace, Megvii Technology tarafından yüz tanıma alanında yeni bir buluş. GridFace: Yerel Homografiyi Öğrenerek Yüz Düzeltme Dönüşümleri, yerel homografi dönüşümünü öğrenerek yüz deformasyonunu azaltabilir, önce düzeltebilir ve sonra tanıyabilir.Mükemmel düzeltme teknolojisi yüz tanıma performansını büyük ölçüde artırır. İlgili deneysel sonuçlar, bu yöntemin etkinliğini ve verimliliğini kanıtlamıştır.

2018 COCO + Mapillary dört şampiyonluk kazandı ve en büyük kazanan oldu

ECCV 2018'in en çok izlenen COCO + Mapillary ortak mücadelesinde Çin takımı tüm şampiyonaları kazandı. Megvii Technology, 3 COCO yarışmasına ve 1 Mapillary yarışmasına katılmış, 3 COCO birinciliği ve 1 Mapillary birinci, dört oyunun tamamını da kazanmış ve kasa bölümü ve panoramik bölümdeki "mücadelenin büyük yarısını" kazanmıştır. İnsan vücudunun kilit noktalarının tespiti için yinelemeli yeni bir keşif yapıldı.

Örnek segmentasyonu

Örnek segmentasyonu, mevcut makine vizyonu nesne tanımanın en ileri teknolojilerinden biridir ve aynı zamanda bilgisayarla görmenin temel görevlerinden biridir. Megvii'nin zaferinin anahtarı, modelin temel bileşeni olan Head üzerinde çok çalışmak ve Location Sensitive Header (LSH) adı verilen yeni bir yöntem önermektir.

Geleneksel Mask R-CNN yöntemi, örnek bölümleme ve konumlandırmanın doğruluğunu iyileştirmek için RoI Align'ı kullanır, ancak RoI Align'den sonra bileşeni Head'i düşünmek için zamanı yoktur. Megvii araştırmacıları, örnek segmentasyonuna dost ve konumlandırma doğruluğuna duyarlı bir kafa keşfetti. Özetle LSH, sınıflandırma ve bölümlemeyi birleştirerek görevlerin kombinasyonunu yeniden tasarladı.Bu, yalnızca geliştirme örneği bölümleme ve konumlandırma yeteneklerini optimize etmekle kalmaz, aynı zamanda konumlandırma ve sınıflandırma arasındaki çatışmaları da etkili bir şekilde önler. Sonunda, Megvii Technology 0,486 mmAP puanla ilk sırayı paylaştı.

Panorama segmentasyonu

Panoramik segmentasyon, bu zorluğun yepyeni bir görevidir ve mevcut bilgisayar vizyonu tanıma teknolojisinin ön saflarını temsil eder, hiçbirini temsil etmez. Görev seviyesi perspektifinden bakıldığında, panoramik bölümleme, örnek bölümlemeden daha ileri olacaktır. Bu yarışma için, uçtan uca çerçeveyi keşfettikten sonra, Megvii araştırmacıları iki aşamalı bir çözüm seçtiler: anlamsal bölümleme ve örnek bölümleme algoritmalarının çıktısını entegre etmek.

Bu yaklaşımın iki sorunun üstesinden gelmesi gerekir: 1) Malzemenin özelliği; 2) Şey tıkanması. İlk olarak, Megvii araştırmacıları daha güçlü bir Encoder Network for Stuff tasarımını test ettiler ve Stuff'ın performansını garantilemek için özel bir Object Context Network for Stuff Context tasarladılar; ikincisi, uçtan uca çerçevenin terk edilmesi nedeniyle görüntü füzyonu sırasında tıkanma sorunları ortaya çıkacaktır. Megvii araştırmacısı, farklı nesnelerin üst üste binen alanına göre görüntü anlayış düzeyini düzenlemek için özel bir Mekansal Hiyerarşik İlişki yöntemi verdi. Megvii teknolojisi büyük ilerleme kaydetti ve sonunda COCO + Mapillary örnek segmentasyonunun iki görevinde PQ 0.538 ve 0.412 ile birinci oldu.

İnsan vücudu anahtar nokta tespiti

İnsan vücudunun kilit noktalarının tespiti, insan vücudunun kilit noktalarını doğru bir şekilde konumlandırırken, birden çok açı, birden fazla hedef ve birden çok boyut gibi sınırsız koşullar altında insan vücudunu tespit etmelidir. 2016'daki ikinci COCO Mücadelesinden bu yana korunmuştur ve şu anda üçüncü yinelemedir. COCO 2017'de Megvii Technology bir kez birinci oldu ve bu sefer zafer arayışı hala "Kuang tarzı" çığır açan teknoloji tarafından destekleniyor.

Mevcut ana akım insan pozu tahmin ağları darboğazlarla karşılaştığından beri: Omurga ağını artırmanın doğruluk üzerindeki etkisi doygunluğa yaklaşıyor.Megvii araştırmacıları, çok seviyeli çapraz faz bağlantıları kullanabilen yeni bir Kademeli Omurga Ağı (CBN) tasarladı ve Doğrulukta önemli bir artış elde etmek için genelden inceye denetleme stratejisi. CBN, algılama sonuçlarının aşama aşama hassas bir şekilde iyileştirilmesini sağlamak için küçük bir ağ, çok aşamalı, çok katmanlı ara denetim ve çapraz aşamalı bağlantı kullanır.Son olarak, COCO 2018 insan vücudu anahtar nokta zorluğu veri setinde mmAP 0.764 doğruluğunu elde etti ve başlığı başarıyla savundu.

2018 WIDER Challenge, yüz tanıma yarışmasında birinci oldu

ECCV 2018 WIDER Face and Pedestrian Challenge, dünya çapında bir bilgisayar görme yarışması ve 400'den fazla ekibin katılmasını sağlayan yeni bir kıyaslama yarışmasıdır.Megvii Technology, yüz algılama yarışması WIDER Face Challenge'a katıldı ve sonunda 0,5582 mmAP elde etti. Sonuçlar kalabalıkları yendi ve şampiyonluğu kazandı.

Bu yarışmada Megvii Technology, yalnızca Cascade R-CNN'nin eşik iyileştirme algılama çerçevesindeki sürekli iyileştirme anlayışını absorbe etmekle kalmayan, aynı zamanda çıkarımın hala tek aşamalı bir dedektör olmasını sağlayan RetinaNet tabanlı yeni bir kademeli dedektör türü önerdi. Performans ve hız elde edin. Bu orijinal yöntemde mmAP, tek modelde ve tek ölçekte ikinci sırayı 1,4 puanla aştı ve son olarak mmAP ikinci sırayı 2,5 puanla aşarak büyük bir farkla birinci oldu.

Yukarıdakiler, Megvii'nin ECCV 2018 gezisine dair bazı bilgiler.

Bilgisayarla Görme Zirvesine küresel bir bilgisayar vizyonu tek boynuzlu at olarak katılmak, kişinin kendi gücünün doğrulanması ve pekiştirilmesi ve karşılıklı değişim ve öğrenme için iyi bir fırsattır. Megvii Teknolojisi, bilgisayarla görü ile başladı ve bilgisayarla görü ile derinlemesine ilgilendi.Yapay zeka ve derin öğrenmenin patlaması, bilgisayarla görmede de başladı. 540 milyon yıl önce Kambriyen biyolojisinde büyük bir patlama gibi, makinenin gözüyle başladı. Tetikleyici, gözlerin görünümüdür.

Görebilen makine gözü, bilgisayarla görme teknolojisinin ve uygulamasının ortak amacıdır, ancak teknoloji ilk adımdır. ECCV 2018'de, Megvii Teknolojisi tatmin edici bir cevap verdi.YZ teknolojisinin ilk adımını istikrarlı ve istikrarlı bir şekilde attı.Sonra bir sonraki adım, küresel olarak AI + IoT oluşturmak için olağanüstü teknolojiyi kullanmaktır.Megvii Teknolojisi şimdi Koştu.

Active Directory'de, şifreleri depolamak için tersine çevrilebilir şifreleme kullanan hesapları arayın

Kumar gerçekten zararlıdır! Gionee Başkanı Liu Lirong'un öz sermayesi mahkeme tarafından donduruldu