g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Tencent Youtunun ICCV 2017: 12 makale CV Top Conference, 3 Oral ICCV 2017 için seçildi

Leifeng.com AI teknolojisi inceleme notu: Bu makale ilk olarak Tencent Youtu genel hesabında yayınlandı.Leifeng.com AI teknoloji incelemesi, orijinal niyeti değiştirmeden yeniden basma ve düzenleme yetkisine sahiptir.

Bilgisayarla görme alanında en iyi üç konferanstan biri olarak bilinen ICCV (diğer ikisi CVPR ve ECCV), kısa süre önce dahil edilen bildirilerin listesini açıkladı.Tencent Youtu, 3'ü sözlü (Oral) olmak üzere toplam 12 bildiri seçti. Bu tür bildiriler toplam başvuruların yalnızca% 2,1'ini (45/2143) oluşturuyordu.

Bu yıl ICCV, 621'i konferans bildirisi olarak seçilen toplam 2143 bildiri başvurusu aldı ve kabul oranı% 29'du. 45 sözlü rapor (Sözlü) ve 56 önemli rapor (Gündem) vardır. Bu yılki katılımcı sayısının 3.000'i geçmesi bekleniyor ki bu da popülaritesini gösteriyor.

Bilgisayarla görme alanındaki en üst düzey konferanslardan biri olan ICCV'nin çalışmaları, bilgisayarla görme alanındaki en son gelişme yönünü ve düzeyini temsil etmektedir. Tencent Youtu tarafından seçilen makaleler birçok önemli noktayı ortaya koydu: Dünyanın ilk yapay zeka makyaj temizleme efekt algoritması; günümüzün en doğru tek görüntü derinliği tahmin algoritması; çok çerçeveli bilgileri entegre etmesi zor olan çok çerçeveli süper çözünürlüklü video sonuçlarına mükemmel çözüm; cep telefonlarında çift kameralı görüntü eşleştirme ve segmentasyonun benzeri görülmemiş araştırma sonuçları. Bu makaleler, ilginç ve ölçeklenebilir teknoloji uygulamalarını sunarak görsel yapay zekayı endüstri ve akademi arasında çapraz bir nokta haline getiriyor. Bunların arasında, Tencent Youtu'nun akıllı makyaj temizleyicisi süper çözünürlük, çift kamera füzyonu, filtre restorasyonu ve akıllı görüntü ölçeklendirme, harika uygulama olanaklarına sahip teknolojilerdir. Yeni uygulamalar oluştururken, mevcut algoritmaları da geliştirerek, sonraki araştırmalar için daha fazla deneyim ve rehberlik sağlarlar.

Tencent Youtu ekibi, seçilen 12 makaleyi analiz edecek ve herkesi ICCV sitesinde Tencent Youtu ekibiyle daha fazla bilgi alışverişi ve tartışmaya davet edecek.

Tencent Youtu'dan seçilen 12 makalenin ayrıntılı açıklaması

1. Sözlü kağıt: Makyaj-Git: Portre Düzenleme Kör Tersine Çevirme

(

Bu makale Hong Kong Çin Üniversitesi ile işbirliği içinde tamamlandı. Şu anda yüzlerin güzelleştirilmesi konusunda Tencent Daily P resimleri gibi pek çok uygulama var. Bu uygulamaların popülaritesi nedeniyle, İnternet'teki birçok kişi gerçek kişilerle eşleşmiyor. Bu makale, güzelleştirilmiş portreleri gerçek portrelere geri yüklemek için kullanılan kör görüntü restorasyonu için bir algoritma önermektedir. Sorunu basitleştirmek için, bu makale cilt beyazlatma, kırışıklık giderme ve cilt yenileme gibi global güzelleştirme operasyonlarının restorasyon problemlerinin nasıl çözüleceğine odaklanmaktadır. Bu işlemler görüntünün farklı ölçeklerinde yapıldığından ve yüz güzelleştirme uygulamalarında kullanılan işlem türlerini ve parametrelerini alamadığımız için, doğrudan mevcut modellerin kullanılması bu sorunu çözemez. Güzelleştirilmiş görüntüleri körü körüne geri yüklemek için yeni bir derin ağ yapısı, bileşen regresyon ağı öneriyoruz. Güzelleştirme sisteminin belirli parametrelerini bilmeden bile, ağ yapısı güzelleştirilmiş görüntüyü orijinal görüntüye daha iyi eşleyebilir. Deneyler, ağın farklı ölçeklerde yüksek derecede azalma sağlayabildiğini gösteriyor.

2. Sözlü kağıt: Ayrıntıları ortaya çıkaran Derin Video Süper çözünürlüğü

(

Bu makale Hong Kong Çin Üniversitesi, Toronto Üniversitesi ve Adobe ile işbirliği içinde tamamlanmıştır. Bu tez, videonun süper çözünürlüğü sorununu çözmeye, yani videodaki düşük çözünürlüklü çoklu çerçeve bilgisini net ve gerçek yüksek çözünürlüklü görüntüleri geri yüklemek için kullanmaya odaklanmaktadır. Geleneksel süper çözünürlük algoritması yavaş bir işleme hızına sahiptir ve kurtarma etkisi büyük ölçüde hantal parametre ayarlamalarına bağlıdır, bu nedenle pratik olması zordur. Derin öğrenmeye dayalı son algoritmalar, yetersiz hareket tahmini nedeniyle yeterli gerçek ayrıntıyı kurtarmada zorluk çekmektedir.

Bu makalenin yazarı ilke ve deneyden hareketle doğru hareket tahmininin görüntü ayrıntısı restorasyonu için gerekli olduğunu keşfetti ve işaret etti ve buna dayanarak alt piksel hareket dengeleme ağ katmanı SPMC Katmanı tasarlandı. Bu makalede önerilen video süper çözünürlüğü için uygun ağ yapısı gerçekleştirilebilir: tek bir model herhangi bir boyuttaki girişi, herhangi bir büyütmeyi ve herhangi bir çok çerçeveli işlemi işleyebilir. Aynı zamanda, bu makaledeki algoritma, zengin gerçek ayrıntılar elde etmek koşuluyla çok hızlı bir işlem hızına (aynı etkiye sahip geleneksel yöntemin yüz katı) ulaşabilir. Bu makaledeki algoritma, mevcut diğer algoritmaları, etkili, hız ve uygulanabilirlik açısından geride bırakabilir.

3. Sözlü makale: RGBD Anlamsal Bölümleme için 3D Grafik Sinir Ağları

(

Bu makale Hong Kong Çin Üniversitesi ve Toronto Üniversitesi ile işbirliği içinde tamamlandı. Bu tez, RGBD görüntülerinin anlamsal bölümleme problemini çözmeye odaklanmaktadır. Daha yaygın RGB görüntü bölümleme problemiyle karşılaştırıldığında, bu problem daha derinlemesine bilgiye sahiptir. Derinlik bilgisi nesnenin geometrik şeklini karakterize edebilir ve piksel parçalarının geometrik bağlantısını daha doğru bir şekilde tanımlayabilir. Bu nedenle, daha doğru görüntü segmentasyonu elde etmek için derinlik bilgisinin nasıl kullanılacağı, bu sorunun temel modülü haline gelmiştir. Önceki yöntemler, derinlik haritasını bir HHA görüntüsüne kodlamak ve ardından HHA görüntüsünü başka bir görüntü olarak kullanmak ve özellikleri çıkarmak için sinir ağına girmektir. Bu yöntem esasen 2B tabanlı bir çözümdür.Gerçek uzaydaki noktalar arasındaki bağlantıları daha iyi entegre edemez ve sonuçlarda derinlik bilgisini iyi bir şekilde kullanamaz. Bu makalenin yazarı, derinlik bilgisini bir noktanın gerçek üç boyutlu koordinatlarına dönüştürmeyi ve ardından noktanın gerçek koordinatlarına dayalı bir knn haritası oluşturmayı önermektedir. Grafik tabanlı bir sinir ağı kullanarak, görüntü özellikleri knn grafiğine göre her nokta için yinelemeli olarak güncellenebilir. Son olarak, sınıflandırma ağı, görüntü RGBD görüntü bölümleme sorununu tamamlamak için güncellenmiş özellikleri sınıflandırmak için kullanılır. Bu makaledeki algoritma, özelliklerin yinelemeli güncellemesini tamamlamak için geometrik bilgileri kullanan yöntemin etkinliğini yansıtan 2 boyutlu evrişime dayalı mevcut yöntemden daha etkilidir.

4. Poster kağıdı: Çift Lensli Akıllı Telefon Portreleri için Yüksek Kaliteli Yazışma ve Segmentasyon Tahmini

(

Bu makale, yüksek kaliteli cep telefonu çift kameralı görüntü eşleştirme ve segmentasyon algoritması önermektedir. Aynı zamanda, görüntü eşleştirme ve nesne segmentasyonu gibi iki ana bilgisayarla görme problemini çözer. Çift kameralar yavaş yavaş cep telefonlarının standart konfigürasyonu haline geldikçe, çift kameralı görüntülerin nasıl daha iyi eşleştirileceği akademik ve endüstriyel çevrelerin her zaman endişesi olmuştur. Yazar, bu problemi çözmek için ortak optimizasyon eşleştirme ve segmentasyon için bir çerçeve önermektedir Optimizasyonu verimli hale getirmek için bölgesel bir eşleştirme algoritması da önerilmektedir. Yazar, algoritma değerlendirmesi ve testi için 2000 çift çift kamera görüntüsünden oluşan bir veri seti oluşturdu.

5. Poster kağıdı: Stereo Eşleştirmenin Denetimsiz Öğrenimi

(

Bu makale Hong Kong Çin Üniversitesi ile işbirliği içinde tamamlandı ve esas olarak stereo eşleştirme için yeni bir denetimsiz öğrenme çerçevesi önerdi (Stereo Eşleştirme). Derin sinir ağları, stereo eşleştirme problemlerinde yaygın olarak kullanılmaktadır.Geleneksel yöntemlerle karşılaştırıldığında, doğruluk ve verimlilik önemli ölçüde geliştirilmiştir. Ancak, mevcut yöntemlerin çoğu denetimli öğrenmeye dayanmaktadır ve denetimsiz öğrenme yoluyla elde edilen bazı nadir modellerin doğruluğu ideal değildir.

Bu yazıda yazar, stereo eşleştirme problemleri için basit ve etkili bir denetimsiz öğrenme yöntemi önermektedir. Sol ve sağ tutarlılığı kontrol ederek, bu yöntem her yinelemede doğru eşleşmeleri filtreleyecektir. Bu doğru eşleşmeler, bir sonraki yineleme için eğitim verileri olarak kullanılacaktır. Birkaç yinelemeden sonra, bu yöntem sabit bir duruma yaklaşır. Deneysel sonuçlar, bu yöntemin doğruluğunun mevcut denetimsiz yöntemlerden çok daha üstün olduğunu ve denetimli yönteme çok yakın olduğunu kanıtlamaktadır.

6. Poster kağıdı: Sıfır sıralı optimizasyon görüntü filtresi restorasyonuna dayalı Sıfır Sıralı Ters Filtreleme

(

Bu makale Hong Kong Çin Üniversitesi, Toronto Üniversitesi ve Adobe ile işbirliği içinde tamamlanmıştır. Görüntü işleme alanında, araştırmacılar gürültü ve dokuyu ortadan kaldırmak için çok çeşitli filtreler tasarladılar. Bu makale farklı bir yaklaşımı benimsiyor ve ilk kez filtre probleminin yeni bir yönünü öneriyor ve tartışıyor: Görüntü filtresi tarafından işlenen resimler geri yüklenebilir mi?

Görüntü filtreleme sürecinin analizi yoluyla, bu makalenin yazarı, geleneksel yumuşatma filtresinin ölçüm teorisinde bir sıkıştırma eşlemesi olarak yaklaştırılabileceğini buldu. Bu nedenle, filtre uygulama algoritmasını bilmeden, basit bir sıfır dereceli yinelemeli algoritma, filtreden önceki etkiyi geri yükleyebilir. Yazar, algoritmayı yaygın olarak kullanılan düzinelerce filtre üzerinde test etti ve hepsi iyi sonuçlar elde etti. Algoritmanın kendisinin uygulanması basittir (filtre algoritmasını bilmeye gerek yoktur, gradyanı hesaplamaya gerek yoktur) ve etkisi dikkat çekicidir.Bu fenomen ve arkasındaki ilkenin, sonraki araştırmacıların filtre algoritmaları alanında yeni bir anlayışa sahip olmalarına neden olması beklenmektedir.

7. Poster kağıdı: Grafik model sinir ağına dayalı Grafik Sinir Ağları ile Durum Tanıma

(

Bu makale, Hong Kong Çin Üniversitesi ve Toronto Üniversitesi ile işbirliği içinde tamamlanmıştır.Yazar, bağlam tanıma görevleri için bir grafik modeline dayalı bir sinir ağı önermektedir. Bağlam tanıma görevinde, algoritmanın şekilde gösterilen eylemi ve özne, nesne, hedef, araç vb. Gibi eylemin tamamlanmasında yer alan çeşitli rolleri aynı anda tanıması gerekir. Farklı roller arasındaki ilişkiyi açık bir şekilde modellemek için, makalede önerilen grafik modeli sinir ağı, farklı rolleri temsil eden düğümleri birbirine bağlar ve ağın bilgi aktarımı yoluyla yapılandırılmış bir sonuç vermesini sağlar. Yazar, deneylerde doğrusal yapı, ağaç yapısı ve tamamen bağlantılı yapı gibi farklı bağlantı yöntemlerini karşılaştırdı ve tam bağlantılı yapının en iyi bağlam tanıma görevinde çalıştığını buldu. Son olarak makale, ağ tarafından öğrenilen farklı eylemler için benzersiz bağlantı yapısını da gösterir. Yukarıdaki şekilde gösterilen sonuç grafiği, farklı modellerin algılama sonuçlarını karşılaştırmaktadır. Mavi arka plan eyleme katılan rolü, yeşil arka plan doğru tahmin sonucunu ve kırmızı arka plan yanlış tahmin sonucunu gösterir. Tamamen bağlı grafik modelini kullanmanın diğer modellerin ürettiği bazı hataları düzeltebileceğini görebiliriz.

8. Poster kağıdı: Örnek Bölümleme için Sıralı Gruplama Ağları (SGN)

(

Bu makale Hong Kong Çin Üniversitesi, Toronto Üniversitesi ve Uber ile işbirliği içinde tamamlandı. Örnek bölümleme, nesne algılama ve anlamsal bölümlemeden daha başka bir tanıma görevidir. Grafikteki her bir örnek için piksel düzeyinde bir maske sağlamayı amaçlar, bu sadece farklı örnekleri ayırt etme yeteneğini korumakla kalmaz, aynı zamanda konumlandırma örneklerinin doğruluğunu da sağlar. Bu görev, otonom sürüş ve robotik gibi alanlarda geniş uygulama olanaklarına sahiptir.

Bu makalede yazar, bazı düşük seviyeli unsurları bir dizi sıralı farklı derin ağlar aracılığıyla daha karmaşık bir yapıya kademeli olarak birleştirmenin ve sonunda her bir örneğe karşılık gelen maskeyi elde etmenin yepyeni bir yolunu önermektedir. Bu yöntem aynı zamanda bazı erken çalışmalarda aşağıdan yukarıya yönteminin ayrılmış nesneyi birden çok nesne olarak yanlış değerlendireceği sorununu da çözer. Bu yöntem, her iki veri setinde de önceki çalışmalardan daha iyi sonuçlar elde etti.

9. Spotlight kağıt: Zayıf denetimli ve kendi kendini denetleyen derin evrişimli sinir ağı görüntü ölçekleme algoritmasına dayalı İçeriğe Duyarlı Derin Görüntü Yeniden Hedefleme için Zayıf ve Kendi Denetimli Öğrenim

(

Bu makale, Güney Kore'deki KAIST Üniversitesi ile işbirliği içindedir. Dijital görüntüleme cihazlarının popülerliği ile birlikte takip eden bir sorun, aynı resmin farklı çözünürlükteki cihazlara uyarlanabilmesidir. Geleneksel doğrusal yakınlaştırma veya basit kırpma yöntemleri, görüntü içeriğinin bozulması ve içerik kaybı gibi olumsuz etkiler getirecektir.

Yazar, zayıf denetimli ve kendi kendini denetleyen derin evrişimli sinir ağını (WSSDCNN) kullanarak görüntü ölçekleme için bir algoritma önermektedir. Algoritma, resimdeki önemli anlamsal bilgilerin orantılı yapısını mümkün olduğu kadar korurken, resim boyutunu ayarlamayı hedefleyerek giriş resmi ile hedef çözünürlük resmi arasında piksel düzeyinde bir eşleştirme kurar, böylece içerik bozulmasını, içerik kaybını vb. Önler. Geleneksel yöntemin kusurları, resim görüntüleme efektinin tutarlılığını büyük ölçüde korur.

10. Poster kağıdı: RMPE: Bölgesel Çok Kişili Poz Tahmini

(

Bu makale Şangay Jiaotong Üniversitesi ile işbirliği içinde tamamlandı. Doğal sahnelerde çok kişili jest tanıma, bilgisayar görüşü alanında her zaman en zor konulardan biri olmuştur. Mevcut kişi algılama algoritması çok kararlı olmasına rağmen, küçük hataların önlenmesi yine de zordur.

Yanlış kişi algılama sonuçları durumunda istikrarlı çok kişili hareket tanıma sorununu hedefleyen yazar, yepyeni bir çözüm - bölgesel çok kişili hareket tanıma algoritması (RMPE) önermektedir. Algoritma, Simetrik Uzaysal Trafo Ağı'nı ve tek kişilik poz tahmin algoritmasını kapsamlı bir şekilde kullanır, böylece çok kişili poz tanıma görevlerinin kişi algılamanın doğruluğuna bağımlılığından kurtulur ve tanımayı parametreleştirilmiş kişi pozuyla daha fazla ifade eder. Sonuçlar optimize edildi. Genel veri seti MPII üzerindeki test sonuçlarına göre, bu algoritma CMU tarafından önerilen OpenPose algoritmasından% 1 daha yüksek, özellikle dirsekler, bilekler, dizler ve ayak bilekleri gibi küçük anahtar noktaların iyileştirilmesi.

11. Poster kağıdı: Kör Görüntü Çapaklarının Giderilmesi için Ayrımcı Veri Uydurma İşlevlerini Öğrenme

(

Bu tez Nanjing Bilim ve Teknoloji Üniversitesi, Dalian Teknoloji Üniversitesi ve California Merced Üniversitesi ile işbirliği içinde tamamlandı. Bu tez, görüntü bulanıklaştırma problemini çözmek için bir veri uydurma işlevi hakkındadır. Görüntü çapaklarının giderilmesi, veri uydurma işlevinin makul bir tanımını ve görüntü ön bilgisi gerektiren klasik bir bilgisayar görme problemidir. Bununla birlikte, mevcut algoritmaların çoğu, görüntü önsellerini daha iyi tanımlayarak çapak giderme etkisini iyileştirir ve veri uydurma işlevleri üzerine nispeten az sayıda çalışma vardır. Bu makale, daha iyi veri uydurma işlevleri elde etmek için bulanık görüntüler ile net görüntüler arasındaki ilişkiyi öğrenmek için bir makine öğrenme yöntemi önermektedir. Yerleştirme işlevi, daha doğru bir bulanıklık çekirdeğinin tahmin edilmesine daha da yardımcı olabilir. Algoritma, çok zor bir görüntü veri setinde en iyi sonuçları elde etti.

12. Poster kağıdı: Nesneleri ve Malzeme Aktarımını Kullanarak Zayıf Denetlenen Nesne Yerelleştirme

(

Bu makale Edinburgh Üniversitesi ile işbirliği içinde tamamlandı. Bu makale, zayıf denetlenen nesne algılama sorununa odaklanır ve yardımcı olmak için bilinen nesnelerin (sayılabilir) ve maddelerin (sayılamayan) bilgi geçişini kullanır. Zayıf bir şekilde denetlenen nesne tespitinin hedef kümesindeki nesnelerin konum bilgileri bilinmezken, konumları ve işaretleri dahil olmak üzere kaynak kümesindeki karşılık gelen nesnelerin ve maddelerin bilgileri bilinmektedir. Kaynak koleksiyondaki ve hedef koleksiyondaki nesne kategorileri, benzer görünüm veya ortak malzeme arka planı gibi belirli benzerliklere sahiptir.

Bu benzerliği aktarmak ve kullanmak için, bu makalenin yazarı kaynak kümesinden üç tür bilgi elde eder: bir bölümleme modeli; kaynak kümesinin nesne kategorileri ile hedef kümenin arasındaki benzerlik; kaynak kümesindeki nesne ile madde kategorisi arasındaki simbiyoz. Yazar daha sonra bölümleme modelini ilk olarak hedef resim kümesini bölümlere ayırmak için kullanır ve aynı zamanda bölümleme sonuçlarını değiştirmek için nesne malzeme kategorileri arasındaki benzerliği ve simbiyozu kullanır. Düzeltilmiş sonuçlar, hedef kümesindeki nesnelerin ortak eğitimi ve tespiti için çoklu nesne algılama çerçevesine yerleştirilmiştir. Bu makaledeki algoritmanın etkisi, genel veri kümeleri üzerindeki diğer zayıf denetlenen nesne algılama algoritmalarını aşmaktadır. Aynı zamanda bu makale, test için çok farklı hedef kümeleri ve kaynak kümeleri olan nesne kategorilerini özel olarak seçmektedir, bu da bu makaledeki geçiş algoritmasının güçlü bir genelleme yeteneğine sahip olduğunu göstermektedir.

ICCV'yi anlamak için bir dakikanızı ayırın

ICCV, Elektrik ve Elektronik Mühendisleri Enstitüsü (IEEE) tarafından desteklenen Uluslararası Bilgisayar Görme Konferansı (Uluslararası Bilgisayar Görüsü Konferansı) olarak adlandırılır. Dünyanın en iyi akademik konferansı olarak, ilk Uluslararası Bilgisayar Görme Konferansı 1987'de Londra'da açıldı ve daha sonra iki yılda bir düzenlendi. Bu yıl ICCV, 22-29 Ekim tarihleri arasında İtalya'nın Venedik kentinde düzenlenecek.

Bilgisayarla görme alanındaki en üst düzey konferanslardan biri olan ICCV, Çin Bilgisayar Topluluğu tarafından önerilen bir A tipi konferanstır. Makale koleksiyonu, bilgisayarla görme alanındaki en son gelişme yönünü ve seviyesini temsil eder. Konferans bildirileri düşük bir kabul oranına sahiptir ve genel SCI dergilerinin çok üzerinde olup, Çin Bilimler Akademisi'nin JCR Bölümü 1 ve JCR Bölümü Web of Science Q1'deki en iyi akademik dergilere kabaca eşdeğerdir.

"Düşler" yalnızca bir oyun değil, aynı zamanda yaratıcılığınız için bir platformdur

"Girlfriend 2", 700 milyon kadınla kız arkadaşların sevgisini yorumlamak için duygusal göz yaşartıcı bir kısa film yaratıyor