Akademik araştırmadan uygulama uygulamasına kadar, bu altı bilgisayar görüşü uzmanı CV oturumunda ne hakkında konuştu? CCF-GAIR 2018

AI teknolojisi inceleme basını: 2018 Küresel Yapay Zeka ve Robotik Zirvesi (CCF-GAIR) Shenzhen'de düzenlendi.Zirve, Lei Feng.com ve Hong Kong Çin Üniversitesi (Shenzhen) ev sahipliğinde Çin Bilgisayar Federasyonu (CCF) ev sahipliğinde gerçekleştirildi. Baoan Bölge Hükümeti'nden güçlü bir rehberlik aldı. Robotik akademisi, endüstrisi ve yatırım çevreleriyle üst düzey değişim etkinliği, Çin'deki yapay zeka alanındaki en güçlü sınır ötesi değişim ve işbirliği platformunu oluşturmayı amaçlıyor.

Leifeng.com CCF-GAIR 2018, 1 ana mekan ve 11 özel oturum (Biyonik Robotik Oturumu, Robot Endüstrisi Uygulama Oturumu, Bilgisayarla Görme Oturumu, Akıllı Güvenlik Oturumu, Finansal Teknoloji Oturumu, Akıllı Sürüş Oturumu) sağlayarak önceki iki oturumun "birinci sınıf" dizisine devam ediyor , Üç sektörden katılımcılara daha ileriye dönük ve pratik bir konferans içeriği kombinasyonu sağlamayı amaçlayan NLP oturumu, AI + oturumu, AI çip oturumu, IoT oturumu, yatırımcı oturumu) ve Canlı deneyim.

30 Haziran'da CCF-GAIR konferansı ikinci güne devam etti ve planlandığı gibi bilgisayarla görü özel oturumu düzenlendi. Bu oturum, sabah oturumu "Bilgisayarla Görme Sınırları ve Akıllı Video" ve öğleden sonraki oturum "Bilgisayarla Görme ve Tıbbi Görüntü Analizi" olmak üzere iki ana başlıktan oluşmaktadır. Bu makale, bilgisayarla görme oturumunun ilk yarısının bir derlemesidir.

Sabah oturumundaki açılış konuşmasında, Hong Kong Bilim ve Teknoloji Üniversitesi Elektronik ve Bilgisayar Mühendisliği Bölümü öğretim üyesi ve RAM-LAB direktörü Liu Ming başkanlık etti. Bu bağlamda, Hong Kong Bilim ve Teknoloji Üniversitesi, Long, Megvii'nin baş bilim adamı Sun Jian, Yuncong Technology kurucu ortağı Yao Zhiqiang, Zhenzhi Teknoloji CEO'su Ren Peng, Yuntian Lifei baş bilim adamı Wang Xiaoyu ve Shangtang kurucu ortağı Lin Dahua'ya bu akademisyenleri yetkilendirdi. Endüstrideki ve endüstrideki birçok büyük inek, yalnızca bilgisayarla görme teknolojisinin en son araştırma trendlerini değil, aynı zamanda ilgili teknolojilerin yönünü de içeren 6 derinlemesine paylaşım oturumu gerçekleştirdi.

İlk ortaya çıkan, Hong Kong Bilim ve Teknoloji Üniversitesi Yetkili Dragon.

* Hong Kong Bilim ve Teknoloji Üniversitesi Profesörü, ICCV 2011 Başkanı, IEEE Üyesi Quan Long

Profesör Quan Long'un bugün paylaştığı konu "Bilgisayarla Görme, Tanıma ve 3 Boyutlu Yeniden Yapılandırma" dır. Esas olarak üç yönden, yani bilgisayarla görmenin temeli, bilgisayarla görmenin değişmesi ve gelişmesi ve bilgisayarla görmenin en son gelişmesi.

Derin öğrenme teknolojisinin gelişmesi nedeniyle yapay zekanın çok ısındığını ve bir yapay zeka alanı olarak bilgisayar görmesinin de aşırı derecede ısındığını söyledi.

Yapay zekanın amacı, bilgisayarların görmesini, dinlemesini ve okumasını sağlamaktır.Bunun önemli bir kısmı da görüntülerdir. Profesör Quan Long, vizyonun yapay zekanın temel alanı olduğuna inanıyor, çünkü görme insan duyu sisteminin% 80'ini kaplıyor ve yapılması en zor kısım. Hatta bilgisayar vizyonunun yapay zekanın "devrimini" teşvik edecek belirleyici teknoloji olduğuna inanıyor.

Ardından Profesör Quan Long, bilgisayarla görmenin değişimlerini ve gelişimini kısaca gözden geçirdi.

1970'lerde ve 1980'lerde, bilgisayar vizyonu ilk gelişimini gerçekleştirdi.Profesör Quan Long, 1980'lerde ilgili işlere katıldığı için şanslı olduğunu söyledi.O zamanlar, bazı özellik noktaları aracılığıyla temel olarak bazı basit nesne sınıflandırma çalışmaları yaptı.

1990'lardan 2000'e kadar olan dönemde değişiklikler oldu Geçmişte bazı özellik noktaları çıkarıldı.Bu yıllarda herkes geometri sorununa dönüp bakmaya başladı.Geometri "üç boyutlu yeniden yapılanma" dır. Temel olarak noktaları tanımlayın. Bu, bilgisayarla görmenin gelişmesini teşvik etmek için çok önemli bir şeydir.

2012'den sonra bilgisayar görüşü evrişimli sinir ağı (CNN) çağına girdi ve alan dünyayı sarsan değişikliklere uğradı: Temelde, özelliklerden çeşitli algoritmalara kadar, CNN tarafından birleştirildi. CNN'in bir avantajı vardır, uçtan uca ve uygulaması nispeten kolaydır.

Profesör Quan Long, bilgisayar vizyonunun gelişiminden bahsederken, herkesin artık tanıma yaptığını, ancak bu tüm bilgisayar vizyonunu temsil etmediğini, tanımanın sadece bir parçası olduğunu söyledi. Biraz etkileşim ve algı yapmak istiyorsanız, önce üç boyutlu olanı geri yüklemelisiniz, bu nedenle tanıma temelinde bir sonraki seviye "üç boyutlu yeniden yapılandırma" ya gitmelidir.

Bu alanda Profesör Quan Long ve araştırma ekibi çok çalışarak belli sonuçlar elde etti ve Nisan ayında dünyada iki bilgisayarla görme sıralaması kazandı.

Tabii ki, derin öğrenmeyle yönlendirilen mevcut bilgisayarla görme teknolojisinin hala birçok eksiklik ve zorluğu var, bu da daha fazla endüstri araştırmacısının, özellikle evrişimli sinir ağlarının gelişimi daha yüksek boyutlara gittiğinde, keşfetmeye devam etmesini gerektiriyor.

* Sun Jian, Megvii Teknolojisi Baş Bilimcisi ve Araştırma Enstitüsü Dekanı

Ardından Megvii Teknolojisinin baş bilim adamı Sun Jian sahneye çıktı ve bulut, terminal ve çekirdek görsel hesaplama vizyonunu paylaştı. Megvii Teknolojisi 7 yıldır kurulmuş olup bilgisayarla görme algısı alanına odaklanmaktadır.

Basit bir ifadeyle, bilgisayar görüşü, makinenin görmesine izin vermektir.Eğer daha ileri giderse, makine bir görüntüyü veya videoyu anlayabilir.Ne yapabiliriz? Bu soruya yanıt olarak Sun Jian ve Megvii'nin verdiği cevap, "yüz milyonlarca kamerayı etkinleştirmektir", böylece her alanda kullanılan kameralar ister bulutta, ister cihazda, ister çipte akıllı olsun.

Sun Jian, Megvii'nin her zaman sınıflandırma, algılama ve bölümleme dahil olmak üzere bilgisayarla görmenin birçok temel meselesini incelediğini söyledi. Bir resmi, bir resmin farklı alanlarını ve bir resmin her pikselini tanıyor. Bunlar arasında sınıflandırma En temel çalışmadır. Giriş bir video ise, tanımlama için çerçeveler arasındaki zaman ilişkisinin kullanılması gerekir.

Sun Jian kısaca bilgisayarla görmenin tarihinden bahsetti ve ona göre bilgisayarla görmenin gelişimi, görüntülerin nasıl temsil edildiğinin tarihini incelemektir. 1980'lerde, erken sinir ağları yüz ve metin tanımada başarılı bir şekilde kullanıldı, ancak o zamanlar bu iki alanla sınırlıydı, bu nedenle görüntü temsilinin ne olduğunu tanımlamak zordu.

2000'li yılların başında derin öğrenme popüler hale gelmeden önce daha sıcak olan, yani Özellik temelli bir yöntem vardı.Özelliği resimlerden çıkarmak ve sonra onu analiz etmek derin öğrenmeden önce en iyi yöntemdi. Ancak bu yöntemin en büyük sorunu, iki eksikliğinin olmasıdır: Birincisi, genel bir doğrusal olmayan dönüşümdür ve vektör dönüşümlerinin sayısı sınırlıdır; ikincisi, Özellik dahil, içindeki parametrelerin çoğu manuel olarak tasarlanmıştır.

Bugün derin sinir ağlarına dönersek, bu eksikliklerin her ikisi de giderildi. Birincisi, tüm doğrusal olmayan dönüşümün birçok kez yapılabilmesidir, bu nedenle çok güçlü bir tanıma yeteneğine sahiptir; ikincisi, tüm parametrelerin birlikte eğitilmesidir, bu iki nokta, derin sinir ağının gerçekten çok iyi sonuçlar elde etmesini sağlar. Sun Jian'ın Microsoft'tayken önerdiği 152 katmanlı ResNet, ImageNet'teki insan yeteneklerini ilk kez aştı.

2012'den beri çeşitli Ağlar ortaya çıktı. Sun Jian, bu Ağların basit bir sınıflandırmasını üç farklı bilgi işlem platformu olan bilgi işlem platformları açısından yaptı: bulut, terminal ve yonga. GoogleNet ve ResNet bulut üzerindedir; geçen yıl Megvii tarafından önerilen Google MobileNet ve ShuffleNet bu kategoriye aittir; ve Megvii tarafından önerilen BNN ve DorefaNet gibi bazı Ağlar çip üzerindedir.

Sun Jian, özellikle cep telefonları için tasarlanmış olan ShuffleNet'in yapısına daha ayrıntılı bir giriş yaptı. Bu yıl gruplanmış evrişim fikrinden vazgeçerek ShuffleNet'in ikinci versiyonunu da tasarladılar, ancak çok basit bir yapıya sahip yeni bir yöntem sundular.

Her platform için ilgili ağları ayrı ayrı tasarlamanın mevcut durumu göz önüne alındığında, Sun Jian, gelecekte her platformdaki sinir ağı tasarımını ve optimizasyon sorunlarını tek tip bir şekilde çözebilecek bir "MetaNet" in ortaya çıkacağına inanıyor.

Son olarak Sun Jian, Megvii'nin yüz tanıma, araç tanıma, yüz ödeme, akıllı güvenlik, akıllı finans vb. Dahil olmak üzere bulut, terminal ve çekirdek platformlardaki bilgisayarla görme uygulamalarını kısaca tanıttı.

* Yuncong Technology'nin kurucu ortağı Yao Zhiqiang

Yuncong Technology'nin kurucu ortağı Yao Zhiqiang, daha sonra sektör hakkındaki anlayışını ve şirketin bir yapay zeka vizyon çözüm şirketi olarak ilerlemesini paylaşmak için sahneye çıktı. Yapay zekanın en büyük rolünün devasa bilgi işlem kaynakları, entelektüel kaynaklar ve geniş bir uygulama yelpazesi arasında bir köprü görevi görmek olduğuna inanıyor. Yuncong Technology, 2015 yılında kuruluşundan bu yana, şirketin insan-bilgisayar etkileşimi alanındaki önemli konumunu kilitledi, ancak yapay zeka teknolojisi, hizmetleri ve ekoloji anlayışı üzerine birçok keşif yaptı.

Yao Zhiqiang, bir yapay zeka şirketinin hızlı bir şekilde gelişmek için teknik kaynakları, veri kaynaklarını, platformları, portalları ve fonları bir araya getirmesi gerektiğine inanıyor.Bazı olgun şirketler, yeni şirketlerin belirli senaryolarda ekimlerini derinleştirebilmesi için bazı teknolojileri yeni şirketlere açacak. Veri kaynağı avantajlarının birikimi de çok önemli.Ayrıca platform kaynakları da var.Şu anda bulutun birçok yapay zeka servisi bulut platformu üzerinden açık durumda.

Şu anda Cloud, veri alanında ortak laboratuvarların kurulmasından sektör içi verileri alıyor ve ilgili sektörde eğitim ve hizmetler sağlıyor. Yuncong ayrıca hükümetle büyük veri iş birliğine sahiptir. Bankacılık açısından Yao Zhiqiang, Yuncong Bank'ın halihazırda endüstrinin en büyük yüz tanıma sağlayıcısı olduğunu ve daha fazla ekolojik bankayı eksiksiz akıllı bankacılık hizmetleri sağlamaya teşvik etmeyi umduğunu duyurdu. Güvenlik endüstrisinin de birçok zorluğu vardır: Güvenlik nedeniyle, güvenlik endüstrisi bilgi edinme, şifreleme ve şifre çözme gibi karmaşık zorluklar içerir.

Gelecekte, bulut asla endüstrileşmiş bir şirket olarak konumlandırılmayacak, ancak yapay zeka ve insan-bilgisayar etkileşimi alanlarına dayalı bir şirket olacak. Daha fazla endüstriyi genişletmek ve daha fazla endüstri ve insanı birbirine bağlamak için mevcut kaynakları kullanacak.

* Ren Peng, Zhenzhi Technology'nin kurucu ortağı ve CEO'su

Zhenzhi Technology'nin CEO'su Ren Peng, akıllı bir kamera ürününün nasıl geliştirileceğinden bahsetti. Zhenzhi Technology, bilgisayar kullanımını vizyon teknolojisine dönüştürmeye kararlıdır ve akıllı ulaşım, akıllı topluluklar ve güvenlik gibi çeşitli senaryolarda taşıyıcı olarak akıllı kameralar uygulanmıştır. Ren Peng, tamamen akıllı bir kameranın, bir sahne uygulamasının algı ihtiyaçlarını karşılayan bir kamera olduğunu ancak farklı alanların sahne için farklı algılama ihtiyaçları olduğunu söyledi.

Ren Peng, altta pikseller, ortada nesneler ve üstte davranışla tam bir algılama uygulaması senaryosunu tanımlamak için bir "piramit türü" kullanır. Ancak sorun şu ki, çoğu uygulama şu anda nesne katmanında kalıyor ve piksel düzeyindeki sorunların çoğu çözülmemiş.Örneğin, akıllı şehirler karar vermek için bulut tanıma sonuçlarını kullanıyor, ancak ön uç görüntü bulanık ve tanıma yanlış pozitiflere sahip, bu da karar vermeyi ve hatta sistem işlem verimliliğini etkileyecek. .

Sonuç olarak, bu akıllı kameranın gerçekleştirilmesi üç zorluk içeriyor: görüntüleme, algoritmalar ve üretim. Görüntüleme açısından, mevcut akıllı kamera görüntüleme değerlendirme endüstri standartları eksik.Aslında, donanım, yapı, termal tasarım, optik ve diğer sorunları çözmenin yanı sıra, ISP (Görüntü Sinyali İşleme) kameranın temel sorunudur.Akıllı kameralar ve sıradan kameralar en büyüğüdür. Aradaki fark, akıllı kameralar için ISP geliştirmenin özünün nesne algısına dayanmasıdır. Algoritmalar açısından, akıllı kameraların gömülü cihazlarda geliştirilmesi için öncelikle veri çeşitliliğini, dengesini ve sahne uyarlanabilirliğini kontrol etmek çok önemlidir ve ikinci olarak çip çözümlerinin seçiminde büyük zorluklar vardır. İmalat açısından tedarik zinciri kaçınılmaz bir sorundur.

Zhenzhi, dürbün derinlik kameraları konusunda iyimser olmanın yanı sıra, çoklu sensör füzyonu gibi daha fazla algılama çözümleri de deniyor.

* Wang Xiaoyu, Yuntian Lifei Baş Bilimcisi

Yuntian Lifei'nin baş bilim adamı Dr. Xiaoyu Wang, akademi dünyasından endüstriye kadar olan deneyiminden yapay zeka uygulamaları hakkında önemli görüşler paylaştı.

Dr. Xiaoyu Wang, 2012 yılında NEC Amerikan Araştırma Enstitüsü'nde insansız araçlar ve yüz tanıma üzerine bir araştırma yaptı ve ardından girişimciliğin ilk günlerinde Snapchat Yapay Zeka Araştırma Enstitüsü'nde AR ve arka plan araştırmasıyla ilgili araştırmalardan sorumlu oldu. Yuntian Lifei, Dr. Wang Xiaoyu'nun kariyerinin üçüncü durağıdır ve AI + yeni polis işleri, AI + yeni topluluklar ve AI + yeni perakendeye odaklanır.

Xiaoyu Wang, insanlarla özgürce iletişim kurabilen güçlü yapay zekanın yüz yıl sonrasına kadar gerçekleştirilemeyeceğine inanıyor. Mevcut yapay zeka, daha büyük miktarda veriyle temel performansta daha fazla değişiklik ve daha doğru modellerin kurulmasını getiriyor. Şu anda yapay zekanın ana gelişimi.

Snapchat ve Facebook'un rekabetçi gelişimini örnek alan Dr. Xiaoyu Wang, teknolojik gelişimin zamanlamasının çok önemli olduğu görüşünü paylaştı.Teknolojinin tam anlamıyla olgunlaşması gerekmiyor. Önemli olan kullanıcılar tarafından tanınan ürünleri sağlamaktır; teknolojik uygulamaların doğru açıyı bulması gerekir Ve platform; algoritma teknoloji ile eşdeğer değildir, verinin önemi daha belirgindir.

* Lin Dahua, SenseTime Technology'nin kurucu ortağı ve Hong Kong Chinese-Shang Tang Ortak Laboratuvarı Direktörü

Hong Kong Çin Üniversitesi Bilgi Mühendisliği Bölümü'nde yardımcı doçent, SenseTime'ın kurucu ortağı ve Hong Kong Çin Üniversitesi SenseTime Ortak Laboratuvarı yöneticisi Profesör Lin Dahua, bilgisayarla görme oturumunda bir konuşma yaptı. Bilgisayarla görmenin tarihini gözden geçirdi ve derin öğrenmenin tanıtılmasının bilgisayarla görü için atılımlar yaptığından bahsetti.

Lin Dahua, büyük miktarlarda veri ve uygulama senaryo verilerinin birikiminden, GPU'ların geliştirilmesinden ve hesaplama gücündeki önemli artıştan söz ederek algoritmanın ilerlemesine temel oluşturdu ve bu temelde günümüzün yapay zekasının başarısını ve bilgisayarla görme teknolojisinin başarısını getirdi. Uygulama senaryolarının açılışı.

Aynı zamanda, son birkaç yıldaki bilgisayarla görmenin gelişimini de gözden geçiren Lin Dahua, bu teknoloji ile yapılabilecek hala çok şey olduğuna ve daha yapılacak çok yol olduğuna inanıyor. Üç yönde çaba gösterilebileceğine inanıyor: Bilgisayarla görme teknolojisinin tanınma verimliliğini artırmak, veri maliyetlerini azaltmak ve tanıma kalitesini iyileştirmek.

Bu aşamada, bilgisayar görüşü, yüksek performans elde etmek için veri birikimine ve bilgi işlem kaynaklarına güvenerek, kapsamlı bir şekilde gelişmeye devam etmektedir. Ancak gelecekte daha fazla optimizasyona ihtiyaç var Shangtang vakasını video ve otonom sürüşte paylaştı. Buna ek olarak, mevcut bilgisayarla görme araştırması, etiketleme için hala büyük ölçüde insan gücüne dayanmaktadır, bu nedenle maliyet çok yüksektir.

Lin Dahua, fikrini uygun şekilde değiştirmenin ve veri ve sahnelerde bulunan bazı etiketleme bilgilerini araştırmanın mümkün olduğuna inanıyor. Bilgisayarla görü tanıma kalitesinin iyileştirilmesi açısından, araştırılması gereken daha fazla teknik olasılık vardır.

( 0 ) Paylaşmaya hoş geldiniz, yarın görüşürüz!

Xiaomi'nin "cep telefonu + AIoT" çift motorlu stratejisi başlatıldı, resmi olarak IoT dağıtıldı ve 5 yılda 10 milyardan fazla yatırım yapıldı
önceki
Emgrand GL'nin sıcak satışlarının arkasındaki hikaye Geely Araştırma Enstitüsü'nü ziyaret etti
Sonraki
Fearless 5. baskısından kim etkilendi? Kaohsiung en cesur, genç Zhao Wenzhuo'yu hatırlıyor musun?
Tarihin en kara yürekli mesleği olan iMac sizi ömür boyu satacak
Samsung S1021 Şubat, Snapdragon 855+ ultrasonik parmak izi tanıma, güçlü performans için hazırlandı
Çok utanç verici: Harbin'de bağlantısını kaybeden erkek kardeş bulundu, ancak başkalarının uyuşturucu almasına izin verdiği için polis tarafından gözaltına alındı.
SAIC MG ZS Star Chasing Tour yıldızlarının altında sonbaharın başlarını arıyor
Chongqing Kamu Güvenliği'nin iki mikro blogu on milyonlarca isabet aldı: Sert adam polis Xiaopenyou'da rol aldı ve aranıyor, yaratıcı bir zamanlar yukarı akım gazetecilerinden öğrendi
Donnie Yen, "Mulan" ın canlı aksiyon versiyonuna hazırlanırken usta Liu Yifei'yi ve Gong Li'yi gizemli cadı olarak mı oynuyor?
Honor Magic 2 resmi tanıtım videosu: arka üç kamera, çift taraflı cam tasarım
Chow Yun-fat neden Jackie Chow ile işbirliği yapmıyor? Fa Ge kişiliğe sahiptir ve yardımcı roller oynamak istemez!
Harbin'de bir anaokulunda 12 çocuk, sağlık doktorunun yaktığı dezenfeksiyon lambasından dolayı yandı
Honda'nın ABD'de üretime koyduğu yeni Anlaşma 267 milyon ABD doları yatırım yaptı
1599 $! Razer yeni bir oyun kitabı yayınladı: 15 inç, sekiz nesil i7, yeni renk övgüsü!
To Top