Metin tanıma dünya rekorunu kırdı, Hikvision Pu Shiliang Xinzhiyuan "AI Bahar Festivali" güvenlik büyük verilerinin şifresini çözüyor Xinzhiyuan Zirvesi konuşması

Xinzhiyuan Raporu

Pu Shiliang, konuşmada büyük veri güvenliğinin üç ana zorluğunu ve Hikvision'un cevabını tanıttı: ek geri bildirim için etiketlenmemiş verilerdeki gizli bilgileri incelemek, etiketli verilerin yüksek maliyeti sorununu çözmek; çoklu sensör füzyonu, Karmaşık sahne algılama sorunlarına yanıt verin; ön uç ekipmanın bilgi işlem gücündeki boşluğu doldurmak için çevrimiçi artan öğrenmeyi kullanın.

Birkaç gün önce Hikvision Araştırma Enstitüsünün derin öğrenme teknolojisine dayalı OCR (Optik Karakter Tanıma) teknolojisine dayalı ön araştırma ekibi, ICDAR Sağlam Okuma yarışması veri kümesinde dünyanın en iyi puanlarını yeniledi ve "İnternet Resmi ve Metin" listesinde yer aldı. , "Doğal sahne metnine odaklanın" ve "Sözcük Tanıma'nın üç zorluğuyla birlikte doğal sahne metnini alma".

ICDAR (Uluslararası Belge Analizi ve Tanıma Konferansı) Uluslararası Belge Analizi ve Tanıma Konferansı olarak adlandırılır ve Uluslararası Örüntü Tanıma Derneği (IAPR) tarafından düzenlenir. ICDAR tarafından düzenlenen belge analiz ve tanıma yarışması şu anda OCR teknolojisi alanında dünyanın en etkili yarışmasıdır ve 2003 yılından bu yana beş kez düzenlenmiştir. Bunların arasında aralarında Google, Microsoft, Baidu, Samsung, Megvii ve diğer takımların da bulunduğu 82 ülkeden 2367 takımın ilgisini çeken ICDAR 2015 yarışması, metin tanıma teknolojisinin geliştirilmesinde ortaya çıkan birçok yöntem güçlü bir rol oynadı. Teşvik edici rol.

Şekil 1: RobustReading yarışmasının üç ana görevi

Yarışmanın üç ana görevinde, tanınacak metin karmaşık bir görüntünün arka planında yer alır.Görüntü, gürültü, bulanıklık, perspektif, eğim ve rastgele düzenleme gibi olumsuz faktörlere sahiptir ve birçok yazı tipi biçimi vardır.

Hikvisionun OCR teknolojisi, üç metin tanıma görevinde de dünya birinciliği elde etti ve sırasıyla doğal sahne metnine odaklanarak ve doğal sahne metin görevlerini çekerek İnternet metin görevlerinde% 5,6'lık bir avantajla ikinci sırayı geçti. % 3,4 ve% 3,1 ile ikinci sırayı geçti.

Şekil 2: Born-Digital Görüntü tanıma değerlendirme sonuçları, HIK_OCR'nin birinci sırada olduğunu göstermektedir.

Şekil 3: Odaklanmış Sahne Metni tanıma değerlendirme sonuçları, HIK_OCR'nin birinci sırada olduğunu gösteriyor

Şekil 4: Tesadüfi Sahne Metni tanıma değerlendirme sonuçları, HIK_OCR'nin birinci sırada olduğunu gösteriyor

Son yıllarda metin tanıma teknolojisindeki atılımlar, büyük ölçüde derin öğrenmenin gelişimine dayanıyor. Hikvision ön araştırma ekibi, görüntü bilgi kodlamasını tamamlamak için onlarca evrişimsel sinir ağı katmanı tasarladı ve ardından özelliklerden metne kod çözme elde etmek için sezgisel bir dikkat modeli kullandı.

Haberlere göre, Hikvision tarafından metin tanıma için özel olarak tasarlanan sezgisel mekanizma, bu kez dikkat modelinin çıkardığı özelliklerin rasyonalitesini değerlendirerek dikkat modelini karmaşık sahnelerde güçlü ve kararlı hale getirebilir. Gelişmiş OCR teknolojisi ile Hikvisionun metin tanıma sistemi, tahrif etme ve bulanıklaştırma, arka plan girişimi ve deformasyonu ve şiddetli hava koşulları gibi daha karmaşık metin tanıma senaryolarıyla başa çıkabilir.

Şekil 5: Hikvision metin tanıma teknolojisinin şematik diyagramı

Şu anda, yeni OCR teknolojisine dayalı Hikvision plaka tanıma sistemi, dünya çapında 60'tan fazla ülke ve bölgeyi kapsamaktadır. Süngü, elektronik polis, giriş ve çıkış kontrolü ve plaka tanıma teknolojisine dayalı park sistemleri gibi uygulamalar da tam anlamıyla hayata geçirildi.

Şekil 6: Genel plaka tanımanın tipik uygulama senaryoları

Raporlara göre, bu yarışmanın sonuçları aynı zamanda makine vizyonu alanında etiket formu tanıma, insanların geçim kaynağı alanında kart ve ehliyet tanıma, İnternet alanında kötü niyetli görüntü tanıma, araba destekli sürüş alanında sokak tabelası tanıma, pankart sloganları ve kentsel yönetim alanında sokak görünümlerine de uygulanabilir. Tanımlama gibi ürünlerde ürün performansı ve uygulama etkileri büyük ölçüde iyileştirilmiştir.

Lider Akıllı Endüstri Kuruluşu Xinzhiyuan "AI Bahar Festivali" nde Görüldü

Hikvision, Çin'in borsada işlem gören şirketlerindeki en özgün yapay zeka şirketlerinden biridir ve şu anda küresel video gözetiminde bir numara haline gelmiştir. Son yıllarda, güvenlik endüstrisindeki akıllı dönüşüm dalgasıyla birleşen Hikvision, güvenlik video gözetim geliştirme, Nesnelerin İnterneti ve video büyük verileri ve akıllı video analizi uyguladı ve ticari getiri elde etti.

Güçlü pazar gücünün arkasında şüphesiz çekirdek teknolojinin desteği var Yukarıda bahsedilen ICDAR'a ek olarak Hikvision, ImageNet yarışmasının temsil ettiği uluslararası teknoloji yarışmasında her zaman olağanüstü sonuçlar elde etti. Sektörün endişelendiği oyuncular.

27 Mart'ta düzenlenen Xinzhiyuan Açık Kaynak Ekolojik Yapay Zeka Teknolojisi Zirvesi, Hikvision'un akıllı şehir güvenliği endüstrisindeki akıllı + statüsünü tanıtmak için Hikvision'un baş uzmanı ve araştırma enstitüsü Başkanı Pu Shiliang'ı konuk olarak davet etti.

Pu Shiliang, Fransız Ulusal Araştırma Enstitüsü'nden (CNRS) doktora ve Zhejiang Üniversitesi'nden doktora derecesine sahiptir.Hikvision'un yapay zeka ve büyük veri alanındaki teknik araştırmalarından sorumludur. Pu Shiliang, araştırma enstitüsünü Smart 265 kodlama teknolojisi, hedef yapılandırılmış algoritma, plaka tanıma algoritması, yüz tanıma algoritması, video alma motoru, çoklu sensör füzyonu ve kamu güvenliği, finans, ulaşım, adalet alanlarında yaygın olarak kullanılan diğer teknolojileri geliştirmeye yönlendirdi. Perakende, akıllı şehir ve diğer alanlar.

Xinzhiyuan'ın "327" Teknoloji Zirvesi'nde Pu Shiliang, akıllı cihazların zorluklarını ve Hikvision'un yanıtını tanıtan "Güvenlik Büyük Verisinin Yönlendirdiği Akıllı Yaşam" başlıklı bir konuşma yaptı.

Aşağıda, Dr. Pu Shiliang'ın bir konuşması var.

Pu Shiliang: Teşekkürler Yang Jing, teşekkür ederim Xinzhiyuan, bugün sizlerle Hikvision'un yapay zeka alanındaki bazı görüşlerini paylaşma fırsatına sahip olduğum için çok onur duyuyorum. Konuşmamın konusu "Güvenlik Büyük Veri Tarafından Harekete Geçirilen Akıllı Yaşam". Ardından, güvenlik büyük verilerini uygulama çabalarımızı ve akıllı yaşamdaki keşfimizi sizlerle paylaşacağım. Konuşmanın alt başlığı "Gerçek Dünyadan Gerçek Dünyaya" şeklindedir. Günümüzde yapay zeka ekipmanı verilerle hareket ediyor, elimizdeki verileri de düşünüyoruz.Güvenlik kameraları otantik ve gerçek zamanlı.

Görüş sensörleri, kameralar, dronlar, otomotiv elektroniği ve robotlar dahil her yerde. Pek çok akıllı donanımda, görsel sensörler en önemli algılama aracıdır. Akıllı donanım her gün açıldığında, karmaşık ve karmaşık bir dünyayla yüzleşmesi gerekir. Görsel sensörün dünyamızı daha iyi algılamasını ve akıllı yaşamımıza daha iyi hizmet etmesini nasıl sağlayacağımız, Hikvision'un araştırmasının önemli bir önermesidir.

Akıllı uygulamanın anahtarı: küçük veri hacmiyle büyük veri girişini bulun

Şu anda Alibaba'dan Dr. Hua Xiansheng, küresel kamera sevkiyatlarının çok büyük olduğundan bahsetti, ne kadar? Pazar araştırma raporlarını sizinle paylaşın. IHS'nin küresel güvenlik kamerası gönderileri hakkındaki raporuna ve tahminine göre, küresel güvenlik kamerası gönderileri bu yıl 130 milyon birime ulaşacak ve önümüzdeki birkaç yıl içinde hızla büyümeye devam edecek. 2020'de küresel sevkiyatlar yaklaşık 200 milyon adede ulaşacak. Güvenlik kameralarının kurulu kapasitesi artıyor, bu da güvenlik sistemini çok iyi bir video veri girişi yapıyor. Video verilerine ek olarak, güvenlik sistemimiz erişim kontrolü, duman algılama, radar vb. Gibi diğer birçok sensör türüne de erişecektir. Güvenlik sistemine bağlı bu büyük veriler, birçok akıllı yaşam uygulamasını büyütebilecek verimli bir toprak oluşturur.

Veri kalitesi, mevcut yapay zeka teknolojisi için çok önemlidir, çünkü bu aşamadaki derin öğrenme hala verilerle yürütülmektedir. Verilerin son yapay zeka uygulamasının performansını nasıl etkileyeceğini incelemek için de birçok deney yaptık. İki test sonucunu listeliyoruz, biri yüz tanıma ile ilgili test sonucu, diğeri ise yaya erişimiyle ilgili sonuçlar. Yüz algılama, video görüntülerinde yüzlerin algılanması ve konumlandırılmasıdır, yaya erişimi ise çoklu video ile ilişkili bir çapraz kamera davranışının alınmasıdır. Bir yandan internette eğitim için büyük miktarda veri topluyoruz, diğer yandan eğitim için güvenlik verilerini de kullanıyoruz.

Algoritmalar tutarlı olduğunda, deneyin sonuçlarının, veri örnekleri çok küçük olduğunda, algoritmanın performansının büyük ölçüde optimize edilebileceğini gösterdiği görülebilir. Akıllı yaşamda çeşitli uygulamaları denemede en önemli şeyin nispeten küçük miktarda veri içeren büyük bir veri girişi bulmak olduğuna inanıyoruz.

Hikvision, büyük veri güvenliğiyle ilgili üç büyük zorluğun üstesinden gelmek için benzersiz sırlara sahiptir.

Aynı zamanda, güvenlik kamerası tarafından yakalanan verilerin iki önemli avantajı vardır: özgünlük ve gerçek zamanlı. Bu nedenle, güvenlik büyük verileri akıllı yaşamın uygulanmasını iyi bir şekilde yönlendirebilir. Bununla birlikte, gerçek uygulamalarda, başta aşağıdaki üçü olmak üzere birçok zorlukla karşılaşacağız: Birincisi, büyük veri ile veri etiketlemenin maliyeti arasındaki çelişki; ikincisi, karmaşık sahneler ve sınırlı algılama yetenekleri arasındaki çelişki; üçüncü , Sinir ağı ve büyük uygulama maliyeti (sınırlı bilgi işlem kaynakları) arasındaki çelişki. Daha sonra, bu üç noktayı ayrıntılı olarak tanıtacağız ve müdahale önlemlerimizi tanıtacağız.

Çözülecek ek geri bildirimler için etiketlenmemiş verilerdeki gizli bilgileri araştırmak Verileri etiketlemenin yüksek maliyeti

İlk olarak, büyük veri ve veri etiketleme arasındaki karşılaştırma. Hikvision'un ülke çapında birçok ortak laboratuvarı var ve bizim çok büyük bir veri portalımız var. Her gün sabit bir etiketleme verisi akışı oluşturan büyük bir veri etiketleme ekibi kurduk. Algoritmanın performansı, bu verilere dayanarak büyük ölçüde geliştirildi. Bununla birlikte, etiketleyebileceğimiz veriler, elde edilen verilerin buzdağının yalnızca görünen kısmı ve büyük miktarda veri hala suyun altında kalıyor. Algoritmamızı daha da iyileştirmek için bu verileri nasıl etkili bir şekilde kullanabiliriz? Bu, üzerinde çalıştığımız bir konudur.

Elbette akademik dünyadaki en doğrudan yaklaşım denetimsiz öğrenmedir ve derin diyalog ağları gibi çok değerli yöntemler de vardır. Ancak bu aşamada, çoğu uygulama senaryosunda, denetimsiz öğrenmenin hala denetimli öğrenmeden daha düşük olduğuna inanıyoruz.Şimdi, Dr. Hua ayrıca plaka tanımada bazı derin yüzleşme ağ deneylerinden de bahsetti. Çok az veri örneği olması durumunda, derin yüzleşme ağları gerçekten de algoritma performansını iyileştirmek için kullanılabilir. Ancak birçok senaryoda, denetimsiz öğrenmenin performansı denetimli öğrenme kadar iyi değildir.

Etiketlenmemiş verilerdeki bilgileri tam olarak nasıl madencilik yapabilirim? Eğitimde, özellik çıkarma modelinin geri bildirimi, etiket tahmin modelinin geri bildirimi ve kayıp işlevinin geri bildirimi dahil olmak üzere ek bilgi geri bildirimi için etiketlenmemiş verilerin arkasına gizlenmiş bilgileri kullanırız. Örneğin, bir güvenlik sahnesinde çok sayıda yüz yakaladığımızı ve bu yüzleri tek tek işaretlemediğimizi, ancak yakalanan sahne bilgilerini ve yakalanan kalabalık bilgilerini elde edebileceğimizi varsayalım. Bu ek bilgileri ve ek açıklama bilgilerini füzyon eğitimi aldığımızda, algoritmanın genelleme yeteneği büyük ölçüde geliştirilebilir.

Karmaşık sahne algılama problemleriyle başa çıkmak için çoklu sensör füzyonu

İkinci çelişki, karmaşık sahneler ile cihaz algılama yetenekleri arasındaki çelişkiden kaynaklanıyor. Akıllı donanımımızın gerçek hayatta karmaşık ve çalkantılı ortamla başa çıkması gerekir. Örnek olarak alalım, çeşitli sert hava koşullarında 7 × 24 saat çalışması gerekiyor. Bu nedenle, zorlu koşullar altında oluşan görüntüleme etkisi, sonraki yapay zeka algoritmalarının etkisini büyük ölçüde etkiler. bu problem nasıl çözülür? Şimdi endüstride bir eğilim var: mikroelektronik teknolojisi seviyesinin yükselmesiyle birlikte, çeşitli sensörlerin maliyeti, güç tüketimi ve hacmi düşüş eğilimindedir ve bu da ürünler üzerinde yayılmış füzyon için koşullar sağlar. Çoklu sensör füzyonunun birçok yolu vardır. Örnek olarak Hikvision'un siyah ışık kamerasını alın. Siyah ışık kamerası, görünür ışığı ve kızılötesi ışığı birleştiren bir üründür. 380 nanometreden 1000 nanometreye kadar ultra geniş bir spektrumda görüntüleme yapabilir ve Düşük ışıkta hem renk bilgilerini hem de parlaklık bilgilerini alın.

Starlight kameralarla karşılaştırıldığında, siyah ışık kameraları büyük ölçüde geliştirilmiş parlaklık, renk, azaltma ve ayrıntı desteğine sahiptir. Bu nedenle, çoklu sensör füzyonunun karmaşık ortamlarda algı problemini iyi bir şekilde çözebileceğine inanıyoruz.

Ön uç ekipmanın bilgi işlem gücündeki boşluğu kapatmak için çevrimiçi artımlı öğrenmeyi kullanın

Üçüncü çelişki, karmaşık modeller ve hesaplama gücü arasındaki çelişkidir. Gerçek hayatta çeşitli uygulama senaryoları ile baş edebilmek için çok karmaşık algoritma modelleri tasarlamamız gerekiyor. Bununla birlikte, ekipmanın, özellikle de ön uç ekipmanın hesaplama gücü çok sınırlıdır ve bu da karmaşık modeller ile hesaplama gücü arasında bir çelişki yaratır. Örneğin, algoritma mühendisimiz yüzlerce ağ katmanından oluşan bir dizi algoritma tasarladı.Performans çok iyi, ancak ürünün maliyeti ve güç tüketimi hesaplandıktan sonra gerçek uygulamanın zor olduğu görüldü. Bu sorunu çözmek için, çevrimiçi bir artan öğrenme yöntemi geliştirdik. Sözde çevrimiçi artımlı öğrenme, çeşitli senaryolarda verilerle karmaşık bir genel model eğitmektir. Veri toplamak, bu verileri belirli zor durumlarla etiketlemek ve bunları yarı denetimli öğrenim çerçevesine göndermek için ön uç toplama ekipmanı kullanıyoruz. Yarı denetimli öğrenme çerçevesi, genel modelimize dayanacak, sahne için modeli optimize edecek, aynı anda kesip sıkıştıracak ve son olarak onu ön uç ekipmanımıza çevrimiçi olarak yükleyecektir. Bu yöntem sayesinde, algoritmaları nispeten sınırlı bilgi işlem kaynakları altında uygulayabilir ve belirli senaryolar için performansı artırabiliriz.

Yukarıdakiler, üç zorluğun üstesinden gelmek için yöntemleri tanıttı: Geçtiğimiz birkaç yıl içinde Hikvision, ön uç kameralar, arka uç sunucular ve erişim kontrol ürünleri dahil olmak üzere güvenlik büyük verisine dayalı bir dizi entegre derin öğrenme ürünü piyasaya sürdü. Giriş yapmak için buradan iki kamera seçin. İlki bir yüz tanıma kamerasıdır.Son birkaç yılda yüz tanıma teknolojisi için birçok uygulama senaryosu olmuştur.Bu uygulama senaryoları arasında güvenlik sahnesi en karmaşık olanı olabilir çünkü çeşitli aydınlatma koşullarına, yarı varsayım koşullarına ve çeşitli koşullara uyum sağlaması gerekir. Bir çeşit açı. Yüz tanıma kamerası, bir derinlik sensörü, görünür bir ışık sensörü içeren ve yüz tanımayı algılamak için bir algoritma entegre eden çok sensörlü bir füzyon ürünüdür. Kamera, en net yüz görüntüsünü oluşturmak için kameranın görüntüleme parametrelerini gerçek zamanlı olarak ayarlamak için yüz algılamanın geri bildirim bilgilerini kullanır, yüz duruşunu elde etmek için derinlik sensörünü kullanın, gerçek zamanlı değerlendirme yapın ve son olarak tanıma için en iyi yüz görüntüsünü seçin . Bu kamera aynı zamanda algılama ve tanımayı da yerleştirir.

Başka bir ürün, küresel kamera. Güvenlik ürününün birinci tarafının aynı anda hem global bilgi hem de hedefin detaylı bilgisine dikkat etmesi gerekiyor, tıpkı videodaki giriş ve çıkışlarda olduğu gibi, giriş ve çıkışların global bilgilerine dikkat etmemiz ve her giriş çıkış hedefinin detaylarını almayı umuyoruz. Küresel kameramız, yüksek çözünürlüklü geniş açılı bir kamerayı bir izleme kamerasıyla birleştirir. Geniş açılı yüksek çözünürlüklü kamera global görüntüler çeker ve izleme kamerası hedefi izler. Yapay zeka teknolojisi, küresel algılama gerçekleştirir, izleme kamerasını hedefi germek için çalıştırır, hedefin ayrıntılı görüntülerini izler ve elde eder ve son olarak, hedefin yaşı, cinsiyeti, takması, gözlük takıp takmaması gibi düzinelerce özellik bilgisini elde etmek için sınıflandırma ağını kullanır. Bekle.

Hikvision, yapay zekanın yeteneklerini geliştirmek için güvenlik büyük verilerini kullandı ve akıllı şehirlerde pek çok keşif yaptı. Akıllı üretim alanında, pirinç tarlalarını işlemek için endüstrideki malzemeleri otomatik olarak hareket ettirebilen bir robot geliştirildi. Şu anda, 600'den fazla elleçleme robotu, otomatik malzeme işlemeyi gerçekleştirmek için çevrim içi olmuştur; güvenlik alanında yaya yüzlerinin gerçek zamanlı olarak yakalanması ve kamu güvenlik görevlilerinin birden çok kentsel platform projesinde yüzlerce kaçağın yerini tespit etmesine yardımcı olmuştur. Aynı zamanda, yapılandırılmış kameralar ticari sistemlerde yolcu akışını, müşteri boyunu, yaşını, kıyafetlerini vb. Çıkarmak için kullanılabilir ve bu bilgileri zincir ticari müşterilerin iş büyük veri analizi yapmasına yardımcı olmak için kullanabilir. Sistemimiz ayrıca ihlal olayları ve araç yapılandırılmış bilgileri de dahil olmak üzere her türlü yol durumu bilgisini gerçek zamanlı olarak elde edebilmektedir.Aynı zamanda, dronları kaçak araçları takip etmek ve yakalamak için kullanabiliyoruz; otomatik park sistemi de geliştirdik. Park yerleri, arabanızı bulmak, garaja geri dönmek de dahil olmak üzere artık sorun değil.

Hikvisionun akıllı şehirlerdeki keşfinin yukarıdaki kısmı paylaşıldı. Akıllı yaşamı yönlendirmek için güvenlik büyük verilerini kullanmayı ve şehirleri daha akıllı hale getirmek için algılama teknolojimizi kullanmayı umuyoruz.

hepinize teşekkür ederim!

27 Mart'ta Xinzhiyuan Açık Kaynak Ekolojik Yapay Zeka Teknolojisi Zirvesi ve Xinzhiyuan 2017 Girişimcilik Yarışması Ödül Töreni görkemli bir şekilde düzenlendi. "BAT" dahil olmak üzere Çin'in ana akım AI şirketleri ve 600'den fazla sektör eliti 2017 Çin'e ortak katkıda bulunmak için bir araya geldi Yapay zekanın gelişimi güçlü bir darbe aldı.

Orijinal metni okumak ve konferans kaydının metin versiyonunu görmek için tıklayın

Bu beş kilit noktayı bile anlamadın mı? Bir SUV almamanızı tavsiye edin
önceki
Avustralya emlak piyasası "Buz Devri" ne düşebilir ve arz ve terk dalgası yayılır
Sonraki
Bu sefer hafif silahlar ateşlendi, "dadı" korumasını reddetti
"Gişe rekorları kıran" resim, Alibaba Cloud'un iki yeni beynini anlıyor: ET tıbbi beyin ve ET endüstriyel beyin
İsviçre'nin sonbaharı, Avrupa'daki tüm masal dünyalarını onaylamak için yeterli
Yakıt tasarrufu için on ipucu! 15 yıldan fazla sürüş deneyimine sahip eski sürücü özetliyor, götürün, teşekkürler!
İlk on şair size şunu söylüyor: Şanslı değilseniz, bunları deneyin
Eksi 30 santigrat derece, uç!
Biri 1.9L / 100km kadar düşük yakıt tüketimine sahip 300.000 sınıf hibrit SUV koleksiyonu
Ruhsatsız bir aracı kullanan ruhsatsız bir sürücü, trafik polisi tarafından ele geçirildikten sonra büyük keşifler yaptı ...
Burası Malezya'nın en doğal botanik bahçesi En doğal yerde kendiniz olun.
Yu Minhong ağladı ve dedi ki, New Oriental, bırakan, nasıl 10 milyar ABD doları oldu?
Yüzünüzü göstermeden seyahat etmek çok güzel olabilir!
Zhang Tong: Yalnızca Tencent AI Lab'ın askeri gücüyle başlayarak, birinci sınıf laboratuarları kıyaslayarak Xinzhiyuan Zirvesinde Konuşma
To Top