Zhenzhi Technology'nin kurucu ortağı ve CEO'su Ren Peng: Edge computing tabanlı tüm akıllı kameralar geleceğin akıllı şehirlerinin altyapısıdır CCF-GAIR 2018

Leifeng.com'un notu: 2018 Küresel Yapay Zeka ve Robotik Zirvesi (CCF-GAIR) Shenzhen'de düzenlendi.Zirveye Çin Bilgisayar Federasyonu (CCF) ev sahipliği yaptı ve Leifeng.com ve Hong Kong Çin Üniversitesi (Shenzhen) ev sahipliğinde Shenzhen Belediye Hükümeti'nden güçlü rehberlik aldı. Yerli yapay zeka ve robotik, akademi, endüstri ve yatırım olmak üzere üç ana alanda üst düzey bir değişim etkinliği olup, yerli yapay zeka alanında en güçlü sınır ötesi değişim ve işbirliği platformunu oluşturmayı amaçlamaktadır.

30 Haziran'da 2018 Küresel Yapay Zeka ve Robotik Zirvesi (CCF-GAIR) devam etti. Sabah bilgisayarla görme oturumunda Zhenzhi Technology'nin kurucu ortağı ve CEO'su Ren Peng, " Edge computing akıllı şehirleri güçlendiriyor "Açılış konuşması.

Zhenzhi Technology, gömülü görüntüleme sistemi tasarım teknolojisindeki üstün deneyimine ve son bilgi işlem teknolojisinin (akıllı kameralar) ürün dönüşümü yoluyla yapay zeka algoritmalarında yıllardır biriktirdiği birikime güvenerek, kendini akıllı şehir sistemindeki büyük dikey uygulama alanlarına adamıştır. : Akıllı ulaşım (ITS), akıllı güvenlik (IVS), akıllı işletme, akıllı üretim (FA), daha akıllı ön uç görüntüleme ekipmanı ve çözümleri sağlar.

Ren Peng, konuşmasında Zhenzhi Technology'nin akıllı kamerasını tanıttı. Tam akıllı kamera nedir? Ren Peng, farklı sektörlerin akıllı kameralar için çeşitli gereksinimleri olduğuna ve bir sahne uygulamasının algılama ihtiyaçlarını karşılayan bir kameranın tamamen akıllı bir kamera olduğuna inanıyor. Tamamen akıllı bir kamera yapabilmek için içinde birçok zorluk olacak. Ren Peng bunu şöyle özetledi: Görüntüleme, algoritmalar, üretim Üç ana husus.

Ren Peng, görüntüleme açısından daha zor olan sorunun, akıllı kameraların görüntüleme değerlendirme standartlarının olmaması olduğuna inanıyor, ancak görüntülemenin algoritmaların ihtiyaçlarını karşılaması ve ardından insan duyularının ihtiyaçlarını karşılaması gerekiyor.

Algoritmalar açısından Zhenzhi Technology'nin yaklaşımı, öncelikle gereksinimleri netleştirmek, veri setini, performans göstergelerini ve maliyet göstergelerini belirlemek ve aynı zamanda gömülü platformun seçimini ve değerlendirmesini yapmak, ardından PC simülasyonunu ve algoritma gerçekleştirmeyi gerçekleştirmek ve son olarak yerleştirmektir. Platformun transplantasyon optimizasyonu ve algoritma inişi.

Üretim açısından, Zhenzhi Technology, vizyon ve kontrol kombinasyonu yoluyla "akıllı kameralar" üretmek için "zekayı" kullanır. Şimdi, Zhenzhi Technology'nin kamera üretim hattı kısmen otomatikleştirildi Ren Peng, gelecekte bu konuya yatırım yapmaya devam edeceğini söyledi.

Ren Peng'in canlı konuşmasının metni aşağıdadır. Lei Feng.com orijinal amacı derledi ve düzenledi:

Ren Peng: Herkese günaydın! Bugün sizlerle akıllı kamera yapma sürecinde karşılaştığımız zorlukları ve girişimleri ağırlıklı olarak tartışacağım.

Ürünümüz çok basit, akıllı bir kameradır. Belki hepiniz ürünlerimizi kullandınız. Ürünlerimiz küçük olmasına rağmen şehrin çeşitli bölgelerine dağıtılmakta, insanların park etme deneyimini iyileştirmekte ve tüm park etme sürecini daha rahat hale getirmektedir.Bu da insan odaklı akıllı şehirler konseptiyle uyumludur.

Ama bir konseptten inişe nasıl geçilir? Bu, aynı zamanda bulut bilişim ve uç bilişim kavramlarına sahip olan algılama yeteneğinin geliştirilmesini gerektirir. Ön uç akıllı kamera, uç bilgi işlemde önemli bir varlıktır.

Akıllı kamera nedir? Kameramızın farklı senaryolarda kullanılabileceği düşüncesi var, anlayışımıza göre bu ideal bir durum olabilir ve tüm endüstri yolu gelişiminin ihtiyaçlarını karşılamıyor.

Örneğin akıllı ulaşım alanında otoparklar için ne tür kameralara ihtiyaç var? Araç kimliğinin% 99,9'una yakın bir doğruluk gerektirebilir, çünkü ödeme içerir, bu nedenle tanıma oranı gereksinimi nispeten yüksektir ve araç hız limiti nispeten yüksektir. Süngü, daha düşük bir tanıma oranı ve daha düşük hız sınırı ile bunun tam tersidir. Trafik akış kontrolü, sinyal ışığı planlaması vb. İçin bu alanların araç tanımlaması için ek gereksinimleri vardır. Yani sadece ulaşım alanında bile birçok senaryoyu yıktı.

Başka bir örnek olarak, güvenlik alanında, Güvenli Şehir, Xueliang Projesi, topluluk binaları, şantiyeler, kampüsler, hastaneler vb. Sahnelerin aslında her sahne için farklı kamera gereksinimleri vardır. Yani tanımımıza göre, Bir sahne uygulamasının algı ihtiyaçlarını karşılayan kamera tamamen akıllı bir kameradır Buradaki algı temel olarak insan ihtiyaçlarını karşılayabileceğini veya aşabileceğini ifade eder.

İşte bir piramidin açıklaması: En alttaki katman piksel, orta katman nesneler ve üst katman davranıştır.

Şu anda akıllı şehirler alanında uygulamaların çoğu hala nesne katmanı olan orta katmanda kalmakta ve birçok senaryodaki altta yatan uygulamaların (piksel katmanı) sorunları tam olarak çözülmemiştir. Önceki misafirlerin verdiği örnekleri ele alalım, örneğin bir ön yüz yakalama ve bulut tanıma uygulaması.Ön ucumuz bir yüzü yakalarsa, belirsiz ve bulanıktır.Aslında bu sistemin tanınması çok iyidir. basınçlı. Örneğin, bazı uygulamalar ön yüz tanıma sistemidir ve bulut, tanımanın sonuçlarına göre kararlar verir.Ön uç tanımanın her zaman sorunları ve yanlış pozitifleri varsa, tüm akıllı şehir operasyonunun verimliliğini ve karar vermenin doğruluğunu da etkileyecektir.

Elbette böylesine tam akıllı bir kamerayı gerçekleştirmenin birçok zorluğu var Deneyimlerimizden yola çıkarak aşağıdaki üç noktadan başlıyoruz: Görüntüleme, algoritmalar, üretim.

Görüntüleme açısından daha zor olan sorun, akıllı kameraların görüntüleme değerlendirmesi için bir standart olmamasıdır.Standartlar varsa, herkesin çalışma şekli bu standarda göre çalışmaktır.Örneğin, cep telefonu kameraları için bazı profesyonel değerlendirme kuruluşları bazı standartlar belirlemiştir. Kamera ayrıca çözünürlük, gri tonlama, beyaz dengesi vb. Gibi bazı göstergelere sahip olacaktır. Peki akıllı kameraların standartları nelerdir? Görüntülememiz için iyi olan nedir? Sonunda bir standart belirledik, her şeyden önce Görüntülememin algoritmaların ihtiyaçlarını karşılaması ve ardından insan duyularının ihtiyaçlarını karşılaması gerekiyor. Bu çok öznel bir kavram.

Bir kamera yaparken, öncelikle donanımının, yapısının, termal tasarımının, optiklerinin vb. Sorunlarını çözmeliyiz. Bunları çözdükten sonra, kameranın ISP'si temel bir sorundur ve ISP'nin sıradan sahnelerde özü fotoğraf çekmek veya Fotoğraf çekerken sahnenin ne olduğunu anlamak yeterli Son zamanlarda bazı cep telefonu üreticileri kameralarına bazı sahne tanıma fonksiyonları eklediler. Amaç, sahneyi belirledikten sonra sahne için daha uygun bir ISP parametresi seti seçmek ve ardından görüntülemeyi daha iyi hale getirmektir.

Ancak akıllı bir kameranın amacı, bu sahnede dikkat ettiğim tüm nesnelerin net bir resmini çekmektir.Temel olduğu şey nesnedir, dolayısıyla akıllı kameranın ISP'sinin özü nesnenin algılanmasına dayanır. Bu yine bir tavuk mu yoksa yumurta mı olduğu sorusu haline geldi. Bir sahnede yalnızca bir nesne iyidir, ancak birden fazla nesne varsa, mevcut birçok ISS'nin mimari tasarımının yıkıcı olması gerekir.

Güvenlik senaryolarında, birçok uygulama düşük deklanşör hızları gerektirir. Hareket bulanıklığı nedeniyle daha net hedefler çekmemiz gerekir. Bu nedenle, deklanşör sınırımız nispeten düşüktür, genellikle 5 milisaniyeden daha azdır. Bazı sahnelerde Küresel panjurlu kameralar bile kullanılacak. Bu tür bir sahnede, sahneyi düşük aydınlatma ve yüksek kontrastla karşılamalıyız. Aslında bu çok zor mesela burada duruyorum ve bana çarpan güçlü bir ışık olduğu için kapıya bakıyorum aslında dış durumu göremiyorum ve kamerada da aynı.

Bu problemleri şimdi çözdüğümüzde, daha fazla sahne alt bölümü, nesne tanıma kullanırız ve ardından istenen etkiyi elde etmek için ISP'nin tasarımına rehberlik etmek için deneyim kullanırız Bu aynı zamanda aşamalı ve dengeli bir efekttir.

Üst sıra aynı sahne, farklı kameralar ve farklı ISP ayarlı efektler, aşağıdaki geniş dinamik bir sahne yakalama efekti, bu iki sahnenin deklanşörü 5 milisaniyenin altında, aslında çok zorlu.

Bu bir yüz yakalama sahnesidir ve yüz yakalama tanıma çok zordur. Tabii ki, hem Megvii hem de Yuncong, tanıma algoritmalarının çok güçlü olduğundan bahsetmişlerdir, ancak bu türden sadece 20 ila 30 pikselin farklı aydınlatma ve farklı duruşlar altında tanınması çok zordur.Tüm sistemin tanıma oranı aslında öyle değil uzun değil. Bu hala gündüz ve geceleri bu sahne için gereklilikler daha yüksek olacaktır.

Yüz yakalama kameramız tarafından çekilen yüz görüntülerinin hepsi bir inçlik standart kimlik fotoğrafları gibiyse, aslında tanıma sorunu nispeten basit hale gelecektir.

Yukarıdaki iki resimden hangisinin daha kolay tanınacağını düşünüyorsunuz? Soldaki resmin tanınmasının daha kolay olduğunu düşünebilirsiniz ama aslında durum böyledir.Soldaki resim ürünümüzün etkisi.Çabalarımızla birçok sahnede kameramızın çektiği resimler sayesinde yüz tanıma sistemini doğrudan tanıyabiliyoruz. Oran% 5 artarak% 10'a çıktı. Tabii ki, bizim kameramız da tam kare hızında, tam kare.

Görüntüleme hakkında konuştuktan sonra algoritmalardan bahsedelim. Algoritmalar tüm senaryolar için farklı algoritmalar değildir.Bugün bahsettiğim şey daha çok gömülü cihazlarda, akıllı kameraların geliştirilmesi sırasında algoritmaların çözmesi gereken bazı problemler.

İlki temel bir süreçtir.Akıllı kamera yaptığımızda öncelikle gereksinimleri netleştirip, veri setini, performans göstergelerini ve maliyet göstergelerini belirleyeceğiz.Aynı zamanda gömülü platformun seçimini ve değerlendirmesini yapacağız.Sonra PC yapacağız Simülasyonun gerçekleştirilmesi, algoritma ve son olarak gömülü platformun transplantasyonu ve optimizasyonu ve algoritmanın uygulanması temelde bu tür rutinlerdir.

Pek çok zorluk var, ilki veri, veriden çok acı çektik. Örneğin, bir kamera ürününü yükseltirken, sensör durdurulduğu için onu yükselttik.Sensör değişikliği ISP'de bir değişikliğe neden oldu ve sonunda görüntüleme tarzında bir değişikliğe neden oldu ve nihayet tüm sistemin tanıma oranında bir düşüşe neden oldu. Aslında bu, ağın aşırı uyumundan kaynaklanan bir sorun olarak da anlaşılabilir.

Verilerin çeşitliliği, dengesi ve sahneye uyum sağlama yeteneği ve ayrıca donanımın sensör görüntülemesiyle ilişkisi çok önemlidir. Ayrıca, bir şirketin kendi veri yönetimi düzeyinin doğrudan algoritma düzeyini yansıttığı, ancak aynı zamanda sahnenin anlayış düzeyini de yansıttığı sonucuna varıyoruz.

Örneğin, akademideki bazı testler için, veri seti açıkça tanımlanmıştır ve yapılması daha kolaydır, ancak gerçek dünyadaki veri seti belirsizdir ve proje uygulaması sırasında sürekli değişmektedir, çok daha yüksek Gereksinimler.

İkinci şey program seçimidir. Ekibimiz piyasadaki çip çözümlerinin yaklaşık% 80'ini değerlendirdi ve çip çözümlerinin iki tanımını yaptık:

Birincisi, 5 watt'ın altındaki güç tüketimini karşılamaktır Güç tüketimi çok yüksektir Bu, tüm sistemin termal tasarımı için büyük bir zorluk teşkil etmektedir.

İkincisi, gerçek zamanlı iş yapıyoruz. Bu yıl piyasadaki ana akım yonga çözümlerinin bilgi işlem gücü yaklaşık 50 ila 150 GFLOPS'dur ve gelecek yıl bu göstergenin 200 ila 500G'ye ulaşacağını tahmin ediyoruz. Bu, birçok yonga üreticisinin reklamını yaptığından farklı ... Ar-Ge meslektaşlarımız da daha fazla şikayet edecek çünkü yonga üreticileri yongaların çok güçlü olduğunun reklamını yapıyor, ancak gerçek sonuçlar tatmin edici değil. Gerçekten de birçok sorun var.

Gömme sırasında olağan rutinleri kullanırız. Bir algoritma uygulandığında, panoyu optimize etmemiz gerekir.Genel olarak, önce algoritmayı kestireceğiz, sonra komut setini optimize edeceğiz, belleği ve önbelleği optimize edeceğiz. Ancak derin öğrenme alanında, bellek bant genişliği darboğazı çok büyük bir sorundur.Devrim niteliğinde bir atılım yoksa, çipin gelişimi hala Moore yasasına uygundur ve kapasite yılda 10 veya 20 kez ikiye katlanmayacaktır.

Aslında çip üreticilerinin algoritma üreticilerinin ritmine ayak uydurmaları zordur.Örneğin, algoritma üreticileri algoritmalar üzerinde çalışırken algoritmada her ay bazı değişiklikler olabilir, bazı yenilikler ve girişimler olabilir ancak çip üretmek zordur. Resmi seri üretim ve olgun üretim için bir yıl sürebilir ve döngü çok uzun, bu nedenle bu uzun vadeli bir darboğazdır.

Bir ürünün endüstrinin evrensel ihtiyaçlarını karşılaması gerekir.Size özel yapılmayacaktır.Bu nedenle, birçok benzersiz ağ yapısı özel olarak optimize edilir ve performansı çok geliştirilir.Bu performans artışı% 50 hatta 100 olabilir. %, ancak mevcut yongalarda bu esnekliği elde etmek zordur.

Bazı formülasyonlar, gittikçe daha fazla veriyle yongaların hesaplama gücünün güçlendiğini, ürünleri kolaylaştırmanın daha kolay olduğunu söylüyor. Bizim yargımız öyle değil. Örneğin, ürünlerimiz bir sahneye çıktığında, müşteri ihtiyaçları sürekli olarak süblimleşir ve rafine edilir, tabi ki bu daha insancıldır. Uzun bir süre için, bilgi işlem gücü talebin büyümesini hala karşılayamıyor. Bu yüzden ağa dikkat edeceğiz Tabii ki burada ağın yapısını ayrıntılı olarak tartışmayacağım, sadece bu gömülü ürünü yaparken ağ anlayışımızdan bahsedeceğim.

Yetersiz bilgi işlem gücü nedeniyle, sınırlı performans altında, varsayımlarımız iki noktaya sahiptir: Birincisi, performans özelliklerini daha iyi öğrenmek ve tam olarak ortaya çıkarmak ve bir ürün üzerinde, bu özellikleri farklı bağlantılarda daha iyi kullanmaktır. Hesaplamanın karmaşıklığını büyük ölçüde azaltabilir; ikincisi uçtan uca olmayan mimaridir.Üründe her adımı ve her bağlantıyı kontrol edebiliriz.Bu kontrol edilebilir temelde, ağ performansının sınırlarını adım adım optimize edebilir ve bunlara dokunabiliriz. Bu, algoritma konusundaki bazı girişimlerimiz ve deneyimlerimizdir.

Üçüncüsü, nasıl üretileceğidir. Bu şeyi sadece tasarlayamayız, onu yapmalıyız.

Tedarik zinciri baş ağrısıdır, biz üretmedik, yaptıktan sonra, birçok cep telefonu üreticisinin sözde açlık pazarlamasını derinden anlayabiliyoruz, aslında istemsiz. Bazı tedarik zinciri sorunları çözüldüğünde, o zaman ürün nasıl yapılır.

Artık "zeka" yı, vizyon ve kontrol kombinasyonu yoluyla "akıllı kameralar" yapmak için kullanıyoruz. Bu, mevcut kamera üretim hattımızın otomatikleştirilmiş sürecidir.Tabii ki, tüm montaj hattını henüz tam olarak otomatik hale getirmedik, ancak çabalamamız gereken yön budur.

Son olarak gelecekteki yönden bahsediyorum.

Bizim kararımız, dürbün vizyonunun çok önemli bir yön olacağı yönündedir.Bu, Ekim 2017'de Güvenlik Fuarı'nda lansmanını yaptığımız otopark sektöründe kullanılan bir ürün serisidir. Bu ürünün özelliği, derinlemesine bilgi ve nesne tespitinin birleşimidir ve sektör için yıkıcı bir öneme sahip olan otoparkta% 100'e yakın bir araç algılama oranı sağlar.

Şu anda güvenlik içinde olan derinlemesine uygulamalara ek olarak, birden çok sensörün füzyonu yoluyla çok düşük aydınlatma altında daha iyi görüntüleme efektleri elde etmeye ve böylece insan algısını kırmaya çalışıyoruz.

Hepsi bugün paylaştığım için, hepinize teşekkür ederim.

2018 envanteri: Amazon tarafından piyasaya sürülen akıllı donanım ürünleri
önceki
UZI German Cup'a katılmayacak, Huya canlı yayın saati açıklanacak! Netizen: Kralın Dönüşü!
Sonraki
Nike'ın yeni koşu ayakkabısı Air Zoom Mariah Flyknit sonunda çıktı!
"Aquaman" 24 saatte gişede 200 milyonu vurdu
Redmi Note5 çift rakiple karşılaşır, Xiaomi Note3 Boom Blue E3'ü kurtarır!
WeChat 7.0 sürümü dört yıl sonra güncellendi ve değişiklikler gerçekten büyük.
CES 2019: Samsung, yeni yapay zeka ürünlerini fuara getireceğini duyurdu
Bunu hatırlamak! Bu trafik kazaları "özel" olamaz!
Bu Nike Spiridon çifti, bir kez aşağıya bakıldığında, ayakkabı dolabınızı doldurmak üzere! İki yeni rengi nasıl seçersiniz?
"Hava Patlama Öncesi" Xiao Yang, seyirciyi mutsuzdan kaçmaya yönlendirmek için Guangzhou'da havalandı, "tanrılar" ortaya çıktı
OnePlus 6 yapılandırması açığa çıktı, 4700 yuan'ın fiyatı OnePlus 5T satın almak kadar iyi değil!
Huya, iki PCPI yorumunu ifşa etti! Netizenler hayal kırıklığına uğradı: Bai, iki genç bayan için sekiz katlı bir ayna hazırladı!
Fit neden bu kadar övülüyor?
Başka bir yol seçin ve üç yerel blockchain akıllı telefonu karşılaştırın!
To Top