Geling Shentong CEO'su Zhao Yong'un ayrıntılı özeti: Yerli akıllı güvenlik ve yüz tanımanın gerçek statükosunu ortaya çıkarınZor yaratıcı açık sınıf

Yapay zeka teknolojisinin olgunluğu, devasa gözetim video verilerini yapay zeka ile otomatik olarak sindirmeyi mümkün kılar. Şu anda, yapay zeka yavaş yavaş güvenlik endüstrisine girmiştir ve sonunda video ağı ile güvenlik endüstrisini, çekirdek olarak yapılandırılmış veriler ve hedef olarak doğru istihbarat üretimi ile akıllı bir IoT endüstrisine yeniden şekillendirecektir.

Akıllı güvenliğin öncüsü olarak Greening, son 4 yılda güvenlik için 3D bilgisayarlı görme teknolojisine dayalı Haomu davranış analizörü, yapılandırılmış verilere dayalı WeimuView büyük veri analiz platformu, Weimu Araç Özellik Tanıma Sistemi, Weimu Yüz Tanıma Sistemi ve yeni ürünü Deep Pupil İnsan Gözü Kamerası.

Bu Lei Feng.com Hard Innovation Open Class'ta Greenshentong'un CEO'su Dr. Zhao Yong, uzun yıllara dayanan araştırma ve endüstri deneyimine dayanarak, AI teknolojisinin akıllı donanım biçiminde tüm dünyayı nasıl derinden değiştireceğini derinlemesine paylaştı. veri madenciliği ve Nesnelerin İnterneti güvenlik endüstrisi.

Misafir tanıtımı

Greenshentong CEO'su Zhao Yong, Brown Üniversitesi'nden Bilgisayar Mühendisliği Doktorası.

Dr. Zhao Yong, bir zamanlar Google Genel Merkezi Araştırma Enstitüsü'nde kıdemli araştırmacı olarak çalıştı. Android işletim sistemindeki görüntü işleme mimarisinin tasarımcısı ve Google Glass'ın en eski çekirdek Ar-Ge üyesidir. Aynı zamanda, yüksek performanslı görüntü analizi ve işleme için Google'ın gelecekteki bulut bilişim mimarisi tasarımını keşfetmekten de sorumludur. Çin'e döndükten sonra Dr. Zhao Yong, Nisan 2013'te Geling Shentong'u kurdu.

Bu açık sınıf aşağıdakileri içerir:

  • Yapay zekaya dayalı son teknoloji yüz, vücut ve araç tanıma teknolojisi

  • Güvenlik endüstrisi neden akıllı donanıma ihtiyaç duyuyor?

  • Biyonik prensibe dayalı insan gözü kamerası, büyük sahnelerde ve uzak mesafelerde yüz tanımayı nasıl gerçekleştiriyor?

  • Pratik güvenlik sorunlarının çözümünde mevcut yüz tanıma teknolojisinin karşılaştığı zorluklar

  • Yapay zeka nesnelerin internetinde derin büyük veri madenciliğinin önemi

Herkese açık sınıf videosu: Toplam 95 dakika.

Not: Bu açık derste Dr. Zhao Yong çok sayıda canlı vaka ve video gösterdi ve netizenlerden gelen birçok harika soruyu yanıtladı, bu yüzden önce videoları izlemeniz önerilir.

Herkese merhaba, ben Green Eyes'ın kurucusu Zhao Yong.

Leifeng.com'un zor inovasyon açık sınıfında sizinle iletişim kurmaktan ve güvenlik izlemede bazı yapay zeka fırsatlarını ve deneyimlerini sizlerle paylaşmaktan çok mutluyum.

Birincisi, geleneksel güvenliğin statükosu ve acilen çözülmesi gereken sorunlar

Güvenlik izleme sektöründeki herkes hem tanıdık hem de yabancı olabilir.Bu sektörün uygulayıcısı değilseniz, tüm cadde kameralarla dolu sizin için en önemli güvenlik izleme şeklidir. Çin dünyanın en büyük güvenlik pazarıdır.Ülke on yıldan fazla bir süre önce güvenli bir şehir sistemi kurmaya başlamıştır.Bu sistem temel olarak Çin'in güvenlik endüstrisinin bileşimini ve durumunu belirler.

1. Geleneksel güvenlik endüstrisinin mevcut durumu

Ürün açısından bakıldığında, güvenli bir şehrin inşasında çok sayıda kamera konuşlandırılacak ve bu kameralar büyük miktarda video verisi üretecektir. Çok sayıda video kaydedicinin arkasında devasa bir video ağı vardır ve bu görüntü verilerinin izleme merkezine iletilmesi gerekir. Gözetim merkezinde, insanlar neredeyse her yerden videoyu görebilirler.

Çin'de güvenli şehirlerin inşasında çoğu kamera dijitalleştirildi ve ağa bağlandı. Çin'in güvenlik sektörünü anlamak istiyorsanız dünyanın en büyük güvenlik şirketi Hikvision'ın resmi web sitesine başvurabilirsiniz diye düşünüyorum. Özellikle ilginç bir şey buldum, Hikvision'ın resmi web sitesini açtığımda kendilerini şöyle konumlandırdılar:

Hikvision, kendisini video merkezli bir IoT çözüm sağlayıcısı olarak konumlandırıyor.

Video özünde çok kesin bir kelimedir. Günümüzün güvenlik izleme endüstrisinde hemen hemen tüm bileşenler videoya dayanmaktadır: kamera videonun üreticisidir, kaydedici videonun depolanmasıdır, ağ videonun yayıcısıdır ve izleme merkezi ise videonun kaydedildiği yerdir. videosu sunulmuştur.

Hikvision'un ürün sütunu, tümü videonun çekirdeğini içeren ağ kameraları, analog kameralar, dijital kameralar, kamera aksesuarları, görüntüleme ve kontrol ürünleri, depolama ürünleri, aktarım ürünleri, kodek ürünleri içerir.

Şu anda Çin'deki Nesnelerin İnterneti ölçeği çok büyük.Bir sabit disk şirketinin bir arkadaşı, şirketlerinin ürettiği her iki sabit diskten birinin güvenlik sektörüne girdiğini söyledi.

Pekin'i örnek alacak olursak, devlete ve sosyal kamu kurumlarına ait toplam kamera sayısı 2 milyonu aşıyor.Bu kameraların bizim cep telefonu kameralarımızdan farkı, her dakika ve her saniye kayıt tutmaları ve 2'den fazla üretmeleri. her gün milyon kamera.Günlerce video, 5.000 yıldan fazla.

Bu nedenle, kameralardan depolamaya kadar tüm güvenlik sistemimiz, çok büyük miktarda veri içeren bir ağdır. Bu ağ için verileri kim üretiyor? Tabii ki kamera. Ama bu verileri kim tüketiyor? Herkes bunu düşünsün.

Mevcut güvenlik gözetleme video ağımızda, tek tüketiciler gözetleme merkezindeki personeldir. Basitçe söylemek gerekirse, polistir.Bir vakayı çözdüklerinde birçok videoyu kontrol ederler.Veri üretim hızı, veri sindirim hızını çok aşıyor, bu da günümüzün güvenlik izleme endüstrisinde büyük bir çelişkiye yol açıyor: biz çok fazla video üretti, ancak bunlar Video sindirilemiyor.

"Hızlı ve Öfkeli 7"de bir sahne var, bu sahne çok güçlü ve gizemli bir teknik sistem.

Sistem, dünyadaki tüm güvenlik kameralarından herhangi bir hedefi otomatik olarak arar ve izler. Hollywood'un video güvenlik endüstrisinden çok az anladığı aşikar ve izleyiciler de günümüzün FBI, CIA ve yerel kamu güvenlik bürolarının böyle bir sistemi kullanmaya başladığını düşünüyor, ancak gerçek böyle değil.

Günümüz dünyasında güvenlik izleme sistemlerinin otomasyon derecesi, filmde anlatılan sahnelerden çok uzaktır.

2. Acil sorun: sıradan video verilerini anlamlı "zeka"ya dönüştürmek

Şimdi Hikvision'un tanımladığı şekliyle günümüzün video güvenlik ağına bakalım: çekirdeğinde video verileri olan bir ağdır ve bu ağ büyük miktarda video verisi üretir.

Peki bu verileri kimin sindirmesi gerekiyor? Tabii ki, insanların bunu sindirmesi ve manuel analiz yoluyla anlamlı bilgiler elde etmesi gerekiyor.

Müşterilerin her zaman anlamlı zekaya ihtiyacı olacaktır. İster güvenlik nedeniyle bir suçu çözüyor olsun, isterse yönetim şehirde neler olup bittiği hakkında bir şeyler bilmek istiyor, bu anlamlı bir istihbarat. Super 7'de insan algılama, yüz tanıma, araç tanıma, araç takibi ve daha fazlası gibi çeşitli teknik ayrıntılar sunulmaktadır. Bu araziler iki veya üç yıl önceydi, her işlevi ve kesinliği çok yüksek değil. Ancak yapay zeka teknolojisinin özellikle derin öğrenmenin olgunlaşmasıyla birlikte araç tanıma ve yüz tanıma gibi temel modüllerin performansı ve doğruluğu büyük ölçüde iyileştirildi.

Şu anda, video verilerine odaklanan güvenlik izleme sistemi aslında müşterilere çok fazla sorun getiriyor. Çok fazla veri ürettiğiniz, bu verileri müşterilerin önüne koyduğunuz ve ardından ipuçlarını aradığınız için samanlıkta iğne aramaya benzer. Bu nedenle tüm endüstri umudunu zekaya bağlamaktadır.Sözde zeka, yapay zekayı tanıtma ve yapay zekayı tanıtma yeteneğidir Tüketiciler, bu video verilerindeki içeriği ve hedefleri otomatik olarak değiştirebilen insanlar dışındaki tüm video verilerine yapılandırılmış veri

Yapılandırılmış veri nedir?

Yapılandırılmış veriler, hedefin özelliklerini, niteliklerini ve kimliğini doğrudan ifade edebilen verilerdir.

Bu tür veriler büyük ölçekte alınabilir, analiz edilebilir ve büyük ölçekte sayılabilir. Zeka, AI'nın video verileri merkezli Nesnelerin İnterneti'ndeki verilerin tüketicisi olabileceğini ummaktır.Şu anda, tüketicinin çıktısı yapılandırılmış verilerdir.

Yapılandırılmış veriler doğrudan kullanılamaz, çünkü bu veriler bir kez büyük ölçekte yapılandırıldığında, veri miktarı hala çok büyüktür.

Şunu bir düşünelim.Nesnelerin İnterneti ile ilgili kişisel anlayışım, internet bir yere kadar geliştiğinde netizenleri sadece insanlar olmayacak, birçok cihaz da tıpkı insanlar gibi internete ait olacak. Bu cihazlar otomatik olarak veri üretir ve bazı cihazlar verileri otomatik olarak sindirir.

Güvenlik izleme ağında veri üreteçleri kameralar ve video kaydedicilerdir. Verilerin sindiricileri yapay zeka ve insanlardır.

Ancak yapay zeka bu kadar çok videoyu yapılandırılmış verilere dönüştürdüğünde, yeni bir veri okyanusu ortaya çıkıyor: yapılandırılmış veri okyanusu. Veriler iyi işlenmemişse, anlamlı zeka da değildir.

Yapılandırılmış veriler artık çok olgun yöntemlerle çıkarılabiliyor.Bu süreçte, bazı çok sığ madencilik ve basit tarama olacak: kara listeye alma gibi. Bir araba tespit edildiğinde, plaka numarası şüpheli bir plaka numarasıdır ve plaka numarasını tespit ettiğimde, araba arka planda uyarılır.

Diyelim ki bir kişiyi tespit etmek istiyorum: Diyelim ki bir kaçağın resmi var ve bir metro istasyonunda kamerada kaçak gibi görünen birini gördüğümde, bu anlamlı bir zeka parçası olabilir.

Hastanede çok sığ bir kazı da olabilir.Örneğin hastanede sorun çıkarmak için bazı kişiler bulunacaktır ve bu kişileri önceden "tıbbi erzak deposuna" koyabilir. Bu kişiler hastaneye geldiklerinde ilk uyarıyı hastanenin güvenliği alabiliyor.

Aslında hala yukarıdaki kazılardan çok daha komplike kazılar var.Örneğin hastane kayıt alanında çok sayıda kaçakçı var.Bu kişiler hastane hizmetlerinin düzenini bozuyor.Bu kaçakçılar nasıl bulunur? Numara satıcısı ile sıradan normal hasta arasındaki farkı nasıl ortaya çıkarabiliriz? Burada insan tacirlerinin davranışları hakkında bazı analizler yapmamız ve büyük miktarda yüz verisi ve davranış verisinden bu belirli kişileri otomatik olarak seçmemiz gerekiyor.

Ayrıca ilginç bir şey daha var: Yapay zeka büyük miktarda yapılandırılmış veri ürettiğinde, uygulamalar için veri madenciliği için çok fazla alan olacaktır. Çünkü geçmişte yapılandırılmış verinin olmadığı zamanlarda, farklı müşterilerin kullandığı kameralar ve video kaydediciler standart donanımlardı ve sadece resmi görmesi gerekiyordu. Ekrandan izlediği bilgiler iş içeriğini nasıl yansıtıyor ve bunların insanlar tarafından yapılması gerekiyor.

Bu veriler bugün yapılandırılmış veri haline geldiğinde, farklı endüstrilerde ve farklı senaryolarda çok sayıda veri madenciliği uygulaması, yapılandırılmış verileri etkili bir şekilde anlamlı zekaya dönüştürebilir.

Bu nedenle gelecekte yapay zekanın güvenlik izleme sektöründe uygulama yazılımları için geniş bir pazar alanına sahip olacağını ve çeşitli dikey sektörler için hedefli veri madenciliği yapacağını düşünüyorum.

İkincisi, dikey güvenlik endüstrisinde görüntü tanımanın sonuçları

Görüntü tanıma teknolojisinin bazı farklı dikey alanlardaki uygulama sonuçlarını kısaca göstereceğiz.

1. Olgun araç kimliği

Şimdi aşağıdaki video, derin öğrenme algoritmaları kullanılarak geliştirilmiş bir araç büyük veri yapılandırma motorudur.

Ekrandan, ister motorlu ister motorsuz araç olsun her trafik biriminde tespit edilip izlenebileceği ve her bir hedefe karşılık gelen özniteliklerin de tanımlanacağı görülebilir: Plaka numarası, üretici, model, yıllık muayene tespit edilebilir.Hedef durumu ve hatta modelin belirli yılı da tespit edilebilir.

Araç tanımlama sorunu bugün çözülmüş gibi görünüyor, bir araç çok özel bir hedef türüdür çünkü benzersiz bir kimliği vardır: plaka numarası. Yasal plaka numarası benzersizdir ve plaka numarası belirlendikten sonra tüm sorun daha iyi çözülebilir.

Geçen yıldan bu yana, araç büyük veri ürünleri birçok üretici tarafından piyasaya sürüldü ve gelecekte daha popüler hale gelecek.

Burada önemli bir fırsat var.Yoldaki müşteriler için üç tip kamera var: elektrikli polis, süngü ve güvenlik kameraları.

Sözde elektrikli polis ve süngü genellikle kavşakta veya otoyolun giriş ve çıkışında bir portala veya kamera takılı bir rafa sahiptir.

Bu kameralar çok yüksek bir çözünürlük kullanır ve açı da çok uygundur, ön tarafta tanıma başarı oranını artırabilir. Ancak elektrik kuyusu ve süngü gibi kameralar, tüm yoldaki kamera sayısının sadece küçük bir kısmı. Pekin'i örnek alırsak, elektrikli polis ve süngü kameraların sayısı yollardaki tüm kameraların yaklaşık binde birini oluşturuyor.

Çok sayıda ve video kaydettikleri için özellikle yüksek çözünürlüklü olmayan, normal video gözetim kameraları olan daha birçok kamera var. Genel olarak kurulum, tüm büyük sahneyi izlemek içindir, bu nedenle görüş alanı büyüktür ve daha geniş görüş alanının dezavantajı, her bir hedef için ayrılabilecek piksel sayısının azalacağıdır.

Şu anda, gözetleme videosunda görülen birçok nesne çok net değil: dolgu ışığı yok, aydınlatma yeterli değil ve görüntü bulanıklığı çok ciddi. Bu düşük kaliteli veri ve yetersiz ortamda video tanıma konusunda hala iyi bir iş nasıl yapılır? Bazı açılardan bu, yol izlemede büyük video ve büyük veri konusunda iyi bir iş yapıp yapamayacağımızı belirler.Aslında, bu alandaki ürünlerde hala iyileştirme için çok yer var.

Temel veriler belirlendiğinde bu verilere dayalı olarak çeşitli büyük veri analizleri yapılabilmektedir. Geling Shentong'u örnek alarak, Weimu Big Data Platform adlı araç büyük verileri için bir platform geliştirdik.

Size çok basit bir gösteri yapmak için müşterinin yerinde bazı kameralar seçtik ve ardından bir alan seçtik. Ardından Audi, BMW vb. gibi bazı farklı otomobil markalarını arayabilirsiniz. "Audi" için arama yaptıktan sonra, arabalardan herhangi birini seçip nerede ve ne zaman göründüğünü görebilir ve ardından harita üzerinde daha fazla arama yapabilirsiniz.

Tahmin edebileceğiniz gibi, bir uzayda birçok arama sonucu elde edebildiğimde, bu farklı sonuçların uzay-zaman ilişkisi bize bir yörünge bilgisi sağlayacaktır. Bu yörünge bilgisi bize bazı insanların davranışlarını analiz etmek için daha güçlü analiz yöntemleri verecektir.Çeşitli taktikler vardır.Sözde taktikler, polis müvekkilleri tarafından vakaları çözmek veya bazı verileri analiz etmek ve işlemek için kullanılan farklı yöntemlerdir.

2. Karakter Özelliği Tanıma

Az önce arabaydı, şimdi insanların kimliklerine bakalım.

Bu görsel sistem resimdeki yayayı ve onun niteliklerini yapılandırabilir, yani karakterlerin cinsiyet, yaklaşık yaş, bagaj nitelikleri, giysi rengi, giysi türü gibi temel nitelikleri hakkında bazı yargılarda bulunabilir. Önünü görebiliyorsanız, maskeli ve gözlüklü olup olmadığını, sakalının olup olmadığını görebilirsiniz.

Bu bilgi aslında yüz tanıma ile aynı değildir, kısa süreli olduğunda ve yüksek çözünürlük gerektirmediğinde bilgi edinmenin bir yoludur.

Birçoğumuz güvenlik gözetimine aşina olmadığımızda, sokaktaki güvenlik gözetim kameralarının yüzleri tanıması gerektiğini hissedeceğiz. Ama aslında, günümüzde sıradan güvenlik kameralarının büyük çoğunluğu yüz tanıma çözünürlüğünün şartlarını hiçbir şekilde karşılayamıyor.

Birincisi, görüş alanları genellikle daha geniş olacak şekilde ayarlanmıştır, ikincisi ise insanlardan daha uzak olmalarıdır.

Bu durumda bu kişinin dış görünüşü net olarak görülebilse de yüzünü net görmek istiyorsanız özellikle yüz bölgesinde görece yüksek bir çözünürlük elde etmek istiyorsanız en az 80×80 veya 100×100, ve çözünürlük Yüksek oran, yüz tanımanın etkisini iyileştirmek için çok önemli bir faktördür.

Günümüzde sokaklardaki bu sıradan güvenlik kamerası videolarında, yüz net olarak görülemese ve yüz tanıma işlemi yapılamasa da diğer özelliklerini de ondan alabilirsek çok önemli bir unsurdur.

Örneğin kayıp bir çocuk var ve tanığın verdiği ipucu kırmızı elbiseli orta yaşlı bir kadının çocuğu tuttuğunu görmek. Daha sonra yukarıdaki özelliklere göre arama yapabiliriz: orta yaşlı, kadın, kırmızı giysili, çocuk sahibi, bu 4 özelliği arama sistemine girin ve hedefi hızlı bir şekilde bulabilirsiniz.

3. Yüz Tanıma

Yüz tanımaya tekrar bir göz atalım.Daha güvenilir bir tanıma sonucu elde etmek için ekranın mesafesi aşağıdaki şekilde görüldüğü gibidir.

Burada sıradan bir yüksek tanımlı kamera bağladık. Bu kamerada, bir ofiste koridorun en üstüne yerleştirmek için özellikle 15 mm veya daha uzun odak uzaklığına sahip bir lens seçtik. Ortamdaki yüzleri tanımlamada neredeyse etkili olan yüz genişliğinin en fazla üç metre olduğunu bulduk. Elbette, tanıma genişliğini daha uzağa itmek için daha uzun odaklı lensler kullanabilir veya tanıma genişliğini kameraya daha yakın hale getirmek için kısa bir lens kullanabilirsiniz. Ancak nasıl denerseniz deneyin, gerçekten etkili tanıma genişliği sadece yaklaşık üç metredir.

Genellikle, örneğin 30×30'un altında düşük çözünürlüklü bir yüz elde ederiz, o zaman büyük bir veritabanındaki arama etkisi kesinlikle ideal değildir. Bir yüzün genellikle 100×100 pikselden fazla olması gerektiğinde, arama sonuçları çok doğru olacaktır ve hatta milyonlarca veya on milyonlarca insan gibi geniş bir veritabanında anlamlı aramalar yapılabilir.

Yüz tanıma teknolojisi son birkaç yılda çok yol kat etti. 3 yıl öncesine kıyasla standart bir test setine baktığımızda hata oranı muhtemelen binlerce kat daha azdır. Yüz modelini eğitirken ışıklandırma, açı ve ifade sorunlarına ve parazite direnip direnemeyeceğimize özellikle dikkat etmeliyiz.

Ayrıca personelin kendi başına bir meydan okuma yaptığını videoda da görebilirsiniz ve her personel, ister ofiste ister bahçe dışında, iş sırasında yüz tanıma sistemimiz ile birçok fotoğraf çekebilir.

Kasten kameraya doğru yürümelerini ve yüz tanıma sisteminin yanlış bir tanıma verecek kadar abartılı bir yüz yapabileceklerini görmek için yüzler yapmalarını sağladım. Bazı insanların surat astığını, bazılarının saçlarını karıştırdığını görebilirsiniz.

3. AI ön uçta mı yoksa arka uçta mı kullanılmalı?

Gelecekte, zeka güvenlik izleme endüstrisinde kesinlikle çok yaygın ve derinlemesine olacak, ancak uygulandığında farklı cihazlara yerleştirilebilir ve bazen kameralar ve hatta video gibi zeka ön uca yerleştirilebilir. kaydediciler. Hesaplama için arka planda veri merkezine ve sunucuya bir miktar zeka koymak da mümkündür ve ne tür bir tahsis daha makul bir tahsistir. Bu konuyla ilgili olarak, sizin için analiz etmek istiyorum.

1. Zekayı ön plana koymanın faydaları

Bence zekayı ön uca koymanın en büyük avantajı, bir video akışını hedeflerken, tüm bilgi işlem kaynaklarının ön uca tahsis edilmesidir. Ön uçta olmanın bir avantajı, çok sıkışık bir ağ üzerinden veri merkezine çok fazla veri gönderilmesine gerek olmamasıdır.

Güvenlik izleme ağındaki verilerin tümünün video dosyaları olduğunu ve kod akışının ve veri hacminin diğer herhangi bir dosya biçiminden çok daha büyük olduğunu anlamalıyız.

Bir gigabit ethernetiniz olduğunu hayal edin, bu gigabit ethernet üzerinde aynı anda ne kadar video iletilebilir?

Genel olarak konuşursak, yüksek tanımlı bir video akışı 2 ila 4 MB'ye ulaşacaktır, bu da bir Gigabit Ethernet'te ağı maksimum bir veya iki yüz videonun doldurabileceği anlamına gelir, bu nedenle akıllı olanı koyun Ön ucun avantajı biraz tasarruf sağlar Bant genişliği.

2. Zekayı arka plana koymanın faydaları

Zekayı arka plana koymanın avantajı biraz bulut bilişime benzer.Bulut bilişimin avantajlarından biri paylaşımdır.Arka planda çok güçlü donanım ve çok karmaşık yazılımları kullanarak çok iyi bir tanıma performansı elde edebilirim çünkü insanların yüksek gereksinimleri var tanıma doğruluğu için Sonsuza kadar sonsuzdur. Ancak bu, tanımlama algoritmaları ve donanım için nispeten yüksek gereksinimlere yol açacaktır.Sunucuya yerleştirilirse bu koşul sağlanabilir ve farklı ön uçlarla paylaşılabilir.

İkincisi, bu cihazlar arka plana yerleştirilirse, bir yazılım veya donanım arızası varsa, ön uç kameranın aksine, algoritma yükseltmesi ve çalışması ve bakımı daha güvenilir olacaktır. Özellikle donanım arızası, bakımı çok zahmetli olacaktır.

3. Ön kameraya hangi işlevler yerleştirilmelidir?

Ben şahsen bu soruna şöyle bakıyorum.Videoda algılama, izleme ve tekilleştirme: algılama hedefin tespiti, izleme, hedefin kameradaki hareketini izlemek ve tekilleştirme, ben tanımlama için gönderin, Algılamak için birden fazla algılama arasından daha iyi bir görüş açısı seçin ve birçok tekrarlanan algılamayı kaldırın.

Bu 3 madde özellikle uygun ve kamerada yapılmalı, neden? Çünkü bu içeriklerin kamera ekranında hedef olup olmaması ile bir ilgisi yoktur. Tespit etmezseniz bir hedef olup olmadığını bilemezsiniz.

İşlemin bu kısmının video akışının başlamasıyla birlikte her zaman başlatılması gerekiyor ve paylaşım diye bir şey yok. Bu tanıma kameranın önünde yapılmalıdır. Algılama, izleme ve tekilleştirmeden sonra, tanınan nesne ağ üzerinden bir fotoğraf akışı olarak arka plana iletilir.Şu anda, zaten bir ekran görüntüsü görüntüsü veya ekran görüntüsünün küçük bir parçasıdır ve veri miktarı çok küçük. Ve veri miktarı, sahnedeki hedeflerin sayısı ve faaliyetlerin yoğunluğu ile ilgilidir: daha fazla insan olduğunda, daha fazla veri olacaktır. Gecenin ortasında daha az insan olduğunda, verisi yoktur.

Bu sayede tanıma arka plan sunucusunda yapılırsa tanıma doğruluğunun daha yüksek olması garanti edilebilir. Karşılaştırmadan bahsetmeye gerek yok, çünkü bir nesneyi her tanımladığınızda, dikkat etmeye değer bir nesne olup olmadığını görmek için onu bazı müşterilerin hassas hedef kitaplığıyla karşılaştırmanız gerekir.

Son zamanlarda piyasada öyle bir işaret buldum ki, birçok müşteri ilk günlerde akıllı ürünler kurdu ve bunların sayısı çok değil. Bu nedenle, çoğu durumda, geleneksel IP kamera doğrudan arka plan sunucusuna bağlıdır.Bu erken yöntem uygulanabilir, ancak müşterinin bant genişliğine büyük bir yük getirecektir.

4. Ön kameraya hangi işlevler yerleştirilmemelidir?

Akıllı ürünler tanıtıldığında bu şekilde hızlı ilerlemenin zor olduğuna inanıyorum. Öyleyse acilen çözülmesi gereken şey, ön uç zekadır. Bazı üreticilerin bunu yapmak için kameraya tanımlama ve karşılaştırma koymaya çalıştığını gördüm, bunun sorunlu olduğunu düşünüyorum ,niye ya? Kamerada tanıma yaparsınız ve tanıma yüz özelliklerini oluşturur. Her şirketin farklı algoritmaları nedeniyle, müşterinin arka planındaki karşılaştırma sisteminin sadece bu özellik ile arayüz oluşturması gerekmektedir. Bu, müşterilere çok fazla sorun getirecek, bu yıl bu üreticiden ekipman satın alırsam, arka ucumun da bu ekipmanlara göre inşa edilmesi gerekecek.

Önümüzdeki yıl farklı üreticilerden ekipman almak istediğimde uyumsuzlukla karşılaşacağım. Resimlerin en uyumlu ve erişilebilir veri olduğunu düşünüyorum, bu yüzden soruna müşterinin bakış açısıyla bakmalıyız.Tanımlama algoritması ve karşılaştırması kamera önüne konmamalı, çünkü çok fazla esneksizlik getirecektir. müşterilere yükler.

Bence ön uca yerleştirilmemeli çünkü karşılaştırmanın müşterinin temel kaynak karşılaştırma kitaplığını kameraya koyması gerekiyor.Birçok kamu güvenliği uygulamasında bunlar temel sırlardır. Bir bilgisayar korsanının kameraya saldırması durumunda, kara listeyle ilgili temel bilgilerin ondan alınacağını hayal edebilirsiniz. Temel bilgilerin her zaman ön uçta değil, müşterinin en temel gizli ağında, veri merkezinde kalması gerektiğini düşünüyorum. Akıllı ön uç ve arka uç arasındaki iş bölümünü böyle görüyorum.

Dördüncüsü, yüz tanımanın gerçek durumu

Ardından yüz tanımanın şu anki durumu ve ilerlemesinden bahsetmek istiyorum.

Burada bir bölünme var, nasıl bir bölünme?

Bazı yapay zeka şirketleri, hata oranının 100 milyonda 1 mertebesine ulaştığını vb. söyleyerek yüz tanıma performansını genel olarak çok yükseklere uçurduklarını kamuoyuna duyuruyor. Bu bir gerçek olsa da, bazen bazı tanıma hata oranlarının 100 milyonda birden düşük olduğunu bulduğumuz doğrudur, ancak bu, statik yüz tanıma gibi: poz verme vb.

Diğer bir senaryo ise erişim kontrolü uygulamasıdır.İnsanlar bir geçidi geçmek için kameraya bakarlar.Bu sırada görüntüleme koşulları çok iyidir. Ancak güvenlik açısından, gözlenen nesne genellikle gözlemlendiğinden habersizdir, açısı çok ideal değildir, kameradan uzaktadır ve aydınlatma daha karmaşıktır. Ve hedefin tamamı hareket halindeki fotoğrafa çarptığında, yüz tanıma sonuçları tamamen farklıdır.

Birçok şirket yüz tanımanın iyi bir iş çıkardığını düşünüyor, ancak diğer yandan yüz tanımanın kullanılıp kullanılmadığını araştırmaya giderseniz, Özellikle dinamik yüz tanıma kullanan müşteriler için, çoğu müşteri yanlış pozitif oranın çok yüksek olduğunu ve bu sistemin o kadar yüksek olduğunu ve bu sistemin kullanılmasının temelde imkansız olduğunu düşünüyor.

1. Yüz teknolojisi kötü mü yoksa herkes yalan mı söylüyor?

Bugün bu fırsatı değerlendirerek, sebeplerini de çok açık yüreklilikle sizlerle paylaşmak istiyorum. Sonuçta yüz tanıma teknolojisi yeterince iyi değil ya da herkes yalan söylüyor.

Yüz tanımanın avantajı hızlı olmasıdır.Bir grafik kartı saniyede yüzlerce yüz özelliği üretebilir ve on milyonlarca yüzün karşılaştırmasını tamamlayabilir.Bu zaten yapılabilir. Aynı zamanda düşük maliyetlidir, beceriyi hızlı bir şekilde tekrarlanabilir, uygun ölçekte konuşlandırılabilir ve istikrarlı ve sürekli olarak iyileştirir. Yapay zekanın dezavantajı, çevresel değişikliklere zayıf uyum sağlama yeteneğinin yanı sıra karmaşık sorunlarla başa çıkma konusundaki zayıf yeteneğidir.

İnsan zekası, yapay zekanın neredeyse tam tersidir.

İnsan zekasının avantajı, yapay zekanın tam olarak dezavantajıdır.İnsanlar karmaşık sorunlara yanıt verme ve çevresel değişikliklere uyum sağlama konusunda güçlü bir yeteneğe sahiptir, ancak dezavantajları yavaş hız, yüksek maliyet, hızlı bir şekilde tekrarlanması zor ve herhangi bir yerde konuşlandırılma olasılığı düşüktür. büyük ölçekli Performans da düzensizdir (zihinsel duruma duyarlı).

2. 1'e 1 yüz doğrulama

Yapay zekanın farklı uygulamalarına bir göz atalım ve önce 1:1 yüz doğrulamasını tanıtalım.

Finansal ödemeler alanında, bazı şirketler müşterilerin kullanıcıların kimliklerini doğrulamalarına yardımcı olacak yazılımlar geliştirmektedir. Bu tür uygulamalar aslında bir soruyu yanıtlıyor. Müşterinin kamerası bir fotoğraf çeker ve ardından fotoğrafı arka plana iletir.Arka plan, doğrulama nesnesinin kim olduğunu bilir ve doğrulama nesnesinin kimlik kartının bir fotoğrafına sahiptir. Yani cevaplamak istediği soru "Bu iki kişi aynı kişi mi?" ve cevap "evet" veya "hayır"dır. Yani bu soruyu toplamda cevaplamak için.

3. 1'den N'ye yüz tanıma (statik yüz karşılaştırması)

Statik yüz karşılaştırması olarak da adlandırılan 1:N yüz tanımaya bir göz atalım.

Müşterinin bir fotoğraf seçtiğini ve ardından N kişilik bir karşılaştırma kitaplığına sahip olduğunu varsayalım. Örneğin bir ilin asayiş bürosunda bu ilde nüfus cüzdanlı 50 milyon vatandaş var. Bu sırada polis, bu kişinin kimliğini araştırmak isteyen bir zanlıyı gördü.Bu kişi kim?

Bunu yapma sürecinde aslında yüz tanımanın bir çok soruya cevap vermesi gerekiyor. Bu kişi Zhang San mı? Bu kişi Li Si mi? Wang Wu mu? O zaman N soruyu ve muhtemelen en zor soruyu, N+1'inci soruyu yanıtlaması gerekir: bu kişi herhangi biri olmayabilir. Buna statik yüz karşılaştırması denir. Açıkçası, statik yüz karşılaştırması, yüz doğrulamasından daha karmaşık bir sorundur. Cevaplanacak toplam soru sayısı N+1 olduğundan, bu N nispeten büyük olduğunda, soruları cevaplamanın zorluğu ve hata olasılığı büyük ölçüde iyileşir.

Ancak, statik yüz eşleştirmenin sıklığı nispeten düşüktür ve yalnızca müşteri arama yapmak istediğinde kullanılır. Kullanıcının etkileşime ve onaya katılmasına izin veren senaryoları kullanır. Basitçe söylemek gerekirse, bu bir arama motoru gibidir. Doğru olduğunu düşündüğüm arama sonuçlarından birini seçerim veya benzer görünen ilk birkaç arama sonucunu sunarım. Ayrı ayrı araştırdıktan sonra, müşterilerin araştırma kapsamını daraltmasına hızla yardımcı olabilirim.

Bu tür bir ürün de son bir veya iki yılda daha hızlı tanıtılmıştır ve bulunabilirliği nispeten yüksektir.

3. M'den N'ye yüz tanıma (dinamik yüz karşılaştırması)

N'den çok M'nin yüz tanımasına bir göz atalım, genellikle buna dinamik tanıma denir.

Dinamik yüz tanıma nedir? Yani müşteri tarafından kurulan kamera bir kişiyi her gördüğünde, bu kişinin bir kütüphanede kim olduğunu karşılaştırır. "M", kamerayı veya ağdaki tüm kameralar tarafından yakalanan yüzlerin sayısını temsil eder. "N", karşılaştırma kitaplığındaki hedef sayısıdır ve yakalanan her yüze bir kez "sorulması" gerekir: Bu Zhang San mı? Li Si mi, gerçekten Wang Wu mu? O zaman bu kişiye N+1 soru sormalısınız. Tüm M kişileri görmek için toplam soru sayısı da M×N+1'dir. Ve tam otomatik bir sistem olduğu için dinamik yüzlerin kullanım sıklığı çok yüksektir.

Pekin metro istasyonunu örnek alın.Pekin'deki 1000'den fazla metro istasyonunun her birinde yüzlerce kamera olduğunu duydum.Metro istasyonunda 100 kamera varsa, bu çok yaygındır. milyonlarca insan.

Gören herkes için cevaplanacak N+1 soru var.Bu N, yüzbinlerce insan içeren ulusal bir kaçak veri tabanı gibi büyük bir kütüphane ise, bu astronomik bir sayıdır. Ve bu kullanım senaryosunda kullanıcı etkileşimi yoktur, müşteri sizden sonunda bir alarm oluşturmanızı bekler ve bu alarm güvenilirdir.

Önce şu soruya bir bakalım:

Dinamik bir yüz yakalama kamerası her gün aşağıdaki sorunları üretir: İlk olarak, her kameranın günde 10.000 yüz gördüğü varsayılır, bu pek çok halka açık yerde abartılı bir varsayım değildir.

Karşılaştırma kitaplığında polis için büyük bir hedef kitaplık olmayabilecek 10.000 hedef olduğunu varsayıyoruz. Bu varsayıma dayanarak, kameranın günde 101.000 soruyu yanıtlaması gerekiyor. AI, yanıtladığı her milyon yüz karşılaştırma sorusu için bir hata yaparsa, her kamerada her gün 100 hata veya 100 yanlış pozitif veya yanlış negatif yapılır.

Ben sadece cevaplanan her 1 milyon soruda bir hata yapılacağını varsaydım, ki bu aslında çok abartılı bir varsayım çünkü dinamik yüz tanımada, bir kişinin yüzünün açısı genellikle ideal değildir ve çözünürlük mutlaka ideal değildir. ya harika olur ve hareket bulanıklığı olabilir.

Bu durumda, herhangi bir şirket gerçekten milyonda bir hata oranına ulaşabiliyorsa, bunun zaten çok iyi olduğuna inanıyorum. Büyük bir müşteri 1.000 yüz tanıma kamerası taktıysa, bugün şehirlerde halihazırda bulunan kameraların sayısıyla karşılaştırıldığında 1.000'in açık olmak için çok fazla olmadığını düşünelim.

Şu anda sistemin her gün 100 milyar soruyu yanıtlaması gerekiyor.Yapay zeka 1 milyon soruyu cevaplarken bir hata yaparsa, müşteriler her gün 1 milyon hata alır, bu da 1 milyon yanlış pozitif veya yanlış negatif. Bir müşterinin günde 1 milyon alarm aldığında ne yapacağını hayal edelim? O zaman kesinlikle çökecek çünkü sistem hiç kullanılamıyor. Ve 10.000 kitaplık 10.000 set hedefi, her kamera günde 10.000 yüz görüyor, bu varsayımlar hiç de çok sert varsayımlar değil.

4. Yüz tanıma, kamu güvenliği sorunlarını çözmek için hala önemsiz

Yüz tanımanın son birkaç yılda büyük ilerleme kaydettiğini ve finans alanında kimlik doğrulaması için kullanılabileceğini fark edebiliriz, ancak kamu güvenliği sorunlarını çözmek için hala önemsizdir.

Bu gerçek, yüz tanıma teknolojisinin yeterince iyi olmadığı anlamına mı geliyor? Öyle düşünmüyorum. Yüz tanıma teknolojisi günümüzde insanları geride bırakmaya kararlı. Bilimsel deneysel verilere göre, normal insanlar 500 yüze kadar hatırlayabilir ve bazı satış ve diğer meslekler ve özel işlevlerin sahipleri zaten sınır olan 5.000 yüzü hatırlayabilir.

Dinamik Yüz Tanıma Problemi Bir gün Pekin'de 1 milyon dinamik yüz tanıma kamerası olduğunu ve Pekin'in 30 milyonluk bir nüfusa sahip olduğunu düşünün, bu bağlamda her gün on binlerce problem üretiyor. Bu durumda, düşük bile olsa hata olasılığı, bu kadar büyük bir tabanla çarpıldığında çok sayıda yanlış pozitif sonuç verecektir. Yani sorunun ölçeği oldukça acımasız.

Bu durumda ne yapmalıyız?

5. Akıllı güvenlik bundan sonra ne yapmalı?

1. Yapay Zeka + İnsan Zekası

Burada bir yöntem öneriyorum yani çok sayıda orijinal soru geldikten sonra yapay zeka motoru önce bunlara cevap verecek sonra yapay zeka cevapları üretecek ama bu cevapların çoğu yanlış bu durumda bu cevaplar olabilir Bir profesyonelin doğrulamasına izin verin. İnsan doğrulamasının yararı, bir yanıt insanlar tarafından doğrulanabildiğinde, bu zekanın en azından müşterinin ilgisini çektiği ortaya çıkıyor.

Ayrıca gerçek kişiler tarafından doğrulanmayan bu yanlış cevaplar da anlamlı cevap verileridir. Genellikle doğru cevaba daha yakın olan yanlış cevaplardır ve bu tür veriler, makine öğrenimi modelini geliştirmek ve yinelemek için de çok anlamlıdır.

Üründe böyle bir süreç tasarlarsak, yapay zeka tanıma motorunun doğruluğu sürekli geliştirilirken müşteriler de daha anlamlı zeka elde edebilir.

Çok fazla yapay zeka ile az miktarda insan zekasını birleştirmek, iyi bir tamamlayıcı etki yaratır.

2. Yapay zeka + büyük veri

Diğer bir yöntem ise yapay zeka + büyük veri.

Neden büyük veriye ihtiyacınız var? Ayrıca az önce, altta yatan yapılandırılmış verilere sahip olduğumuzda ve ardından müşterinin tüm iş sistemini tamamladığımızda, birçok büyük veri madenciliği uygulamasına ihtiyaç duyacağımızdan bahsetmiştim, ancak daha önemli olan şey, yapılandırılmış verilerin ölçeğindeki artışla birlikte, Sistem tarafından üretilen büyük ölçekli akıllı Yanlış pozitifler o kadar dramatik bir şekilde yükselebilir ki, doğru zeka bir yanlış pozitifler selinde boğulabilir. Bu, özellikle yüz tanıma için gerçekleşmesi zorunludur.

Artık ülkenin her yerindeki şehirlerin belirli bir ölçekte yüz tanıma sistemine sahip olmaya başladığını hissediyorum, ancak yakında tüm müşterilerin tekmeleneceğine ve yanlış pozitiflerin büyük ölçekte artacağına inanıyorum. Şimdi birçok müşterinin bunu keşfettiğini gördüm, bu durumda herhangi bir çözüm var mı? Tabii ki, Xie Enterprise'ın büyük ölçekli, çok modlu veri entegrasyonu yoluyla yapay zekanın doğruluğunu geliştirmesi gerektiğini düşünüyorum.

Bu ne anlama geliyor? Tek noktalı bir yapay zekanın sadece tanıma sonuçlarına bakacak olursak, on milyonda bir hata oranına ulaşabilse bile hata oranı yeterince iyi değildir, ancak çok fazla sorun olduğu sürece, olacaktır. yine de çok yanıltıcı olun.

Ancak verileri daha büyük ölçekte kullandığınızda, örneğin bir kişinin egzersiz yapması gibi. Yörünge rotasında tekrar tekrar tespit edilip edilemeyeceği veya yörüngeye yansıyan davranış ve kişinin şüpheliliğini veya bir hedefle ilgili çok modlu verileri doğrulayıp doğrulamadığı: aracı, tüketim kayıtları, cep telefonu sinyalleri, wifi Sondaları ve sosyal ilişkiler bu farklı veri modlarını bütünleştirebilir.

Size başka bir örnek vereyim: Örneğin, Xiao Ming ve Xiao Wang sınıf arkadaşı ve iyi arkadaşlardır. Pekin'de bir yerde Xiao Ming'e benzeyen birini gördüm, bu yüzden sonuç mutlaka Xiao Ming olmayabilir, sadece Xiao Ming'e çok benzeyen biri olabilir. Ama bu Xiao Wang'ı (Xiao Ming'in arkadaşı) tekrar aynı yerde görürsem, bu kişinin Xiao Ming olduğunu doğrulama olasılığım çok daha yüksek.

Bu sadece bir örnek, bu görevi daha iyi yapabilecek tonlarca desen, modalite, kombinasyon var. Dolayısıyla gelecekte yapay zeka ürünlerinin dikkat etmesi gereken bir yön olduğunu düşünüyorum ve ayrıca kişisel olarak başarılı bir yapay zeka şirketinin sahip olması gerektiğini düşündüğüm bir koşul: Güçlü büyük veri analiz yeteneklerine sahip olmalı.

6. Güvenlik alanında en son biyolojik görüş teknolojisinin uygulanması

Ardından, güvenlik alanına giren bazı son teknoloji ve ilginç teknolojileri sizinle paylaşacağım.

Doğa, kendisinden çok şey öğrenebileceğimiz çok zengin bir bilgi tabanıdır. Bilgisayarla görme tamamen "görme" ile ilgilidir, bu yüzden hayvan gözü kadar insan gözüne de odaklanalım.

Göz modelinden, göz bebeği denilen bir "obtüratöre" sahip olduğunu, "merceğin" gözümüzün merceği olduğunu ve "sensörün" göz küresinin içindeki retina olduğunu görebiliriz.

Aslında, insan gözü dijital kameradan temelde farklı değildir, ancak kamera aslında 100 yıldan fazla bir süredir icat edilmiştir.Bugün kameramız ister çok pahalı bir dijital SLR isterse iPhone'daki bir kamera olsun, aslında 1839'da icat edilenle aynı. Kameralar arasında görüntüleme ilkelerinde önemli bir fark yoktur. Ancak iğne deliği görüntüleme prensibi ile gerçek nesne, yansıma yoluyla arka plan sensöründe sunulur. Yıllar içinde değişen tek şey, lenslerin daha iyi hale gelmesi ve sensörlerin daha iyi hale gelmesi. Ancak bu süreçte görüntülemenin temel prensibi sadece bir projeksiyon problemidir.

1. 3D 2D olduğunda kaybolan mesafe bilgisi nasıl çözülür?

Dünyamız üç boyutlu bir dünyadır.Her nesne üç boyutludur.İzlenmesinin sonucu, ister kamera negatifinin düzlemi, ister göz küresinin küresel yüzeyi olsun, bir düzlem üzerindedir. Sonunda iki boyutlu bir veri haline geldi.Bu süreçte üç boyutlu veri iki boyutluya sıkıştırıldı.Kaybolan bir şey var mı? Kaybedilen derinlik bilgisi yani derinlik yönündeki mesafe bilgisidir.

Bir örnek daha vereyim, bu fotoğrafta birkaç araba yan yana yerleştirilmiş. Aynı zamanda, bir kişi tarafından bir oyuncak araba tutuldu ve fotoğraftaki parmaklar olmasaydı, birçok kişi yanlışlıkla park yerindeki gerçek bir araba olduğunu düşündü. Görüntüdeki nesnenin gerçek boyutunun gerçek boyutunu temsil etmediğini görebilirsiniz. Son zamanlarda kırmızı spor araba aslında çok küçük ama uzaktaki bir ağacın arkasındaki araba küçük görünüyor ama gerçek araba aslında daha büyük. Bir görüntüdeki bir cismin boyutunun, gerçek ölçeğiyle mutlaka bir ilgisi yoktur.Ölçeği kaybettiğinizde, boyutu, mesafeyi, hızı ve ivmeyi ölçmenin bir yolu yoktur. Bu durumda, nesnelerin davranışlarını analiz etmede büyük bir sorunumuz var.

Haydi başka bir doğa olayına bakalım.İşte hepsinin ortak bir yanı olan bazı hayvan resimleri var: Hepsinin iki gözü var. Dahası, iki gözün örtüşen görüş alanı nispeten geniştir.Bütün yırtıcıların gözlerinin ileriye baktığını, bu nedenle iki gözünün görüş alanlarının nispeten büyük olduğunu fark ettiniz mi ve örtüşmenin en büyük avantajı, iki geçmek Görüntünün paralaksının gözler tarafından analizi, hedefin derinliğini hesaplayabilir ve derinlik elde edildikten sonra avlanabilir.

Koyun, deve, at gibi tüm av hayvanların yana doğru büyüyen ve ardından 360 derecelik bir panorama oluşturan gözleri vardır. En büyük avantajı etrafındaki yırtıcılara karşı daha etkin bir şekilde korunabilmesidir.Başının arkasından yaklaşan yırtıcılar olup olmadığını izleyerek ot yiyebilir.

Aslında, bilgisayarla görme alanında, bir nesnenin derinliğini hesaplamak için birden fazla görüş alanını kullanabilen birçok teknik vardır.

Bu prensibe dayalı olarak Geling Shentong, Haomu Behavior Analyzer adlı bir ürünü piyasaya sürdü.Haomu Behavior Analyzer, yapılandırılmış bir ışık yolu ile Derinlik Videosu üretir ve ardından verilere dayalı olarak insanların davranışlarını analiz eder.

Size kameranın önünde yürüyen çok sayıda insanın olduğu ve aralarında çok fazla tıkanıklık olduğu basit bir demo göstereceğim.

Ama tıkanıklık durumunda bile yine de herkesi çok iyi takip edebiliyoruz ve her kişinin beline bir daire çizebiliyoruz.Bu dairenin farklı renkleri var.Resmin sol alt köşesi yukarıdan aşağıya bir radar görüntüsü. radar haritası kamerayı temsil eder ve alt kısım görüş alanını temsil eder ve ardından her bir noktanın rengi videodaki kişinin bel dairesinin rengine karşılık gelir, böylece her bir kişinin yörüngesini görebilirsiniz. Bu şekilde, insanların yörüngelerinin davranışları daha karmaşık bir yerde analiz edilebilir.

Örneğin biri kovalıyorsa, uzun süre kalıyorsa ya da geziyorsa kişinin düşüp düşmediğini, herhangi bir şiddetli hareket olup olmadığını vb. de analiz edebiliriz.

Şiddetli hareketleri analiz etmek istiyorsanız, vücut duruşunun daha derinlemesine bir analizini yapmanız gerekir. İçinde, görüntüden eklemlerinin, kollarının ve bacaklarının pozisyonlarını hesaplayabilen bir algoritma geliştirdik. Microsoft veya Primesense gibi şirketlerin HCI ürünlerinde benzer işlevlerin uygulandığının farkında olabilirsiniz.

Geling Shentong, özellikle güvenlik izleme için bir dizi tanımlama algoritması geliştirmiştir.Aradaki fark, izleme açısından daha iyi başlatmayı hızlı bir şekilde elde edebilmesidir.

2. Böcek bileşik göz ilkesinden ışık alan kamerasının ilhamı

Şu anda, bazı insanlar tüm hayvanların iki gözü olmadığından ve böceklerin olmadığından şüphe duyacaklar.Böceklerin gözlerine bileşik göz denir ve binlerce mercek vardır.

Burada neler oluyor? Bu fotoğraf seti birçok böceğin gözlerini gösteriyor, ilk bakışta bileşik gözleri görüyorsunuz, ancak bileşik gözler bile, ortak bir noktaları var, ilki bir çift bileşik göze sahip olmaları ve ikincisi ise onların bir çift birleşik göze sahip olmaları. gözler onlara yöneliktir. Baş için büyük.

Neden bu kadar büyük gözlere ihtiyacın var? Bir kamera olarak hassasiyeti önemli bir göstergedir. Işığa duyarlı miktar yeterince büyük değilse ve yeterince büyük değilse, net bir fotoğraf oluşturmak zordur, çünkü bir fotoğraf oluşturmak fotonlar ve sensör arasındaki enerji alışverişini gerektirir. Renk ve parlaklık tanımlamasını oluşturmak için enerji alışverişi ölçülmelidir, bu nedenle SLR kamera gibi iyi bir kameranın geniş bir açıklığı vardır.

Ancak böceğin gövdesinin boyutu çok küçüktür.Bu durumda içeriye ışık miktarını sağlamak için açıklığın boyutunu mümkün olduğunca artırmak gerekir, bu yüzden böceğin gözleri bu kadar büyüktür. büyük.

İkincisi, bir böceğin her gözü neden bir bileşik göz haline gelir? Geleneksel optik modelleri kullanarak böcekler için gözler tasarlayacak olsaydınız, ne gibi zorluklarla karşılaşırdınız? Diyelim ki bir arısınız ve hayatınızda sürekli çiçek ve nektar aramanız gerekiyor.Bazen onlarca kilometre ötedeki bir hedefi görüp uçmanız gerekiyor. Ama nektar toplarken, polenin hangi ercik üzerinde olduğunu görebilmek için yaprakların üzerinde durun ve sonra gidip toplayın.

Yani hem çok uzaktaki nesneleri hem de çok yakındaki nesneleri görebilmeniz gerekir. Bu durumda, zum lensinin çok yüksek zum dinamik aralığını gerektirir. Sıradan lenslerin böyle bir aralıkta yakınlaştırma yapması zordur, özellikle lensin boyutunun çok fazla sınırlaması olduğundan, böceklerin doğada bu tür gözleri doğal olarak evrimleştirmesinin nedeni budur.

Bugün, basitçe bir lens veya sensör dizisi olan bu görüntüleme moduna Plenoptics diyoruz. Bu tür bir dizinin özelliği, bir düzlemde daha büyük bir ışık alanını kabul edebilmesi ve ardından yönü ve diğer bilgiler dahil olmak üzere ışık dağılımını yakalayabilmesidir. Kare, dört boyutlu, optik bir temsildir.Işık alanı elde edildikten sonra, farklı görüntüleme yöntemlerinin sonuçları algoritmalar ile hesaplanabilir. Bugün bu teknoloji, bazı ilginç ürünler yapmak için zaten mevcut.

Örneğin Amerika California'da bir firma var, onların ışık alanı prensibine dayalı bir kamerası var, fotoğraf çekerken direkt fotoğraf çekebilirsiniz. Ancak eve döndüğünüzde fotoğrafa yeniden odaklanabilirsiniz, yani önce fotoğrafı çekebilir ve ardından odağını ayarlayabilirsiniz.

Bugün çok geniş, dinamik bir yakınlaştırma aralığı elde etmenin en verimli yolunun bir ışık alan kamerası yapmak olduğunu göreceğiz. Ve böceklerin bileşik gözleri, çok harika bir fenomen olan çok hassas ışık alanı kameralarıdır.

Şimdi yüz tanımanın tartışıldığı bir örneğe bakalım.

Bu resmin sol üst köşesinde, 15 Nisan 2013'te Boston'da yaşanan terör maratonunda yaşanan terör olayı var.Olayın ardından polis, güvenlik kamerasından çekilmiş olduğu belli olan bu fotoğrafı ele geçirdi. Bu fotoğrafta iki şüpheli kameradan çok uzakta değil, öndeki kişi kameradan iki üç metre, arkadaki kişi ise muhtemelen beş altı metre uzaklıkta. Ancak bu kadar yakın mesafeden ikisinin yüzlerinin net olarak görülemeyeceğini gördük.

Daha sonra ABD polisi kitle kaynak kullanımı yöntemlerini kullanarak ipuçlarını bulmuştur ve bu fotoğrafı televizyonda yayınlamıştır.36 saat içinde çok sayıda maraton seyircisi kameralarıyla çok sayıda fotoğraf çekmiş ve bu fotoğrafların bir kısmı şüphelinin eline geçmiştir. Ekranın sağ üst ve sol alt köşesinde turistlerin daha sonra polise verdiği fotoğraflar yer alıyor. Sol alttaki fotoğraf çok yardımcı oluyor, çünkü bu iki fotoğraf yan yana duran ve kameraya bakan iki şüpheliye ait.

Bu fotoğrafa göre ikisi başarılı bir şekilde rapor edildi.Sağ alttaki üç fotoğraf iki kişinin hayat fotoğrafları.Bu ipucuna göre iki kişi sonunda yakalandı.

Bu süreçte, böyle bir fenomen keşfettik. Bugün yüz tanımanın çoğu hala süngü yüz tanımadır.Örneğin, bu şeyi metro çıkışına, alışveriş merkezinin girişine vb. koydum çünkü insanlar bu yerlerden geçmek zorunda ve sizin de görülmeniz gerekiyor. kamera tarafından. Ama gerçek şu ki, bir suçlu olduğunuzu varsayarsak, size çok yakın bir kamera görürseniz, muhtemelen buradan geçmiyor demektir ya da kamera sizi görmesin diye bilerek başınızı eğeceksiniz. yüz.

Aslında yüz tanıma uygulaması kişinin tamamen işbirliği yapmadığı ve yakınlarda bir kamera olduğunu fark edemediği bir sahnede gerçekleşmelidir. Yakınlarda kameralar olduğunu bilmediğinde yakalanma olasılığı yüksektir. Bu nedenle Geling Shentong tarafından geliştirilen insan gözü kamera ürünleri esas olarak bu hedefe ulaşmak içindir ve şu anda tanıyabildiğimiz mesafe 50'ye ulaşabilir. Kendimiz bir deney yaptık, tek bir yerde dururken ve etrafınızdaki 50 metre içinde kamera olmadığından emin olmak istediğinizde, bu daha zor bir şey çünkü alan nispeten geniş.

3. İnsan gözünün prensibinden kameraya ilham

Bu bir ofis otoparkı örneğidir.Green Eyes'ın insan gözü kamerası dinamik yüz tanıma motorumuzla kenetlendiğinde, yüz yakalanacaktır.

En uzak mesafe 50 metre olabilir ve bazıları yirmi veya otuz metre olabilir ve ardından yüzleri gerçek zamanlı olarak çalışan fotoğraf kitaplığı ile karşılaştırılır.

İnsan gözü kamerasının prensibi aslında memeli göz küresinin çalışma prensibine çok benziyor.İnsanlar dünyayı çıplak gözle gördüklerinde daha uzağı görebilirler. Araba kullanırken çok özel bir fenomen keşfettim.Muhtemelen bulabilirim. En azından yaklaşık 30 metre ila 50 metre ilerideki plaka numarasını görebilir. Ancak bir araç kamerası taktığımda, öndeki araba benden sekiz ila on metre uzaktayken, ekranda plaka numarasını göremediğimi görmek için videoyu ayarladığımı fark ettim.

Peki bunun anlamı nedir? İnsan gözünün çözünürlüğü gerçekten yüksek çözünürlüklü bir kameranın çözünürlüğünden çok daha mı yüksek? Değil, sadece insan gözümüzün retinasında makula adı verilen özel bir alan var.

Makula çok küçük, ne kadar büyük? Göz küresinin merkezini makulaya bağlarsanız, koninin açısı sadece yaklaşık 2,5 derecedir, ancak bu kadar küçük bir yerde, insan gözünün etkin piksellerinin %75'i yoğunlaşır ve kalan %25'i yoğunlaşır. pikseller 160 derecelik görüş alanı boyunca dağılır. Bir kişinin monoküler görüş alanı 160 derecedir, Dünyanın gözlemi, geniş görüş alanına sahip ancak çözünürlüğü düşük bir dikkat algılama sistemi ile görüş alanı küçük ancak yüksek çözünürlüklü bir makula sistemi birlikte çalışarak gerçekleştirilir.

Okuduğumuzda, metnin her satırını sürekli olarak tararız ve araba sürdüğümüzde göz kürelerimiz farklı hedeflere geçer, gözler bu şekilde çalışır. İnsan gözünün bir diğer önemli özelliği de optik sistemi ile tanıma sisteminin yakından entegre olması ve birbirini geri beslemesidir. Bölünmüş bir saniye için gözün köşesinden bir nesneyi fark ediyoruz ve bunun önemli olduğunu düşünürsek, beyin gözü yuvarlamaya yönlendirerek makulamızın nesneye hızla odaklanmasını sağlar.

Bu geri bildirim gözleri çok hassas hale getirir.İnsan gözü kamerası, optik sistemin ve insanların algılanmasının yanı sıra yüz tanıma sisteminin bağlantısını ve geri bildirimini gerçekleştirir. Doğanın bakış açısından, insan gözüyle aynı şekilde çalışan bir cihaz icat ettik.

Bugün bunu paylaşıyorum, hepinize teşekkür ederim.

Lei Feng.com'dan not: Metin kısmı, Zhao Yong'un açıklamasının temel içeriğidir.Ayrıca, çok heyecan verici ve videoda izlenebilecek birçok Soru-Cevap içeriği (Soru-Cevap oturumunda 30 dakika) vardır.

Aman tanrım! Ne tür bir peri dizisi bu! Netflix'in yeni sinema oyuncusu onaylandı!
önceki
Samsung S10 umutsuz 5G'yi piyasaya sürdü, katlanır ekranlı telefon Samsung'un "katili" oldu
Sonraki
2018 Apple Tasarım Ödülü çıktı! Bu en iyi 10 uygulamayı kullandınız mı?
Ispanak yiyen Popeye bu yıl 90 yaşında! iyi ki doğdun!
İOS 12'ye başlarken: Değişiklik yok, genellikle en iyisi
Hayatı boyunca "ölü insanlar" hikayeleri yazdı ve sonunda bir dizi daha yaptı ...
10 animasyon önerin, hepsi klasik, kaç tane izlediniz?
Zhou Zhou Jiqing: Cep telefonu endüstrisi Oscarları açıklandı, Samsung katlanır ekranlı cep telefonu ortaya çıktı
Douban 9.4'ten Xiaofan "Büyük Sağlık" süper havalı!
iOS 12 yayınlandı: iPhone "bağımlılıkla mücadele sistemini" ekledi ve ayrıca ifadeleri sıkıştırabilir!
Bugünün Toutiao'nun küçük programı çok büyük
Tencent, yeni bir B istasyonu inşa etmek için iki boyutlu Bodong Planet uygulamasını başlattı! Hırs biraz değil
Facebook'un AI Sırrı: AI nasıl bu sosyal devin vazgeçilmez bir parçası haline geldi?
Almanya'dan 8 yüksek skorlu filmi tavsiye et, hepsi harika
To Top