Bir makinenin yüzleri tanımayı öğrenmesi ne kadar yararlıdır?

Giriş: "Kameraya bakın ve tekrar göz kırpın."

"Lütfen kameraya bakın ve tekrar göz kırpın."

Kameranın kayıt bilgilerinde kayıtlı kişi olup olmadığınızı belirlemesi yalnızca bir veya iki saniye sürer. Yanlışlıkla kameranın önünde sallasanız bile, akıllı bir lens sizi yine de tanıyacaktır. İnsanlarda sık sık meydana gelen "yüz körlüğüne" gelince - özellikle diğer ırklarla karşılaştıklarında, emin olun, çeşitli yüzlerin resimlerini makinenin veritabanına önceden koyduğunuz ve onu eğittiğiniz sürece, nadiren yanlış kişiyi tanıyacaktır. .

Makineye bu yeteneği veren veriler ve algoritmalardır - onbinlerce etiketli yüz fotoğrafı ve ayrıca insanların ona verdiği bilişsel yasalar veya on binlerce fotoğrafın tanınmasına dayanarak kendini özetlemektedir.

Veriler açısından, insanlar tarafından üretilen veriler katlanarak artıyor. IBM'in tahminine göre, geçmişten 2003'e kadar insanlar tarafından oluşturulan bilgi miktarı 5 EB'dir (Editörün notu: EB, bir bilgisayar depolama birimi olan Exabyte'ı ifade eder. Herkesin aşina olduğu daha küçük bir bilgi depolama birimiyle başlarsanız -1TB = 1024GB , 1PB = 1024TB ve 1EB = 1024PB), 2011 yılına kadar, insanlar her iki günde bir 5EB bilgi üretebilecek. 2018 itibariyle, insanların bu tür bilgileri üretmesi yalnızca bir saat kadar sürecektir.

Bilgi ve veri patlamasıyla karşı karşıya kalan teknoloji şirketleri önce geçmiş verileri saklama sorununu çözdü ve ardından mevcut yüksek düzeyde eşzamanlı veri işlemleriyle başa çıkma becerilerini geliştirdiler ve üçüncü adımda, biriken verileri nasıl kopyalayacaklarını düşünmeye başladılar. Kullanım-Veri toplama, iletme, depolama, hesaplama ve uygulama endüstriyel bir zincir olarak kabul ediliyorsa, hesaplama ve uygulama en değerli bağlantılardır.

Tencent'in yapay zeka ekibi, doktorun "kafasındaki" verilere bakıyor. Bazı eski doktorların, göstergeler olarak CT görüntülerine dayanarak hastalıkları yargılama konusundaki deneyimlerini ve deneyimsiz doktorların tıbbi görüntüleri yargılamasına ve teşhisin doğruluğunu iyileştirmesine yardımcı olabilecek eğitimli yapay zeka ürünlerini ölçtüler.

AutoNavi Haritalar gibi mobil harita uygulamaları, kullanıcılar yoldayken ve kullanıcının coğrafi konum bilgisine dayalı olarak, AutoNavi Harita verilerini gerçek zamanlı olarak kullanabilir, belirli bir yol bölümünde çoğu kullanıcının araç hızını analiz edebilir ve ardından hesaplayabilir O yolda trafik sıkışıklığı olup olmadığı.

Alibaba ortağı ve AutoNavi Map Başkanı Liu Zhenfei China Business News'e "Örneğin, bir yolun ön hızının saatte 40 kilometre olması gerekir. Aniden kullanıcıların hızının belirli bir aralıkta 0 olduğunu görüyorsunuz, bu da engellendiği anlamına geliyor." . "Buzdağı" grafiğini bir metafor olarak kullandı ve aslında iki yüksek Alman haritası olduğunu söyledi: biri cep telefonundaki yüksek Alman haritası ve araba, "bu herkesin gördüğü yüksek Alman haritası"; diğeri ise görünmez yüksek Alman haritası. Çin pazarında Toutiao, Meituan, Weibo ve çevrimiçi araç çağırma dahil 300.000'den fazla uygulama var ... Kullandıkları konumlandırma işlevlerinin tümü AutoNavi açık platformu tarafından sağlanmaktadır. Bu iki bölüm birlikte, büyük insan-kara ilişkisi büyük verilerini bütünleştirir. Trafik polis departmanının kaza alarmı verileri ve kullanıcılar tarafından aktif olarak paylaşılan yol koşulları ve olay verileriyle birleştiğinde, AutoNavi hangi sıkışıklığın araçların birikmesinden ve hangilerinin trafik kazalarından kaynaklandığını bile ayırt edebilir.

Liu Zhenfeinin ekibinin en son girişimi, tüm şehir için akıllı bir trafik ışığı sistemi açmak, çeşitli yönlerden toplanan gerçek zamanlı trafik verilerini birleştirmek ve trafik yönetimi departmanlarının daha dinamik ve akıllı bulut elde etmesine yardımcı olmak için bir dizi algoritma kullanmak üzere Kamu Güvenliği Bakanlığı Trafik Yönetimi Araştırma Enstitüsü ile işbirliği yapmaktır. Tüm trafik ışıklarını yerel olarak gönderin ve daha makul bir süre yapılandırın. Navigasyon için AutoNavi Map kullanan sürücüler, yol boyunca trafik ışıklarının gerçek zamanlı verilerini de alabilir, bu da hızı daha makul bir şekilde kontrol etmelerine ve kırmızı ışıklardan olabildiğince kaçınmalarına yardımcı olabilir.

Yukarıda bahsedilen akıllı trafik ışığı testi, Wuxi'de başarıyla test edildi. Ancak, bu iki boyutlu "canlı harita" harita şirketinin nihai hedefi değil. Liu Zhenfei, "Otopilotun gelecekte ihtiyaç duyduğu şey yüksek hassasiyetli bir haritadır. Bir şerit veya dört şeridi, belirli bir yerde bir korkuluğun ne kadar yüksek olduğunu, trafik ışıklarının nerede olduğunu ve yolun yanında iki ağaç olup olmadığını ayırt edebilmelidir." Dedi.

Harita şirketleri haritaları iki boyutludan üç boyutluya değiştirmeye çalıştıklarında, otomobil üreticileri de arabalarını sensörler ve kameralarla doldurmak istiyor.

SenseTime, otomobil şirketleri için görsel denetim çözümleri tedarikçilerinden biridir. Çevreleyen araba modellerini ve nesneleri tanımlamak için kamera tarafından iletilen video görüntülerini test ediyor ve nesnenin uzunluğuna ve lensler arasındaki mesafeye göre araçlar arasındaki mesafeyi hesaplayarak, otonom sürüş için karar verme için bir temel sağlıyor. Tanıma işlemini tamamlamak için on binlerce aracı ve insan yüzü gibi trafik işaretlerini de etiketledi.

SenseTime'ın kurucu ortağı ve başkan yardımcısı Yang Fan, China Business News'e verdiği demeçte, "İnsanların bilgi girişinin% 90'ından fazlası gözlerden geliyor. Görüntüler ve videolar, insanların dünyayla etkileşime girmesinin en büyük yoludur." Bilgi: Bilginin taşıyıcısı 0 ve 1'in ikili kodlarından sayılara, metne, sese, görüntülere ve videolara dönüştüğünde, veri ve bilgi taşıma biçimi giderek artan bir antropomorfik yönde, yani gelecekteki sosyal yaşamın iletişiminde gelişecektir. İnsanlara yönelik gereksinimler azalacak ve azalacak, ancak makinelere yönelik gereksinimler giderek artacak. 2014 yılında SenseTime'ın DeepID algoritması, makinenin yüz tanıma doğruluğunun ilk kez insan gözü tanıma oranını aşmasına izin verdi.

SenseTime'ın yüz tanıma teknolojisi, insansız süpermarketler için engelsiz bir alışveriş çözümü sağlar.

Tencent, AutoNavi ve SenseTime gibi teknoloji şirketleri makineye veri aktardığında, makinenin insanların düşünmesini "anlamaya" başlasın - kuralları versin veya kuralları özetleyip kognitif modeller (iki model) oluşturmasına izin verin İlgili teknolojilerin tümü "yapay zeka" olarak adlandırılır. Aslında, ikincisi daha doğru bir şekilde "makine zekası" olarak adlandırılır) ve verilerin uygulama senaryoları daha da genişletilmiştir.

İlk günlerde, İnternet şirketleri tarafından ele geçirilen bu kullanıcı ayak izleri yalnızca "hassas pazarlama" olarak adlandırılıyordu. Örneğin, bira satın aldıysanız, size çocuk bezi tavsiye etme olasılığı yüksektir veya küçük bir kasabadaki gençlerle ilgili bir haber okudunuz. , Bir sonraki okuma yazılımı, insan bilişsel modelindeki "uygunluğa" dayalı olarak atölyede bir işçinin yaşamıyla ilgili bir makale gönderecektir. Artık yeni veri uygulama senaryoları artık bu hazır "01" veri formlarıyla sınırlı değil. Fiziksel perakendeden nakliyeye, sürücüsüz, akıllı üretim, akıllı tıp, çevrimiçi oyunlar ve canlı yayınlara, henüz dijitalleştirilmemiş her geleneksel pazar Veriler konusunda da heyecanlanmaya başladı.

Ortaya çıkan bu senaryolarda, verilerin biçimi esas olarak ses ve görüntüdür ve verilerin üretimi (yani toplanması) ve uygulanması eşzamanlı olarak gerçekleştirilir. Örnek olarak insansız sürüşü ele alalım: Kameralar veya sensörler tarafından toplanan fiziksel dünya verileri insansız aracın bilgi işlem sistemine girdikten sonra, bir virajdan dönme veya virajdan kaçınma ihtiyacına dair kararlar derhal alınmalıdır. Geçmiş veriler, bu senaryolar için yalnızca eğitim makinesi modellemesi işlevine sahiptir.

Ortaya çıkan birçok senaryo var gibi görünüyor, ancak bu aşamada, bu pazar segmentlerindeki teknoloji şirketlerinin ticarileşme hızı çok etkileyici değil. Haziran 2018'de Cadillac, AutoNavi Haritaları ile işbirliği içinde akıllı bir sürüş sistemi yayınladı.AutoNavi Haritalar, navigasyonda ihtiyaç duyulan "yüksek hassasiyetli haritaları" sağlıyor. Bu sistem L3 seviyesine ulaşır - sürücü sürüş sırasında ellerini bırakabilir, ancak sürüş menzili 30 kilometrelik bir otoyolla sınırlıdır. Bu arabanın L3 eyaletinde Pekin ve Şangay gibi metropollere gitmesini istiyorsanız, birkaç yıl daha beklemeniz gerekecek, çünkü yol koşulları daha karmaşık hale geldikçe, yüksek hassasiyetli haritalar yapmanın maliyeti ve zorluğu hızla artıyor ve onu başlatmanız gerekebilir. uydu. Yüksek hassasiyetli haritaların mevcut çizimi hala erken deney aşamasındadır.

Google tarafından 2 Ocak 2019'da onaylanan radar tabanlı bir hareket algılama cihazı olan Soli sensörü de aynı sorunla karşı karşıyadır.Soli sensörü, üç boyutlu uzaydaki hareketleri yakalamak için radar ışınlarını kullanarak kullanıcıların başparmağının ve işaret parmağının ucuna basmasına olanak tanıyor. Sanal kadranı tamamlamak için klavyedeki sanal düğmeler veya başparmak ve işaret parmağı arasındaki sürtünme yoluyla.

Teknik bir geçmişe sahip olan Liu Zhenfei, hesaplama gücünün büyük ölçüde iyileştirilmesine ve makine ve ekipmanın giderek daha akıllı hale gelmesine rağmen, kavram ile gerçeklik arasındaki büyük boşlukla yüzleşmemiz gerektiğini söyledi: "Bir örnek veya kısmi bir gösteri yapabilirsiniz, ancak eğer Sizin kullanabileceğiniz, benim kullanabileceğim ve evdeki ebeveynlerin kullanabileceği bir şey yapmak büyük bir maliyete mal oluyor. Bu bir mühendislik teknolojisidir. Adım adım keşfediyoruz. "

Otonom sürüş söz konusu olduğunda, otonom sürüş kararları için anlamlı hale gelmeden önce tüm hesaplamalar milisaniyeler içinde tamamlanmalıdır. Bu sadece 5G'nin ticari kullanımına bağlı değil, aynı zamanda özellikli telefonlardan akıllı telefonlara kadar donanım devrimini tamamlamak için terminal ekipmanını gerektiriyor - sadece otomobil yeterince akıllı değil, yol yeterince akıllı olmalı. Gerçek durum, ulaşım departmanının kullandığı iç trafik ışıklarının ve kameraların çoğunun internete bağlı olmamasıdır. Hatta bazı trafik ışıklarının manuel olarak kontrol edilmesi bile gerekir.Her 30 saniyede veya 1 dakikada bir, sinyal ışıklarının yönetiminde uzmanlaşmış bir kişi değişecektir.

Tıbbi verilerin kullanıcı gizliliği ve tıbbi güvenlik sorunları, "Tencent Miying" gibi tıbbi görüntü tanıma ürünlerinin ticari bir tıbbi cihaz lisansı almasını engelledi. Yurtiçi ticari sigorta iyi gelişmediğinden, yerli imaj tanıma şirketleri teknolojileri için ödeme yapmaya istekli kimseyi bulamadılar.

Ticarileştirmenin zorluğuna göre Yang Fan, yapay zeka teknolojisi ile birleştirilen veri uygulama senaryolarını "baş senaryo" ve "uzun kuyruk senaryosu" olarak ikiye ayırıyor. Otonom sürüş, tıbbi görüntü tanıma ve akıllı şehir projelerinin tümü, onun görüşüne göre "baş" senaryoları olarak kabul edilebilir - bunlar aynı zamanda büyük şirketlerin yapay zeka alanındaki yatırımlarının homojenliğinin ana nedenlerinden biridir. Ve aslında "uzun kuyruk" kısmında daha fazla sahne var.

Veri kaynağı: Kamuya açık bilgilere göre

"İlk yıllarda, Endüstri 4.0 için görsel tanımanın kullanımı konusunda iyimserdik, ancak daha sonra bu alanın başlangıçta düşündüğümüz kadar iyi olmadığını keşfettik. Temel neden, içindeki sahnelerin özel olarak alt bölümlere ayrılmasıdır. Her üretim hattının karşılaştığı sorunlar geniş anlamda konuşulabilir. Buna 'video analizi' denir, ancak her algoritmanın farklı problemleri çözmesi gerekir. "Yang Fan, her bölümleme sahnesi için bir algoritma geliştirilecekse, öncülün sahnenin optimizasyonunun getirdiği ticari getiri olması gerektiğini açıkladı. , Teknoloji maliyetlerini destekleyebilmek. Bu nedenle, yalnızca derin öğrenme eğitim sistemini sürekli olarak yükselterek, algoritma üretim bağlantılarının standardizasyonunu ilerleterek, farklı senaryolarda teknik engelleri aşarak ve ürün geliştirme maliyetlerini düşürerek, teknoloji daha parçalı, küçük ve kişiselleştirilmiş "uzun kuyruk" senaryolarına girme fırsatına sahip olabilir mi? .

Belirli bir şehrin güvenlik departmanı bir zamanlar nehir kenarına bir kamera kurmayı önerdi, böylece biri nehre atladığında otomatik olarak alarm verebilsin. Bu konu teknik olarak uygulanabilir. Buradaki zorluk, göle atlayan en az on binlerce insan görüntüsünün - Yang Fan'ın deneyimine göre, "on bin" verinin, bir göl atlama istemi algoritmasını eğitmek için eğitim makinesinin temelini oluşturması ve Bu algoritma "göle atlamak için sadece belirli bir yere adapte olabilir ve başka bir yere geçmek işe yaramaz." Bu aşırı bir senaryo gerekliliğidir, ancak aynı zamanda veri üretme sürecinin yetersiz yerel veri sorunuyla karşılaşacağını da yansıtır.

Simülasyon eğitimi, yerel veri eksikliğini çözmenin bir yoludur. SenseTime, şehir kameraları yönetmeliklere aykırı olarak şehre giren çöp kamyonlarını yakaladığında gerçek zamanlı alarmları hemen tetikleme işlevini gerçekleştirmek için gerçek pislik kamyonlarının etiketleme verileri ve videolara çöp kamyonlarının görüntülerini yerleştirme simülasyon eğitimi gibi teknolojileri kullanır.

Google Cloud'un eski yapay zeka bilimcisi ve Stanford Üniversitesi'nde bir profesör olan Li Feifei, bir zamanlar bir ekibe bir yaşlı bakım ürünü geliştirmesi için liderlik ettiğinden bahsetmişti - makine yaşlılar düştüğünde alarm verebilir. Ancak bu işlevi gerçekleştirmek için ön koşul, düşen yaşlıların on binlerce davranışsal video verisine sahip olmaktır. Sonunda, insanların yere düşen yaşlı bir adamı simüle etmelerine izin vererek sorunu çözdüler. Silikon Vadisi'nde analog veri üretiminde uzmanlaşmış bazı kuruluşlar da doğdu.

Simüle edilmiş veriler, yetersiz veri sorununu çözebilir, ancak yine de veri çeşitliliği sorunuyla karşı karşıyadır. Birçok sahnenin orijinal verileri en temel çeşitlilik kapsamını garanti edemiyorsa, bunu simüle etmenin bir yolu yoktur. Yang Fan, "Ne tür bir insanın nehre atladığını simüle etmek gerçekte nehre atlıyor ve neyin yanlış? Simüle ettiğiniz şeyler yeterince gerçek değilse, makinenin ne öğreneceğini bilmiyorsunuz." Yang Fan, karmaşıklığı bu şekilde açıkladı.

Veriler yalnızca bir varlık değil, aynı zamanda bir kaynaktır. Ticari değer açısından, yalnızca kullanıcı merkezli veri yapımı gerçekleştirilebilir en büyük değeri elde edebilir. AutoNavi Maps'in ana şirketi olan Alibaba şu anda üç veri havuzuna sahiptir: Taobao, Alipay ve AutoNavi Maps, bunlar sırasıyla insanlar ve mallar, insanlar ve varlıklar ve insanlar ve konum anlamına gelir. Bu üç tür veri birbirine bağlanırsa, Alibaba'nın yapabileceği iş, AutoNavi'nin Hema Xiansheng'in en iyi mağazayı nerede açacağına karar vermesine yardımcı olmasına izin vermekle kalmayacak, gerçek çevrimiçi ve çevrimdışı bağlantıyı da gerçekleştirecektir. Ancak Alibaba, üçü arasındaki temel verilere henüz ulaşmadı. Çünkü bir teknoloji şirketi olarak iş verimliliği ve veri güvenliği konularını dikkate almalıyız. Veri güvenliği, büyük ölçüde, kullanıcıların kişisel mahremiyetinin korunması anlamına gelir.

Liu Zhenfei, gerçek fiziksel dünyayı geri yükleyen "yüksek hassasiyetli bir harita" geliştirmekten heyecan duyarken, aynı zamanda şunu da düşünüyor: Veriler tüm sorunları çözebilir mi?

2016 yılında ekibi ve Kamu Güvenliği Bakanlığı, kayıp çocukları bulmak için bir yardım projesi üzerinde işbirliği yaptı. Tüm süreç boyunca kameralar ve yüz tanıma kullanılmadı, bunun yerine, AutoNavi'nin konumlandırma yetenekleri ve DingTalk, kamu güvenliği kaçırma sisteminde özellikle sorumlu olan (çocukları arayan) 6.000'den fazla polis memuru için işbirliğine dayalı bir ofis eklentisi geliştirdi. Bir çocuk kaybolduğunda, yerel polis, izleme bilgilerini göndermek için DingTalk'u kullanacaktır.AutoNavi'nin coğrafi sınırlama ve konuma dayalı itme (LBP) teknolojisi ve arayüzünün yardımıyla, mesaj doğrudan belirlenen alandaki AutoNavi kullanıcılarına gönderilecektir. Bir kullanıcı gönüllü olarak ipucu verdiğinde, doğrulamadan tam zamanlı polis sorumlu olacaktır - bu arama yöntemi geleneksel süreçten farklı değildir, ancak verimlilik büyük ölçüde geliştirilmiştir. "Reunion" adlı proje, iki yıl içinde 3.419 çocuğun eksik bilgilerini yayınladı ve iyileşme oranı% 98.4'e kadar yükseldi.

"Daha sonra kayıp yaşlıları bulmak için başka bir proje yapmak istedik. Çok zordu. Bu bir teknoloji ve para sorunu değil, bu konuyu yönetecek net devlet dairelerinin eksikliği idi. Şu anda, çocuk arayan yaşlıları bulmak için tam zamanlı bir ekip yok. "Bu olay Liu Zhenfei'nin tüm sorunların teknolojiyle çözülemeyeceğini anlamasını sağladı." Başlangıçta, tren istasyonlarına ve otobüs istasyonlarına kamera yerleştirmeyi de düşündük, ancak daha sonra teknolojinin tek başına yeterli olmadığını keşfettik. Yani evet, O zaman, teknolojinin yeteneklerini ideal olarak abartmamalıyız. "

Wei Shen Huya'nın canlı kamerasının çoğu zaman açılmamasının nedeni, gerçek üzücü
önceki
Fan Bingbing'in merkez noktasını taramaya ne dersiniz?
Sonraki
"Kingdom Hearts 3" on temalı anahtar bıçak tasarımını resmen duyurdu
Google, güçlü bir bulut oyun platformu olan Stadia'yı duyurdu! 3A şaheser, saniyeler içinde çevrimiçi olarak oynanabilir ve ayrıca eklentileri de önleyebilir!
Yelek hattı planı, belinizdeki yağları yok etmenize yardımcı olacak 7 hareket!
Charmaine Sheh gerçekten zayıf, omuzları eğimli ve beli çekici, dar etek giymiş Netizen: 78 kilo alabilir misin?
PlayerUnknown's Battlegrounds bir çöl haritası fırlattı ve seyircinin gözü kör oldu!
Kadınlar genellikle böyle uzanır ve yelek hattını zorlamak için yağ yakmaya zorlar! İnce bir bel!
Podyum | Wang Ziwen botlarda hiç de kısa görünmüyor. Küçük kızların onları giymesi gerçekten bu kadar zor mu?
Dünya çapında 10 setle sınırlı "Metro: Escape" "Master Edition" duyuruldu
Kedi aşığı Ali, Mao Mao alışveriş merkezini daha fazla işletmek istiyor, Pin Mao'dan farkı nedir?
"Koi Tanrısı" Yang Chaoyue kırmızı bir sweatshirt içinde iki örgü takmıştı, ilk aşk yüzü güzeldi.
Yelek serisini çalışmak istiyorsanız, bir kadının en iyisi her gün 9 çeşit yemek yemektir!
Gerçek çekiç yine burada! Bu sefer toplam 14 çapa yer aldı!
To Top