Dijital retina evriminin kısa bir tarihi

Yazar | Jia Wei

Düzenle | Kongun Sonu

Akademik alana öncülük eden bir bilim adamının en dikkat çekici işaretlerinden biri, belirli bir akademik kavramın bilim adamıyla eşitlenebileceğidir.Örneğin, görelilik teorisinden bahsedildiğinde, Einstein ile ilişkilendirilmesi kaçınılmazdır.

Aynı şekilde, "dijital retina" kavramı dendiğinde, insanların aklına gelen ilk şey Çin Mühendislik Akademisi akademisyeni Gao Wen'dir.

Sözde dijital retina, insan retinasına benzer, geleneksel kamerayı ve hatta görsel bilgi işlem mimarisini geliştirip yeniler, böylece kentsel beyni daha akıllıca destekleyebilir ve akıllı güvenlik ve kentsel ince yönetim gibi akıllı uygulamalara hizmet edebilir.

Daha spesifik olarak, geleneksel kamera yalnızca yakalanan video verilerini sıkıştırır ve depolama için buluta yükler ve ardından analiz ve tanıma işlemi gerçekleştirir; dijital retina ise yüksek kaliteli video kodlama ve kamera tarafında yakalanan videonun görsel özellik çıkarımını gerektirir. Kodlama, sıkıştırılmış ve kodlanmış video akışları yerel olarak depolanır ve talep üzerine buluta yüklenirken, tüm kompakt özellik akışları, verimli depolama sağlamak ve büyük veri sorgulama ve analizini kolayca desteklemek için gerçek zamanlı olarak buluta senkronize edilir. Aynı zamanda, uç-uç bulut arasında akıllı video kodlama ve özellik analizi için uyarlanabilir geçiş, sıkıştırma, güncelleme ve derin öğrenme modellerinin dönüştürülmesini destekler. Kısacası, Digital Retina, bir video kodlama akışı, bir özellik kodlama akışı ve bir model güncelleme akışı içeren ölçeklenebilir bir uçtan-uca bulut işbirliğine dayalı görsel hesaplama mimarisidir.

Geleneksel görsel algılama sistemi

Dijital Retina Teknoloji Sistem Çerçevesi

Bu konseptin resmi olarak ortaya konulmasının üzerinden sadece iki yıl geçti, ancak ilk konsept, ön uygulama ve teorik temelin inşası yaklaşık beş yıl sürdü. Şu anda bile, Data Retina'nın teknik çerçevesi hala geliştiriliyor, ancak etkisi yıkıcı olacak. Akademisyen Gao Wen'in 2018'de bir makalede bahsettiği gibi:

Çin, "2020 yılına kadar, temelde tam etki alanı kapsama, tam ağ paylaşımı, tam zamanlı kullanılabilirlik ve tam süreçle kontrol edilebilir kamu güvenliği video gözetimi için ağ bağlantılı uygulamaların yapımını gerçekleştirin", ancak büyük teknolojik gelişmeler olmadan on milyonlarca kameranın mümkün olmayacağını açıkça öne sürdü. " Tüm ağ tarafından paylaşılan gerçek zamanlı verilerin toplanması, "tam zamanlı kullanılabilirlik" ağ analizi ve tanımlamasını gerçekleştirmeyi imkansız kılar. "Büyük veri" "büyük veri" olamaz ve büyük potansiyel değer keşfedilemez. Dijital retina, yukarıdaki zorlukların üstesinden gelmek için uygulanabilir ve yıkıcı bir teknoloji geliştirme yönüdür.

1. Prototip mayalama

Akademisyen Gao Wen'in "dijital retina" anlayışı, şehirlerdeki video gözetim sisteminin sorunlarının derinlemesine anlaşılmasıyla birlikte sürekli olarak derinleştirildi.

Mevcut verilere göre, Akademisyen Gao Wen ilk olarak 2013'ün başlarında (veya daha önce) şehirlerdeki kameraların kusurları ve olası iyileştirmeleri hakkında düşündü. 2013 yılında yeni yılın başında, People's Daily Online ile röportaj yapan Akademisyen Gao Wen, modern kameraların yoğun nüfuslu olduğunu ancak yine de onlara göz kulak olmak için arka uç insan gücüne ihtiyaç duyduklarından bahsetti. Büyük bir durumla karşılaşıldığında, video materyallerinin kullanımı çoğu zaman çok etkili olmuyor. . Sistem, video kodlamayı tasarlarken verilerdeki yararlı bilgileri çıkarabilir, çıkarabilir ve analiz edebilirse, yalnızca sonraki aşamada işgücü girdisini kaydetmekle kalmaz, aynı zamanda acil bir rol oynar.

Şu anda, zaten belirsiz bir kavramı olduğu düşünülebilir, ancak hala nasıl yapılacağı konusunda mayalanmaktadır.

Ekim 2013'te Akademisyen Gao Wen China Information Weekly'de "Akıllı Şehirlerde Video Kodlama, Analiz ve Değerlendirme" başlıklı bir makale yayınladı. Bu makalede, ilk kez "akıllı şehirlerde" video gözetiminin sorunları üzerine derinlemesine düşünmesini sistematik olarak sundu ve şunları belirtti:

1. Mevcut gözetim sistemi, bilgisayar merkezli otomatik analiz yerine video depolama ve insan merkezli video izleme için tasarlanmıştır.Bu nedenle, otomatik analiz için akıllı bir şehir video sistemini gerçekleştirmek için böyle bir sisteme güvenerek, Hiç yapılamaz.

2. Akıllı şehirlerdeki video teknolojisi üç büyük sorunla karşı karşıyadır: yüksek depolama maliyetleri (çok fazla veri), zor erişim ve zor nesne tanımlama. Bu üç problem özünde iki probleme indirgiyor, biri kodlama problemi, diğeri ise video analizi ve tanıma problemi. Bu nedenle, gözetim videolarında verimli video kodlamanın nasıl yapılacağı ve bunların nasıl analiz edileceği ve alınacağı, dikkate alınması gereken iki önemli konudur.

3. Akademi dünyasında video kodlama yapan akademisyenlerin video analiziyle ilgilenmediği, aksine video analizi yapanların da kodlamaya ilgi göstermediği garip bir olgu var. Bunun nedeni, ilkinin görüntü işleme alanına ait pikseller ve görüntü blokları ile ilgilenirken, ikincisinin model tanıma alanına ait görüntü özellikleriyle ilgilenmesidir. Yolda çalışan iki araba gibi buluşmak da zor.

Neyse ki, Akademisyen Gao Wen bu iki çemberi aşıyor: İster video kodlama alanında ister bilgisayarla görme (özellikle yüz tanıma) alanında önemli bir etkiye sahip. Öğrencileri Chen Xilin ve Shan Shiguang, yüz tanıma alanındaki örtüsünü miras aldılar ve şimdi bilgisayarla görme alanında uluslararası liderler oldular; öğrencileri, Profesör Huang Tiejun ve Ma Siwei, kodlama alanındaki örtüsünü miras aldılar. Ayrıca uluslararası video kodlama alanında da önemli bir etkiye sahiptir.

Akademisyen Gao Wen'in çağdaş kentsel izleme sistemlerindeki sorunların doğasına ilişkin analizi, yalnızca ilkel bir biçim olmasına rağmen, bu sorunu çözmek için sonraki araştırma fikirlerinin ve yönergelerinin temelini attı. Özellikle 2014'teki "Akıllı Şehirler ve Akıllı Sistemler İkinci Akademisyen Forumu" nda, "kodlama ve analiz teknolojilerini bir araya getirmeyi ve bir kodlama çerçevesinde konsantre olmayı umuyoruz" dedi.

Bununla birlikte, genel yöne rağmen, derin öğrenmeyle temsil edilen yeni nesil yapay zeka ortaya çıktığı için, birçok kişi henüz derin öğrenmeye aşina değil ve o zamanki algoritmalar ve hesaplama gücü bu tasarlanan teknolojiyi desteklemek için yeterli değildi. . Elbette, bu sorunun analizi ve çözümünde Akademisyen Gao Wen'in derin öğrenme ve video kodlamanın nasıl entegre edileceği konusunda derin bir fikre sahip olmadığı da mevcut bilgilerden görülebilir. "Derinlemesine öğrenme" modelinde düşünmek.

2. Biyonik: Dijital Retina

Zaman uçuyor ve 2016. Yapay zekanın gelişmesiyle birlikte bilgisayar görüşü müreffeh hale geldi. Bilgisayarla görme teknolojisine dayalı çok sayıda start-up şirketi birbiri ardına kuruldu ve geleneksel güvenlik şirketleri yavaş yavaş dönüştü. Kentsel güvenlik, sermaye rekabeti için büyük bir pazar haline geldi Akademisyen Gao Wen, kentsel video gözetlemenin üç ana sorunundan bahsetti (yüksek depolama maliyeti, erişimde zorluk ve nesneleri yeniden tanımlamadaki zorluk).

Bu yıllar boyunca Akademisyen Gao Wen yavaş yavaş orijinal çerçeveyi zenginleştirdi, ancak bu konsepti uygulamak istiyorsanız özel senaryolara ihtiyacınız var, sonuçta bu ana gövde olarak mühendislik ile yapılan bir araştırmadır. Sonraki bir makalede bahsettiği gibi:

"Dijital retina mimarisinin teknik avantajlarını değerlendirmek ve göstermek için büyük ölçekli bir test platformu kurmak gerekiyor. Bu platform en az on binlerce gözetleme kamerası içermeli ve coğrafi olarak orta büyüklükteki bir şehri veya üstünü kapsamalıdır, böylece dijital retina gerçek senaryolarda değerlendirilebilir. Algoritmalar ve teknolojiler. "

Tesadüfen, 2016 yılında Wang Jian liderliğindeki Alibaba Cloud, Hangzhou'da kentsel beyinlerin inşasına pilotluk yapmaya başladı. Bu, Akademisyen Gao Wen'nin araştırma ihtiyaçları ile uyumludur, bu yüzden Wang Jian ve diğerleri ile bağlantılıdır. Daha iyi işbirliği yapabilmek için Temmuz 2017'de Akademisyen Gao Wen'nin eski öğrenci ekibi, "Boya Hongtu" adlı bir şirket kurdu ("Boya" Pekin Üniversitesi'nin "Boya Kulesi" nden, "Hongtu" yüksek vizyon anlamına geliyordu). Yönetim kurulu başkanı Akademisyen Gao Wen olan şirket, dijital ses ve video kodlayıcı (AVS) ulusal standardı ve görsel özellik kodlaması (CDVS) uluslararası standardı konusunda Pekin Üniversitesi Ulusal Dijital Video Kodlama ve Kod Çözme Teknolojisi Laboratuvarı'nın teknolojisine, standartlarına, yeteneklerine ve yeteneklerine güveniyor. Görsel akıllı yongaların ve sistem çözümlerinin Ar-Ge ve sanayileşmesine adanmış sanayileşme avantajı.

Bu dönemde Akademisyen Gao Wen, çerçevesini daha geniş bir kapsamdan düşünerek kodlama ve bilgisayar görüşü alanlarından çıkmaya başladı. Bunun bir tezahürü, Haziran 2017'de düzenlenen Turing Konferansı'nda Akademisyen Gao Wen'in "Yapay Görsel Sistemin Evrimi" üzerine bir rapor vermesidir.

Akademisyen Gao Wen, 2017 Turing Konferansı'nda bir rapor hazırladı (Kaynak: Tencent Videodan Ekran Görüntüsü)

Bu raporda, ilk kez hayvan görüşünün evrimini ve insanların ondan öğrenmesi gereken, esasen "biyonik" olan modeli önerdi. Ancak raporda sadece bir benzetme yapmış, "veri retina" kavramını öne sürmemiş olmasına rağmen, temel çerçeve zaten çok tamamlanmıştır.

Dijital retina kavramı ilk olarak Ekim 2017'de Shenzhen'de düzenlenen An Expo'da ortaya atıldı.

Bu raporda ayrıca geleneksel görsel algılama sistemindeki gözetleme kamerasının 1-1 modu olduğuna dikkat çekti: tek kamera, tek akış, tek amaçlı. Bu mod, uzun bir süre boyunca doğal olarak oluşur ve verimli değildir: (1) Sıkıştırma-açma ve analiz süreci uzun gecikmelere neden olur; (2) Nesne algılama, desen tanıma ve sahne anlayışının doğruluğu düşüktür; (3) Düşük kullanım oranı Mevcut izleme sistemi, verileri depolamak ve ardından çevrimdışı olarak manuel olarak kontrol etmek için tasarlanmıştır.Verilerin çoğu, kullanım ömrü boyunca her zaman işe yaramaz. Çağdaş akıllı şehirlerimizin tahammül edemeyeceği şeyler bunlar ve bu "gözleri" geliştirmemiz gerekiyor.

Bu raporda ayrıca ilk kez Digital Retina'nın üç temel teknolojisine dikkat çekti:

1. Arka plan modeline dayalı sahne video kodlaması. Mevcut gözetim kameraları tarafından benimsenen video kodlama teknolojisi standartları, gözetim video kodlaması için verimli değildir çünkü bu standartlar esas olarak yayın ve televizyon videosu için formüle edilmiştir. Gözetim sahnesinde, çoğu kamera sabittir ve arka plan nispeten değişmez Bu nedenle, arka plan tahmini, karşılık gelen fazlalık bilgileri ortadan kaldırmak için kullanılabilirse, kodlama verimliliği büyük ölçüde geliştirilecektir.

2. Video özelliklerinin kompakt ifadesi. Görsel temsil, görüntü ve video analizi ve işlemenin temelidir.Yapay tasarım özelliklerinin ve derin öğrenme özelliklerinin uyarlanabilir füzyon teknolojisi, çerçeve içi ve çerçeveler arası görsel kompakt gösterimi çıkarmak için kamera tarafında kullanılırsa ve ardından buluta iletilirse, arama verimliliği büyük ölçüde iyileştirilebilir. Deneyleri, kare başına ortalama yalnızca 100 bit gerektiğini ve sıkıştırılmamış özelliklere eşdeğer veya daha yüksek bir geri alma performansı elde edebileceğini göstermiştir.

3. Video kodlamanın ve özellik kodlamanın ortak optimizasyonu. Yukarıdaki iki tür veri bilgisi birbirinden bağımsız değildir, ancak birbiriyle ilişkilidir ve birbirini yönlendirebilir.Bu nedenle, Digital Retina aynı anda sıkıştırılmış video akışı ve kompakt özellik akışı çıktığında, kod akışının boyutuna göre hesaplama yapmak için ortak bir optimizasyon işlevi tasarlayabilir. Aşağıdaki şekilde gösterildiği gibi, analiz ve geri alma performansını korurken sıkıştırma gereksinimlerini daha da sağlamak için ilgili kod oranlarını nasıl tahsis edeceğiniz.

Şekilden, video kodlama performansını temelde değişmeden tutarken, özellik kodlamasının büyük ölçüde sıkıştırılabildiği görülebilir.

Akademisyen Gao Wen ayrıca dijital retinanın üç özelliğinden, yani yüksek performans, yüksek verimlilik ve ölçeklenebilirlikten bahsetti.

Bu raporda bahsetmeye değer iki nokta var. Birincisi, dijital retinanın yazılımla tanımlanabilir olduğunu, yani özellik öğrenme modelinin ve kamera parametrelerinin gerçek zamanlı olarak bulut merkezinden güncellenebileceğini (bu kavram daha sonra yükseltildi); ikincisi, mevcut kameraların çoğunun hala geleneksel kameralar olduğunu (ve Dijital olmayan retina kameraların gerçek durumunda), akıllı uç düğümlerine dayalı bir çözüm önerdi, yani zaten konuşlandırılmış kameraları değiştirmek yerine kenar yakınsama sunucusunda özellik çıkarımından sorumlu "retina" işlevini dağıttı.

"Digital Retina" nın tüm çerçevesi tamamlanmış ve gerçek pilot projeler Hangzhou, Shandong Wendeng, Chongqing ve diğer yerlerde yürütülmüş olsa da, ilgili çalışmanın ilk kez yayında resmi olarak yayımlandığı 2018 yılının başlarına kadar değildi.

2018'in başlarında, Pekin Üniversitesi'nden Profesör Tian Yonghong ve Alibaba CTO'su (2019'da Çin Mühendislik Akademisi'nden akademisyen olarak seçilen) Dr. Jian Wang, Akademisyen Gao Wen, "Chinese Science" dergisinde "Digital Retina: Wisdom" başlıklı bir makale yayınladı. Kentsel sistemlerin evrimindeki anahtar bağlantı.

Bu makale, "dijital retina" kavramını ilk kez tamamen, net ve titiz bir şekilde tanımlamaktadır:

Daha verimli bir kamerayı incelemek ve tasarlamak için "insan retinasının hem görüntü kodlaması hem de özellik kodlama işlevlerine sahiptir" biyolojik özelliklerinden nasıl öğrenileceği. Buna retinaya benzer bir kamera veya kısaca dijital retina diyoruz.

Digital Retina'nın özü, sıkıştırılmış video akışının depolama ve çevrimdışı görüntüleme için olduğu ve kompakt özellik akışının büyük veri analizi ve arama için olduğu "tek kamera ikili veri akışı" nda yatmaktadır.

Makale ayrıca son An Expo'daki raporun içeriğinin daha ayrıntılı bir tanımını verdi ve ayrıca ilk kez dijital retinanın karşılaması gereken beş koşulu ortaya koydu: (a) ağ boyunca tek bir zaman kullanın; (b) kesin coğrafi konumlar sağlayın ; (C) Video verilerinin verimli kodlama işlevini sağlayın; (d) Video verilerinin kompakt özellik ifadesini sağlayın; (e) Video kodlama ve özellik ifadesinin ortak optimizasyonunu destekleyin.

Gelecekte dijital retina araştırmalarının olası evrimsel rotasını göz önünde bulundurarak, Gao Wen ve arkadaşları bu makalede üç noktayı ortaya koymaktadır: (1) Standardizasyon Bu araştırma gerçek hayatta uygulanmaktadır ve farklı üreticiler ve şehirler arasında birleştirilmelidir. Standartlar; (2) Yazılım ve donanım açık kaynaktır.Bu tür temel projeler için, yazılım ve donanım açık kaynak olamıyorsa, ilgili teknoloji ve ürünler etkin bir şekilde geliştirilip uygulanamıyorsa; (3) Büyük ölçekli test yatağı, bu da Daha önce de bahsettiğimiz gibi, teorik araştırmanın aksine, dijital retinanın kendisi uygulama mühendisliğine karşı daha önyargılıdır, bu nedenle gelişimi desteklemek için gerçek senaryolarda test edilmelidir.

Yukarıdaki üç noktaya yanıt olarak, Akademisyen Gao Wen ve diğerleri, AVS2, MPEG CDVS ve uzantısı MPEG CDVA'yı aktif olarak tanıtmak gibi ilgili eylemleri de gerçekleştirdiler.

Ayrıca, Temmuz 2017'de Akademisyen Gao Wen, Akademisyen Pan Yunhe ve Profesör Huang Tiejun liderliğindeki "Yeni Nesil Yapay Zeka Endüstrisi Teknolojisi İnovasyon Stratejik İttifakı", yapay zeka için açık kaynak ve açık bir platformun kurulmasını aktif olarak destekledi. .

Alibaba Cloud ile Hangzhou'daki pilot projenin yanı sıra dijital retina mimarisinin teknik avantajlarını değerlendirmek ve göstermek için geniş ölçekli bir test platformu kurmaya çalışan Shenzhen, Mart 2018'de Akademisyen Gao Wen ile birlikte "Pengcheng Laboratuvarı" nı kurdu. Laboratuvarın müdürü böylece Shenzhen pilotunu açtı.

Bu nedenle, "Dijital Retina: Akıllı Şehir Sistemlerinin Evriminde Anahtar Bir Bağlantı" başlıklı makalenin yayınlanması ikonik bir öneme sahiptir ve aynı zamanda Akademisyen Gao Wen'in "dijital retina" tanımının resmen oluştuğu ve araştırma modelinin temelde oluşturulduğu anlamına gelir.

3. "shuangliu" dan "çoklu akış" a

Yukarıda gösterilen çerçeveye uygun olarak, Akademisyen Gao Wen liderliğindeki ekip (başkanı Boya Hongtu dahil), yazılımdan donanıma önden arkaya keşif ve tasarımı mükemmelleştiriyor.

Esasen, akıllı bir şehrin dijital retinası, elde edilen görsel verilerin verimli bir şekilde kodlanabilmesi ve kompakt özellik çıkarılabilmesi ve daha verimli ve esnek olması için şehir beynine (arka uç bulut) iletilebilmesi için kameraya gömülü bir çiptir. Arama ve analiz. Burada yer alan iki veri akışı vardır, bunlar video kodlu akış ve özellik kodlu akıştır.

Ancak bu mimari bir sorunu görmezden geliyor, yani dijital retina yongası özellik çıkarımı yaparken iyi bir derin öğrenme modeline güveniyor. Özellik çıkarımının doğruluğunu sağlamak için, kentsel beynin genellikle toplanan verileri öğrenmek, ilgili modeli eğitmek ve ardından öğrenilen modeli ön uç cihaza göndermek için kullanması gerekir. Bu nedenle, modellerin üretimi, kullanımı ve iletişimi, özellikle video verileri konum, zaman ve ortamda büyük ölçüde farklılık gösterdiğinde dijital retina için kritik öneme sahiptir. Bu nedenle, video kodlama akışı ve özellik kodlama akışına ek olarak, model kodlama akışı da çok önemli bir kısımdır.

Bu nedenle, dijital retina uygulamasının ve anlayışının derinleşmesi ile, yapısı "ikili akıştan" "çoklu akışa" değişmiştir: video kodlama akışı, özellik kodlama akışı ve model güncelleme akışı.

Akademisyen Gao Wen, bu kavrama yanıt olarak ilk olarak Kasım 2019'un sonunda Jinan, Shandong'da düzenlenen "2019 Dünya Yapay Zeka Yakınsama Geliştirme Konferansı" nda önerdi.

Ama aslında bu konudaki araştırmaları çoktan başladı.

Temmuz 2019'da Pekin Üniversitesi'nden Profesör Duan Lingyu'nun araştırma grubu, bilgisayar multimedya alanında uluslararası bir akademik konferans olan IEEE ICME'de "Akıllı Şehirlerde Dijital Retina'ya Doğru: Bir Model Üretimi" ni yayınladı. Kullanım ve İletişim Paradigması), bu makale ilk olarak uç taraf bulut ortamında modelin yeniden kullanımı ve iletiminin darboğazının üstesinden gelmek için işbirliğine dayalı bir video akışı, özellik akışı ve model akışı modu önermektedir. Bu makalenin aynı zamanda bu konferansın en iyi bildiri ödülünü de kazandığını belirtmekte fayda var.

Profesör Duan Lingyunun araştırma grubu, dijital retina araştırma ve uygulamasında, dijital retina hesaplama çerçevesi altındaki uç düğümlerin büyük miktarda temsil modelini ve etiketlenmemiş veriyi önbelleğe aldığını keşfetti. Bu amaçla araştırma grubu, daha fazla etki alanı uyarlanabilirliği ve ayrımcılığına sahip bir hedef model oluşturmak için uç düğümler tarafından önbelleğe alınan modelleri ve verileri etkin bir şekilde kullanan çok modelli bir yeniden kullanım mekanizması önerdi. Çoklu modelin yeniden kullanımı sürecinde model eğitiminin istikrarını hedefleyen makale, teorik kanıt ve analizler sunarak deneylerde geleneksel yöntemlerden daha iyi performans kazanımları elde etmiştir. Retina hesaplama çerçevesi altında, modellerin sık iletimi ve konuşlandırılması, daha fazla iletişim yükü getirecektir. Model güncelleme verimliliğini iyileştirmek için, modeller arasında yeni bir verimli iletişim problemi önerilmiş ve yeni bir diferansiyel model sıkıştırma yöntemi önerilmiştir Geleneksel tek model sıkıştırma yöntemi ile karşılaştırıldığında, model iletim hızı ek yükü etkili bir şekilde azaltılabilir. Bu tez, gelecekte dijital retinanın teorik araştırması ve uygulaması için yol gösterici bir öneme sahip olan, video akışı, özellik akışı ve model akışı etrafında kentsel görsel sistemde işbirliğine dayalı hesaplamanın yeni sorunlarını ortaya koymaktadır.

Ekim 2019'da Boya Hongtu tarafından geliştirilen ilk dijital retina çipi olan "Hongtu TMGV9531ESHI" başarıyla bantlandı. Aynı ay düzenlenen ikinci Yanqi Havacılık Forumu'nda Akademisyen Gao Wen çip hakkında ayrıntılı bir giriş yaptı.

Akademisyen Gao Wen, "2019 Dünya Yapay Zeka Yakınsama Geliştirme Konferansı" nda, "İlk dijital retina yongası çoktan yolda ve yakında piyasaya sürülecek. Bu yonga madeni para gibi küçük, ancak Az önce bahsettiğim üç temel özellik ve sekiz işlevin tümü dahil edildi. Gelecekte bu tür bir yonga, dijital retina uygulamasını desteklemek için çeşitli akıllı taşıma sistemlerine doğrudan girebilir. "

22 Kasım 2019'da ilk dijital retina çip lansman konferansı ve dijital retina ekolojik ortağının lansman töreni Hangzhou'da yapıldı ve resmi olarak "Hongxin Totem GV9531" olarak adlandırıldı ve tanıtıldı.

"Hongxin Totem GV9531", dijital retina teknoloji sistemini ve ilk AVS2 video kodlama çipini destekleyen ilk akıllı çiptir. Dijital retina teknolojisini tam olarak yorumlar ve küresel olarak birleşik uzay-zamansal kimliği, çok seviyeli retina gösterimini ve modelini destekler. Güncelleme ve yazılım tanımı, uçta dijital retina teknolojisinin enerji açısından verimli işlenmesini gerçekleştirir, yalnızca buluta giren gereksiz veri miktarını azaltmakla kalmaz, aynı zamanda dijital retina uç bulut sistemi görsel hesaplama çerçevesinin temel bilgi işlem gücü olan video veri işleme maliyetini de büyük ölçüde azaltır. Destekleyici platform, görsel uç hesaplama, çok akışlı akıllı işleme ve beyin ve gözün entegrasyonunu gerçekleştiren görsel bir hesaplama sistemi için vazgeçilmez bir anahtar bağlantıdır.

Ayrıca yeni yılda dijital retina araştırmalarında hangi yeni gelişmeler kaydedilecek? Daha da önemlisi, bu alanda, araştırmaya değer olan hangi yeni konuları araştırmacılara getirebilir? Yonga üreticilerine ve güvenlik üreticilerine hangi yeni iş fırsatları getirebilir?

Dört gözle beklediğimiz şey bu!

Bu makalenin yazımı, Çin Görüntü ve Grafik Derneği'nin ve Peking Üniversitesinden birçok öğretmenin desteğinden ayrılamaz.

AI Technology Review, Çin Görüntü ve Grafik Derneği'nin ev sahipliği yaptığı ve Sincan Üniversitesi tarafından üstlenilen 20. Ulusal Görüntü ve Grafik Konferansı'nın (NCIG 2020) 28-20 Haziran 2020'de Sincan, Urumçi'de yapılacağını öğrendi. Akademisyen Gao Wen özel bir konuk konuşmacı olacak ve bir kez daha bize dijital retina hakkındaki en son araştırma raporunu getirecek.Konferans, yerel görüntü grafikleri ve ilgili alanlarda önde gelen yetenekleri bir araya getirecek, alandaki güncel konulara odaklanacak ve çeşitli açılardan gelecekteki gelişim trendlerine ilişkin içgörüler elde edecek. 3 davetli konferans, 2 atölye çalışması, 4 forum, 5 yarışma, 1 mükemmel doktora forumu ve çok sayıda sergi. Çin'deki görüntü ve grafik alanında uzmanlar ve akademisyenler arasında işbirliği ve alışveriş için bir platformdur. Dört gözle beklemeye değer!

NCIG 2020 resmi web sitesi:

Akademisyen Gao Wen'e Giriş

Gao Wen, Pekin Üniversitesi Liberal Kürsüsü Profesörü. Harbin Bilim ve Teknoloji Üniversitesi'nden 1982 yılında lisans derecesi, 1985 yılında Harbin Teknoloji Enstitüsü'nden yüksek lisans derecesi ve 1988 yılında Harbin Teknoloji Enstitüsü'nden bilgisayar uygulamaları alanında doktora derecesi ve sırasıyla 1988 ve 1991 yıllarında Tokyo Üniversitesi'nden elektronik mühendisliği alanında doktora derecesi almıştır. 1991-1996 yılları arasında Harbin Institute of Technology'de çalıştı, 1996-2006 yılları arasında Çin Bilimler Akademisi Bilgisayar Teknolojisi Enstitüsü'nde çalıştı ve Şubat 2006'dan bu yana Peking Üniversitesi'nde çalıştı. IEEE Fellow, ACM Fellow, Çin Mühendislik Akademisi Akademisyeni. Araştırma alanları, video kodlama, video analizi, multimedya erişim, yüz tanıma, multimodal arayüzler ve sanal gerçeklik dahil olmak üzere multimedya ve bilgisayar vizyonudur. En sık alıntılanan çalışması model tabanlı video kodlama ve özellik tabanlı nesne anlatımıdır. Yedi kitap yayınladı ve 300'den fazla dergi makalesi ve 700'den fazla uluslararası konferans bildirisi yayımladı. Ulusal Bilim ve Teknoloji İlerleme Ödülü, Ulusal Teknoloji Buluş Ödülü ve Ulusal Doğa Bilimleri Ödülü gibi birçok akademik ödül kazandı.

Referans malzemeleri:

Digital Retina: A Key Link in the Evolution of Smart City Systems, Science in China: Information Science, Cilt 48, Sayı 8, 2018: 10761082

Akademisyen Gao Wen: Yüksek verimli video kodlama teknolojisinin parlak bir geleceği var, People's Daily Online (10 Ocak 2013),

Akıllı şehirlerde video kodlama, analiz ve değerlendirme, China Information Weekly (21 Ekim 2013), 005.

Akademisyen Gao Wen'nin kişisel ana sayfası,

Akıllı video gözetimi ile ilgili teknik zorluklar, China Information Weekly (22 Eylül 2014), baskı 005

Alibaba City Brain'in üç yılını yeniden oynatma (25 Ocak 2019), https://www.leiphone.com/news/201901/Pq1EAaIrVXM4mDMv.html

Pekin Üniversitesi'nden akademisyen Gao Wen önemli bir konuşma yaptı: Yapay zeka dijital retina çipleri neler yapabilir (7 Temmuz 2018),

Akademisyen Gao Wen'in Turing Konferansı'ndaki açılış raporu (8 Haziran 2017), https://v.qq.com/x/page/e0511e3veje.html?fr=v.hao123.com

Akademisyen Gao Wen tarafından yazılan 50 PPT, size kentsel beynin darboğazlarını ve büyük buluşlarını gösteriyor (15 Aralık 2017), https://www.leiphone.com/news/201711/esDVM34RTfN0mN67.html

Huang Tiejun ile röportaj: Ulusal yeni nesil yapay zeka geliştirme planı nın uygulanmasını misyonu alan stratejik ittifak ne yaptı ve sekiz ayda ne yaptı? (26 Mart 2018), https://www.leiphone.com/news/201803/UJuG5jWfsHxXe26M.html

Pengcheng Laboratuvarı başlangıç toplantısı yapıldı,

Çin Mühendislik Akademisi Akademisyeni Gao Wen: Dijital Retina Akıllı Ulaşımın Sorunlu Noktalarını Ortadan Kaldırıyor | Dünya Yapay Zeka Yakınsama Geliştirme Konferansı (20 Kasım 2019), https://www.leiphone.com/news/201911/q5Y20D2wqlFqXSHe.html

Akıllı Şehirlerde Dijital Retinaya Doğru: AModel Generation, Utilization and Communication Paradigm (31 Temmuz 2019), https://arxiv.org/abs/1907.13368

Bilgisayar Bilimi ve Teknolojisi Bölümünden Profesör Duan Lingyu, IEEE ICME 2019 En İyi Makale Ödülü'nü (2 Ağustos 2019) kazandı, https://eecs.pku.edu.cn/info/1023/9885.htm

Veriler yerel değilse, büyük veri eğitim modelinin keyfini çıkarmaya devam edebilirsiniz. Federe Öğrenme, geniş uygulama (11 Eylül 2019) ile yeni bir öğrenme paradigması sağlar, https://www.leiphone.com/news/201909/WOcl8I1TjMjXVJd5.html

NCIG 202020th National Conference on Image and Graphics,

Akıllı Şehir için AI Odaklı Büyük Ölçekli Video Yönetimi: Teknolojiler, Standartlar ve Ötesi (5 Aralık 2017), https://arxiv.org/pdf/1712.01432.pdf

Akademisyen Gao Wen: Kamerayı yıkmak için beyni kullanın, dijital retina bir sonraki duraktır (12 Eylül 2018),

Akademisyen Gao Wen tarafından önerilen "Dijital Retina" sisteminin analizi (8 Mayıs 2019), https://www.iyiou.com/p/99569.html

Statikten dinamiğe, son yıllarda kelime temsilinin gelişimi
önceki
Kuantum hesaplamayı başarmak için başka ne yapmamız gerekiyor?
Sonraki
Beyin dalgalarından metne kadar güçlü bir beyin-bilgisayar arayüzü, sadece bir makine çeviri modeline ihtiyaç vardır
CVPR 2020 | IR-Net: Bilgi saklama için ikili sinir ağı
Düşük güçlü bilgisayarla görme teknolojisinin sınırı, dört ana yön, daha küçük, daha hızlı ve daha verimli arayış
ICLR 2020 | "Eşzamanlı Ortalama Öğretim" çerçevesi, denetimsiz öğrenim için daha sağlam sözde etiketler sağlar
Huawei Vision Research Yol Haritası: Üç Zorluk, Altı Plan
Kuantum bilişim araştırma ilerlemesi: Çin ve Amerika Birleşik Devletleri'nde 4 ila 5 yıllık bir teknoloji açığı var
2020 Ulusal Bilim ve Teknoloji Ödülleri adaylıkları açıklandı, Yang Qiang ve Chen Yunjinin ekipleri kısa listeye alındı
Öz dikkat ajanı, küçük boyut, büyük yetenek
Canlı CVPR 2020: İşbirlikçi yineleme Fine -Tuning uygulaması Tek görüntü yansıtıcı kaldırma
CVPR 2020 | IR-Net: Bilgi saklama için ikili sinir ağı (açık kaynak)
FSNet: Derin evrişimli sinir ağlarını sıkıştırmak için evrişim çekirdek özetini kullanın
ELECTRA Çin ön eğitim modeli, yalnızca 1/10 parametreli açık kaynak kodludur ve performans hala BERT ile karşılaştırılabilir.
To Top