Ufuk çizgisinin "Moore Yasası" nı nasıl yeniden yarattığını anlamaya yönelik bir makale | Daniel Lecture

Horizon BPU algoritmasından sorumlu kişi Luo Heng 25 Mart'ta "Horizon nihai performansı nasıl takip ediyor? "Benzersiz bir çevrimiçi paylaşım oturumu başlatmak için. "Horizon Core Technology Series Open Course" un "çığır açan sınıfı" olan Luo Heng, mevcut AI çipinin en büyük zorluğundan MLperf'in idealliğine ve sınırlamalarına, Horizon BPU'ya (Horizon'un kendi geliştirdiği yapay zekaya adanmış Beyin İşleme Birimi) geçti. İşlemci mimarisinin evrimi) aceleyle tartışılıyor, yapay zekanın gelişme eğilimi, en yüksek performansa meydan okumak için yazılım ve donanım kombinasyonu yoluyla Horizon'un derinlemesine analizi ile birleştiriliyor ve "Moore Yasası" teknoloji sürecini yeniden yaratıyor.

Aşağıda sıralı paylaşım verilmiştir

AI çiplerinin en büyük zorluğu

2015 yılından bu yana, AI çipleri yavaş yavaş insanların dikkat ettiği bir trend haline geldi. Sektör katılımcılarının hepsi rekabet gücü yüksek çipler yapmayı umuyorlar. En büyük zorluk, hızlı algoritma geliştirme ve yavaş çip yinelemesi arasındaki çelişkidir. DeepMind tarafından 2016'da önerilen yapay sinir ağı WaveNet'i örnek olarak alın.Doğru ile yanlışı ayırt etmesi zor olan insan seslerini taklit edebilir, ancak hesaplama karmaşıklığı o anda en güçlü GPU'da gerçek zamanlı olarak işlenemez. Bir dakikaya yakın gecikme, Bu devrim niteliğindeki buluş hiçbir zaman tam anlamıyla uygulanmadı. 2017'de, Paralle WaveNet'in optimize edilmiş algoritması hesaplama verimliliğini 1000 kat artırdı ve Google bunu Google Asistan'a başarıyla uyguladı. Bir şirketin şu anda (2017) gömülü sistemler için bir çip piyasaya sürmeye hazırlandığını varsayalım, böylece cep telefonları gibi mobil senaryolar da çok makul bir seçim olan bu AI sonucunu kullanabilir. Ancak 2018'de, algoritma yeniden optimize edildi ve temel hesaplama yöntemi, cep telefonu CPU'sunun da çalışabilmesi için RNN ve DalitedCNN'den sonra Yedek RNN'ye yükseltildi. 2017'de geliştirilen çipler 2019'a kadar mevcut olmayacak. Bu, algoritmaların hızlı gelişimi ile yavaş çip yinelemeleri arasındaki çelişkiyi yansıtan üzücü bir hikaye.

Hızla gelişen AI algoritma trendini sunar

Ufuktaki ana kanalın görsel algısına geri dönelim. AlexNet'in 2012'de ImageNet'teki atılımı, bu AI dalgasının başlangıcını açtı. 2012'den 2016'ya kadar çeşitli ağlar ortaya çıktı. Başlangıçta, ImageNet'i geliştirmeye kararlıydım. VGG model genişlemesi çok hızlıydı ve GPU tarafından sınırlıydı. Düşen model, doğruluk ve hesaplama gücü arasındaki değiş tokuşu uygun bir şekilde değerlendirmeye başladı ve ResNet, farklı doğruluk elde etmek için ağ hesaplama gücünü genişletmek için çözümler sunmaya başladı. 2016'dan sonra, ImageNet'in doğruluğu yavaş yavaş doymuş hale geldi ve hesaplama verimliliğinin optimizasyonu değerlendi. Algoritma uygulaması, daha az hesaplama ile daha yüksek doğruluk peşinde koşmaya başladı. SpueezeNet, MobileNet ve ShuffleNet, bu dönemde "yeni" evrişimli sinir ağlarının temsilcileridir. Aynı zamanda, NASNet tarafından temsil edilen ağı otomatik olarak aramak için makine öğrenimi yöntemlerini de kullanmaya başladı, ancak esas olarak ağ alt yapılarını arıyordu. 2019'a gelindiğinde, evrişimli sinir ağı mimarisinin evrimi kademeli olarak birleşti, alt yapı MobileNet v2'ye yakınlaştı ve model genişletme yöntemi, EfficientNet'in Bileşik ölçeklendirme yönteminden geliyor. Yukarıdaki yapay zeka algoritmalarının evrim eğilimi, yapay zeka yonga üreticileri arasındaki rekabet üzerinde son derece önemli bir etkiye sahip olmuştur: Çip mimarisi tasarımı ve yonga SOC yeteneği çok önemli olsa da, algoritma sürekli değiştiği için, tasarlanan yonga nasıl olabilir? Ortaya çıktığında, algoritmanın en son ilerlemesine hala uyabilir ve şimdi ve hatta öngörülebilir gelecekte AI çip rekabetinin kilit noktası olacaktır.

Daha iyi bir AI çipi nedir?

Algoritma evrimi ve çip yinelemesi arasındaki kopukluk önümüzde ki zorluktur.Peki, AI çip yolundaki oyuncular için net hedefler nasıl belirlenir? Araştırma ve pazar arasında nasıl bağlantı kurulur, mühendislik ile geliştirmeyi birbirine bağlamak ve gerçek senaryolarda en temsili görevlerin test edilmesi yoluyla makine öğrenimi algoritmalarının evrimini nasıl yansıtır? Mevcut ortak ölçüt MLPerf'tir. Fakat aslında, MLPerf Inference V0.5 tarafından 2019'da kullanılan sınıflandırma modelleri hala ResNet50 ve MobileNet V1'dir ve algılama modelleri MobileNet V1 ve RerNet34'tür. Bu açıdan bakıldığında, MLPerf Çıkarımı henüz yeni ortaya çıksa da, nispeten eski modeli nedeniyle algoritma ilerlemesinin iki yıl gerisinde kaldı. Ek olarak, kantitatif modellerin popülaritesi nedeniyle, MLPerf birleşik bir standart tasarlamayı umuyor, ancak sonuçta doğruluk sorunları nedeniyle standardı (MobileNet) düşürmeyi seçiyor. Gönderen ile standart tasarımcı arasındaki oyun, görevi genellikle beklendiği gibi modeli güncelleyemez hale getirir. Ancak Horizon her zaman AI çiplerinin gerçek performansının değerlendirilmesinin zamana ayak uyduran standartlar gerektirdiğine inanır. Bu nedenle, gerçek performansı daha titiz bir şekilde test etmek için, yukarıda bahsedildiği gibi görsel alandaki en verimli MobileNet V2 yapısı seçilmiştir (EfficientNet hesaplama yöntemini değiştirmez ve SE yapısının da EfficientNetTPU tarafından kilit bir faktör olmadığı kanıtlanmıştır). Gerçek ölçüm, teknolojinin iki nesil önünde olan iki rakip ürünün, MobileNet V2'nin kare hızında Horizon Journey ikinci nesil çipinin önemli ölçüde gerisinde olduğunu gösteriyor.

Mevcut görsel alandaki en verimli MobileNet V2 yapısına, ikinci nesil ufuk ve yolculuk test sonuçlarına ve iki rakip ürüne dayanmaktadır.

Ek olarak, nihai enerji verimliliğine ulaşmak için başka faktörlerin de dikkate alınması gerekir. Çip için en büyük güç tüketimi hesaplamalar değil, aynı zamanda veri işlemedir.DDR'nin (Çift Veri Hızlı SDRAM, çift oranlı eşzamanlı dinamik rasgele erişim belleği) veriminin nasıl azaltılacağı aslında güç tüketimini azaltmanın anahtarıdır. Yer. Bu bağlamda, Horizon hedeflenen optimizasyonlar da yaptı.Frame hızı rakip çiplerin hızını aştığında, sadece rakip çiplerin 1/4 DDR çıkış hızı vardır. Bu nedenle kullanıcılar bir yandan daha düşük maliyetli DDR kullanabilirken diğer yandan kullanıcı hızlandırma modelinin DDR'ye özel olduğunu varsayamayız ISP, Codec ve çeşitli uygulamalarla kullanılması gerekir Yolculuk düşüktür. DDR işlem hızı, kullanıcıların DDR bant genişliği ile sınırlandırılmadan bilgi işlem gücünden tam olarak yararlanmalarına olanak tanır.

BPU, nihai performans oluşturmak için sert ve yumuşaklığı birleştirir

2017'de, ikinci nesil BPU tasarlandığında, akademi dünyasından iki sinyalin, sırasıyla Xeception ve MobileNet'in ImageNet yüksek hassasiyette ve düşük ila orta hassasiyette iyi verimlilik elde etmek için Depthwise Convolution kullandığını gözlemledik.

2017'de, akademi-Derinlemesine Evrişim'den özel bir sinyal

Horizon'un önemsediği görsel görevleri ve ücretsiz verileri hızlı bir şekilde doğruladık. Depthwise Convolution'un getirdiği verimlilik artışını kanıtlıyor. Sonra bir ön optimizasyon yaptık, 8bit Derinlemesine Evrişim modelini ölçtük, modelin doğruluğunu ölçtük > Kayan nokta modeli doğruluğu * 0.99 (Google kantifikasyon makalesi altı ay sonra yayınlandı, ancak doğruluk ideal değil); Derinlemesine Evrişimin çekirdek sayısını artırmak ve 1x1 evrişim ile sunulan hesaplama miktarını azaltmak için 1x1 kullanmaya çalıştı (bir yıl sonra yayınlanan MobileNet v2'ye benzer) ; Farklı çekirdek boyutlarını denedim ve çekirdek boyutunu 7'ye genişletmenin küçük bir hesaplama maliyetiyle doğruluğu artırabileceğini keşfettim (iki yıl sonra Mixconv kağıdıyla tutarlı). İlk doğrulama ve optimizasyonu tamamladıktan sonra, BPU'nun FPGA versiyonunu yaptık ve sonraki Matrix'e dönüştük (aynı zamanda araç zekası ve otonom sürüş teknolojisi kategorisi ödülü altında bu onuru kazanan tek Çin ürünü olan 2019 CES İnovasyon Ödülü'nü kazandı), Tüm çözümlerimiz gerçek araçlarda test edilmiştir.

Donanım ve yazılımı birleştirerek aşırı performansı zorluyor

Gerçek uygulama senaryolarının yukarıdaki doğrulaması, optimizasyonu ve cilalanması, mimari tasarımımız için bir referans sağlar ve bugün de kanıtlanmış olan algoritma eğilimini en başından itibaren geleceğe yönelik optimize etmemize olanak tanır.

Horizon BPU Ar-Ge Yol Haritası

Ufuktaki en büyük özelliğin, anahtar algoritmaların gelişme eğilimini tahmin etmek, en önemli sahnelerde dikey olarak nüfuz etmek ve proaktif olarak hesaplama özelliklerini mimari tasarıma entegre etmek, AI işlemcisini iki yıllık bir geliştirmeden sonra yapmak olduğu söylenebilir. Ar-Ge, piyasaya sürüldüğünde, en kritik uygulamaların karşılanmasını sağlarken, en son genel algoritmalara iyi bir şekilde adapte olabilir. Bu nedenle, diğer tipik AI işlemcileriyle karşılaştırıldığında, Horizon'un AI işlemcileri, algoritmaların evrimi ile her zaman çok yüksek bir etkili kullanım oranını koruyabilir, böylece gerçek anlamda algoritma yeniliğinin getirdiği avantajlardan faydalanabilir. Teknolojinin ilk hamle avantajı ticarileştirme sürecini teşvik eder ve öncü ticari çıkarma araştırmaları da teknolojik ilerlemeyi geri besler. Yapay zeka çiplerinin zorlu teknolojik yenilik yolunda, Horizon "algoritma + çip + alet zinciri" temel teknoloji platformunu geliştirmeye devam edecek. Horizon'un bu yıl içinde, her şeyi yapay zeka ile güçlendirerek herkesin hayatını daha güvenli ve daha iyi hale getiren yeni nesil otomotiv sınıfı AI çiplerini piyasaya sürmesi bekleniyor!

Horizon "Da Niu Lecture Hall" Hakkında

"Da Niu Lecture Hall", "teknik kuru mallar için doğmuş" kavramına bağlı kalıyor ve yapay zeka ve yapay zeka çipleri alanında en son görüşleri, teknik kuru ürünleri ve geliştirici deneyimini paylaşarak açık bir teknik topluluk oluşturmayı hedefliyor. Horizon'un açık fikirli olması ve yonga güçlendirme konusunda ısrar etmesi gibi, "Da Niu Lecture Hall" da bilgiyi aynı açık fikirle paylaşmayı ve AI yolundaki meslektaşlarıyla birlikte ilerleme kaydetmeyi umuyor.

Yakın zamanda, daha fazla insanın en son yapay zeka çiplerini anlamasını ve çevrimiçi paylaşım yoluyla teknolojinin gücünü yaymasını umarak "Horizon Core Technology Series Open Class" ı başlattık!

Lei Feng Ağı Lei Feng Ağı

47 diş "yıllık halkalar", hamilelik, hastalık ve cezaevi geçmişinin sadık bir arşivi! Ya da insan yaşam tarihinin evrimini yeniden şekillendirecek
önceki
Today Paper | Karbondioksit emisyon tahmini; 3D yüz rekonstrüksiyonu; BERTolojiye giriş; dinamik sahne rekonstrüksiyonu vb.
Sonraki
"Half-Life" matematik öğretir, Öğretmen Charlie 430.000 kişiyi çeker
Oyunlar izolasyon önlemlerine dahil edilsin mi? Polonya hükümeti, çocukları evde oyun oynamaya teşvik etmek için kendi Minecraft sunucusunu kuruyor
Bu insanların yıl sonu ödenek sübvansiyonları bu şekilde ödenemez!
Yeni yılı karşılamak için Wuhan'daki bu ortaokulun ulusal bir tarzı var.
"Zhiyinhao" romantik su konseri yeni yıl çaldı
Yılbaşı gecesi gösterisi Yangtze Nehri'nin tepesini aydınlatıyor ve ışık ve gölgenin dansı 2020'yi karşılıyor
"Wuhan Diary" bebeği evde
Bedava kan bağışı yapın, yeni yılı selamlamak için "aşk"
anlaştık mı! Hubei 2020'de patlayacak! Herkes
Dikkat et! Birçok insan kışın bunu sever ve size zarar verebilir! Varsa hızlıca görün
Güney Çin Deniz Ürünleri Toptancı Pazarı bugün tadilat için kapalı ve muhabirlerin ziyaret ettiği tüccarların çoğu kapalı.
Atıkları hazineye çevirin, ellerini ve beyinlerini kullanın, yeniyi bu şekilde karşılarlar
To Top