Bir gecede kurtuluşa geri dönün - "NVDLA" başörtüsünü kaldırın (NVDLA, Nvidia tarafından piyasaya sürüldü nerede?)

EETOP, herkesin iletişim kurmasını ve öğrenmesini kolaylaştırmak için

GPUFPGA Derin Öğrenme Grubu

Sektördeki arkadaşlar katılabilir ve nasıl grup eklenir: Grup sahibini ve arkadaşlarını eklemek için QR koduna uzun basın ve aşağıdaki bilgileri gönderin: grup ekle + derin öğrenme + şirket (veya üniversite)

QR koduna uzun basın, grup sahibini arkadaş olarak ekleyin ve sizi gruba çekin

Lütfen gruba katılmadan önce arkadaş çevrenizde en az bir EETOP WeChat makalesi paylaştığınızdan emin olun.

Giriş

Mahjong'un AI hızlandırıcı tablosu yeni monte edildi ve masa bitmeden önce, stadyumu tekmeleyen ve sahaya çıkan bir -NVDLA var. NVDLA nerede kutsal ve neye benziyor, hadi başörtüsünü kaldıralım.

1. NVDLA nedir?

NVDLA, 26 Eylül 2017'de NVIDIA tarafından github'da (https://github.com/nvdla) resmi olarak yayınlanan NVIDIA Deep Learning Accelerator'ın (sadece tahmin) kısaltmasıdır. NVDLA ile ilgili belgeler resmi NVDLA'da bulunabilir. Web sitesinde ( bulundu. Şu anda belge iki bölüme ayrılabilir. Kaba bir giriş için lütfen adresini ziyaret edin. Mimari ile ilgili daha ayrıntılı bir giriş için lütfen bu makaleye bakın Ana bilgiler de yukarıdaki iki belgeden alınmıştır.

iki , NVDLA'nın PPA'sına ne dersiniz?

2.1 performans

Birincisi performans verileridir:

Yukarıdaki verilerin belirli bir konfigürasyon altındaki performans verileri için olduğuna dikkat edilmelidir. Sonuçta, NVDLA bir "Transformatördür". Konfigürasyon verilmediyse, ayrıca verilen performans verileri güvenilir değildir.

2.2 Güç

Ne yazık ki, şu anda NVDLA ile ilgili hiçbir güç verisi yok, ancak resmi kaynaklara göre, NVDLA kendi iç projeleri tarafından fiilen kullanılan versiyondan evrimleşti (hadım edildi) ve güç tüketiminin sıradan açık kaynaklı projeler kadar çirkin olmadığı tahmin ediliyor.

2.3 alan

Son olarak, alanla ilgili veriler:

Not: Yukarıdaki alan verileri çip üzerinde hafızayı içermez Sonuçta, 4MB çip hafızası gömülü senaryolar için fazla abartılıdır.

3. NVDLA'nın dikkat etmeye değer önemli noktaları nelerdir?

3.1 Transformatörler

Kuşkusuz, başörtüsü kaldırdıktan sonra, göze çarpan ilk şey şüphesiz 'değişken' özellikleridir. Düşük uçtan üst düzeye, kullanıcılar PPA'ya göre değiş tokuş yapabilir ve kendi NVDLA sürümünü edinebilir. Bana göre "değişken" gerçekten çaresiz, dünyayı hızla değiştiren. Derin öğrenme algoritmalarının sürekli değişen durumunda, "değiştirilebilir" özelliği olmadan uzun süre yaşamayacakları tahmin edilmektedir.

3.2 Özel kullanım için özel fonlar

Derin Öğrenmedeki farklı katmanlar için, NVDLA temelde karşılık gelen ve bağımsız donanım modüllerine sahiptir. Her modül ayrılıp ayrılmayacağına karar verebilir. Bu, donanım mimarisine geçerken izlediğimiz "bilgi işlem birimlerini olabildiğince yeniden kullanma" fikrinden tamamen farklı.

NVDLA'nın genel yapısı aşağıdaki gibidir:

Evrişim tamponu RAM'den oluşur ve kapasitesi varsayılan olarak 512KB'dir ve evrişim çekirdeği tarafından kullanılmak üzere katsayı ve özellik haritası verilerini depolar.

Convolutioncore, özellikle C * K biçiminde organize edilen çok sayıda MAC birimi de dahil olmak üzere, konv ve fc katmanlarının işlemlerinden sorumludur; burada C, aynı anda işlenen giriş kanallarının sayısıdır ve K, aynı anda işlenen çıkış kanallarının sayısıdır.

SDP, aralarında sigmoid ve tanh'nin LUT biçiminde uygulandığı ReLU, PReLU, hassas ölçekleme, toplu normalleştirme, önyargı ekleme, sigmoid, hiperbolik tanjant gibi basit doğrusal ve doğrusal olmayan işlemlerden sorumludur.

PDP, esas olarak max_pool, min_pool ve avg_pool dahil olmak üzere havuz işlemlerinden sorumludur. Şu an için bir min_pool'un neden gerekli olduğunu anlamadım, umarım tasarımcı bir açıklama yapabilir.

CDP, çapraz kanalın LRN'sinden sorumludur. Ama kanal içi ile LRN nerede uygulanmaktadır? Şu anda, SDP'nin inç kanallı LRN ile uygulanması en muhtemel olduğu görülüyor, çünkü inç kanallı LRN, LUT ile uygulanabilir (bu, ona sıradan insanlar için söylemiyorum).

RUBIK ismi çok güzel, tasarımcının duygularını yansıtıyor. Ama RUBik modülünün onu uygulamak için daha iyi bir yolu olduğunu düşünüyorum.Örneğin, veri okuma kuralları yazmaçları yapılandırarak kararlaştırılır Sonuçta, Rubik Küpü oynarken, onu nasıl çevirirseniz çevirin, ne daha fazla taraf ne de daha az taraf olacaktır. Hakim, ne düşünüyorsun?

BridgeDMA veri üretmez, sadece bir veri taşıyıcıdır.

3.3 İkinci savaş alanı

Hepimizin bildiği gibi, bellek sınırı, AI hızlandırıcı tasarımcıları için en önemli önceliktir. Bu sorunu çözmek için NVDLA, ikincil bellek arabiriminin büyük numarasını buldu (aslında, bu büyük numarayı da düşündüm). Bu SMI'nin (kısaltılmış haliyle) ISP'ye, CPU'nun önbelleğine, yonga belleğine bağlanması ve bağlanması düşünülebilir. . .

İkinci savaş alanı SMI, öyleyse ilk savaş alanı nedir? Tabii ki seyreklik sıkıştırması Bu zaten çürümüş, bu yüzden bunun hakkında konuşmayacağım. Kısacası, herhangi bir hızlandırıcı seyreklik sıkıştırmasını desteklemiyorsa, saçma olmayacak.

3.4 Başsız yaşayabilir

NVDLA'nın iki versiyonu vardır: baş ve başsız. Bu kez yayınlanan NVDLA başsızdır, başı yoktur, sadece vücudu vardır ve yaşayabilir.Nasıl yaşayacağına, bekleyip göreceğine gelince. Kişisel olarak, NVDLA'nın denetleyiciye bağımlılığının derecesine bağlıdır. NVDLA'nın CSB'sinin tasarım becerilerini test eder. Tasarım iyiyse, başsız iyi yaşar. Baş versiyonu neden bu sefer yayınlanmadı? Sanırım bu MCU'nun telif hakkı sorunu olabilir (NVIDIA'nın kendi CPU mimarisi yok gibi görünüyor) veya belki de Huang'ın isteği çok acildi.NVDLA mühendisleri buna direnmedi, bu yüzden başsız bir tane gönderdiler.

Dört, kişisel görüş

NVDLA hakkındaki kişisel anlayışımdan biraz bahsedeyim.

4.1 ikincil bellek arayüzü

Bu özelliği görünce şok olduğumu doğruladım. Bu birkaç gün önce hala tereddüt ettiğim bir soru. NVDLA gerçekten fark edildi. Şahsen bu özelliğin NVDLA'ya yeni bir dünya açması için bir yol bıraktığını hissediyorum. pencere.

4.2 evrişim tamponu

Utanmadan söylemek gerekirse, bunu ben de yaptım. Ancak akademik çevrede yapay zeka hızlandırıcı makalelerine bakıldığında, çok az kişi katsayı ve özellik haritasını bir araya getiriyor. Bu tasarımın avantajları ve dezavantajları vardır. Büyük tencere pilavının ve çeşitli sobaların avantaj ve dezavantajlarını anlamak daha kolay, bu yüzden burada onları atlayacağım.

SDP'de 4.3 önyargı ilavesi yapılır

İlk başta beklenmedik bir durumdu ama şimdi bunu düşünmek mantıklı.

4.4 NVDLA mükemmel değil

4.4.1 NVDLA şu anda, yüz algılama alanında yaygın bir gereksinim olan yerel bağlantı evrişimi desteğini görmemektedir.

4.4.2 NVDLA ayrıca donanım seviyesinden genişleme dönüşümünü desteklemez.Eğer büyük sıkıştırma hareketiyle birlikte çekirdeğin çevrimdışı işlenmesine güvenirseniz, performans üzerinde büyük bir etkisi olmayabilir, ancak değerlendirme verilerini görmek yine de kolay değildir.

4.4.3 NVDLA, ROIPoolling'i desteklemiyor, bu biraz mantıksız. Sonuçta, mevcut nesne algılama alanında, Faster-cnn dünyanın çoğunu işgal edebilir ve ROIPOOL'un olmaması üzücüdür.

4.4.4 PDP modülü, verileri doğrudan evrişim tamponundan okuyamaz. Bu aynı zamanda küçük bir pişmanlıktır. Bu pişmanlık, yukarıdaki pişmanlığın "mirası" olabilir, çünkü ROI havuzlamasını desteklemek istiyorsanız, PDP'nin evrişim tamponunu doğrudan okuma yeteneğine sahip olması gerekir, aksi takdirde , Sadece ha ha olabilir.

Kurtuluştan beş, bir gece önce

NVDLAnın sahaya çıkması bir "komplo başarılı" gibi görünüyor. Kenevir arkadaşlarından oluşan bir masa, ellerindeki kartların değerini değerlendirmeli. Küçükleri bekledim, düşündüm ve bir şeyler bulması için beynimi harap ettim ve gün ışığında dışarı çıktı. Bu iyi bir şeydir (gözyaşlarıyla söylenir -_-!), Başlayanlar ve başlamayanlar birlikte başlangıç çizgisinde durdu Kardeşler, devrim başlamadan önce başarısız oldu!

Özgeçmişinizi hızla gözden geçirin: "NVDLA mimarisine aşina olun ve NVDLA'ya dayalı derin öğrenmenin geliştirme sürecinde ustalaşın".

6. NVDLA projesi için çeşitli referans bağlantıları

https://github.com/nvdla/hw

https://github.com/silicontalks01/OpenDLA

Sıradan insanlar tarafından trafik cezaları nerede ödeniyor?
önceki
Bir karşılaştırma fotoğrafı ekranı kaydırıyor: Apple mağazasının kapısında ve Huawei mağazasının kapısında ... Netizen: Birden ağlamak istiyorum
Sonraki
2020'de kimse "patlamayacak" mı? Övünmek mi, övünmek mi?
Maliyet 1 milyardan 10 milyon ABD dolarına düştü! Musk'ın yeraltı yüksek hızlı tüneli tamamlandı
baş ağrısı! Size uyan üç SUV grubu nasıl seçilir?
ABD vize işlemleri hakkında 20 soru ve ardından vize reddine veda edin!
İster inanın ister inanmayın, ithal araba satın alan insanlar en vatanseverler!
Kızgın! Öğrencilere tokat attıktan sonra, teyze kişisel amaçlar için 10 yuan kullanmak mı istedi? Yolcular tarafından suçlandıktan sonra ...
Sincan'a gitmek için on bin neden, düşük maliyetli bir bilete değmez! Mayıs ve Haziran gezginleri daha az güzel
Coupe'yi geri kaydırın ve gençlerin "spor araba" hayalini gerçekleştirin!
100.000 yuan'dan satılan aile sedanının çok fazla alanı ve gücü var ve değer tutma oranı hala yüksek.
Bu üç araba sevimli ama maalesef yakıt tüketiminde kaybediyorlar
Gençlik "uyuşturucu" olmamalı, uyuşturucu karşıtı polis çiçeği sizi farklı bir sınıfa götürecek!
İnsanlar, dördüncü yerçekimi dalgasını tespit ettiler: evrendeki zaman ve uzaydaki dalgalanmalar
To Top