"CPU olmadan, GPU 1000x'i aşın" Wave şirketi veri akışı işleme mimarisi DPU'yu yayınladı

Xinzhiyuan Derlemesi

Başarılı bir çip start-up şirketi kurmak kolay değildir, ancak sermaye desteğine sahip Wave Computing, en azından şimdilik, küçük ama önemli bir piyasa-AI eğitim çipine sağlam bir şekilde yerleşmiştir. a kadar.

Başlangıcından bu yana yedi yıl geçti.Şu anda, şirketin en son DPU çok çekirdekli mimari erken deneyim projesi nihayet açıldı ve bu da Wave'in derin öğrenme veri akışı işleme mimarisine odaklanma konusunda bir adım atmasına izin veriyor.

Birkaç gün önce, Wave Computing CTO'su ve DPU (Dataflow Processing Unit) Baş Mimarı Dr. Chris Nicol, yüksek performanslı yonga endüstrisi zirvesi Hot Chips'te ürünlerinin DPU'sunun sinir ağı eğitimini hızlandırmada GPU 1000x'i geçebileceğini belirtti. GPU'nun mevcut derin öğrenme eğitim pazarındaki konumunu dikkate alan cesur bir açıklama-Nicol, ilk kullanıcıların denemeden sonra DPU iddialarını onaylayabileceklerine inanıyor.

Wave Computing'in görüşü, veri akışı mimarisinin yüksek performanslı sinir ağlarını etkili bir şekilde eğitmenin tek yolu olduğu yönündedir. CPU, sistemlerinde tamamen yok.

2016 yılında, Wave Computing'in DPU'sunun henüz açıklandığı zamanki tasarım bilgileri

Bu yılki Hot Chips Konferansı'nda açıklanan mimari ve tasarım verileri: Saniyede Teraops tepe noktası 181'dir. Şekil 8-bit hesaplamayı gösterir, ancak 16, 24, 32 ve hatta 64 bit de yapabilir. Ortalama 6,7 GHz çalışma gücüne sahip 16.000 işleme elemanı ve 8,00'den fazla aritmetik birimi vardır. Benzersiz bir otomatik zamanlama mekanizması benimseyin ve çeşitli işleme öğeleri arasındaki zamanlama problemini çözmek için küresel bir asenkron / yerel senkronize zamanlama senkronizasyon mekanizması kullanın.

Nicol, hedef problemlerini manycore stratejilerine uygulama konusunda geniş deneyime sahiptir. Gömülü çok çekirdekli sistemlere ve yazılıma odaklanan Avustralya Ar-Ge organizasyonu NICTA'nın kurulmasına yardım etti.Nico, Avustralya'da Bell Labs Araştırma Enstitüsü'nü kurdu ve ilk çok işlemcili SoC'yi birlikte geliştirdi. Nicol, derin öğrenme eğitimi yerleşik bir bilgi işlem sorunu olmasa da, Büyük ölçekli eğitimin veri merkezini terk ettiği gün nihayet gelecek . Wave henüz bu düşünce çizgisine uyan bir sistem geliştirmedi, ancak Nicol'un geçmişi ve açıklamaları, Wave Computing'in sinir ağı eğitimini daha uç noktalara taşımak için araştırma yapabileceğini gösteriyor. Bu aynı zamanda Wave'in DPU'sunun gelecekte potansiyele sahip olabileceği yerdir.

DPU'nun 16.000 işleme öğesi ve 8.000'den fazla aritmetik birimi vardır - yine burada koordine edilecek CPU yoktur. Tüm çekirdekler 6,7 GHz'de (ortalama) çalışır ve kaba taneli, yeniden yapılandırılabilir bir mimari kullanır - bu tasarım, diğer derin öğrenme donanım başlangıçları tarafından geliştirilen ürünlerden çok farklıdır. DPU, benzersiz bir otomatik zamanlama mekanizmasına sahiptir. Hiçbir veri geçmediğinde, DPU bir uyku durumuna girer.

DPU, binlerce öğenin veri akış grafiklerinin statik planlamasını işleyebilen hibrit bir FPGA ve çok çekirdekli işlemci olarak görülebilir. Çekirdekler arası yerleşik tasarım ve iletişim için ayrıntılar için aşağıya bakın.

DPU kart tasarımı (üstte) ve çekirdekten çekirdeğe iletişim stratejisi (altta)

Nicol, The Next Platform ile yaptığı röportajda şunları söyledi: "Bugün heterojen bilgi işlemle ilgili bir sorun var. Ana bilgisayar veya kontrolör her zaman CPU üzerinde çalışıyor ve hızlandırıcı hiçbir şey yapmıyor. Çalışma zamanı API'niz CPU üzerinde çalışıyor ve slave, CPU'nun bunu söylemesini beklemelidir. Yaptığı şeyi yapıyor. Bunu tamamen değiştirmek istiyoruz. "

Nicol, hızlandırıcı mimarisinin (özellikle GPU'nun) iki sorunu olduğuna dikkat çekti: Biri yeni çekirdekler yüklenirken gecikme, diğeri ise MCU kullanarak çalışma zamanında programları içeri ve dışarı taşımak için ilk sorunu çözmek. Bunun ne zaman olacağına program kendisi karar verir - program MCU ile iletişim kurar ve DMA, programı çipe / çipe aktarır ve yayılma sinyalini kontrol eder. Çipte bir program önbelleği de var. Sonuç, CPU'suz mimari, yük boşaltma modelinde daha fazla performans kazanımına sahiptir .

Bunun gibi istifleme teknolojileri çok güçlü bir mimari elde edecek. Tabii ki, CPU eksikliği ve diğer esneklik sorunları ile başa çıkmak için bu hala çok fazla değişiklik gerektiriyor, bu nedenle DPU performansı ve verimlilik kriterlerini de dikkate değer kılıyor.

Donanıma ek olarak, yazılım da özellikle yeni mimari, yazılımın nasıl çalıştığı ve kullanıcıların nasıl etkileşime girdiği göz ardı edilemeyecek konulardır. Bu bağlamda Nicols, "Derin öğrenme aslında derin öğrenme yazılımının üstüne programlanmış bir veri akış grafiğidir. Bizimki gibi bir işlemci üzerinde çalışır ve çalışma zamanında veri akış grafiğini bir araya getirebilir."

Nicols şunları söyledi: "İş akışı, ağı eğitmek için bir veri akış grafiği oluşturuyor; örneğin, çalışma zamanında, veri akış grafiğini TensorFlow'dan alıyor ve doğrudan çalışma zamanında dönüştürüyor, CPU'suz çalıştırıyor ve eşleştiriyoruz. Çipte veri akışı. "

Wave derleyicisinde Inception V4 işlemenin şematik diyagramı

"Bu, uzamsal hesaplamaya benzer, kaba taneli yeniden yapılandırılabilir bir dizidir." Nicol şunları söyledi: "Program çok çekirdekli bir işlemcide çalışırken, yine de bölümlere ayrılması gerekiyor. Bu aynı zamanda yongadaki çok sayıda çekirdekle ilgili bir sorundur. İşte. OpenCL çözüm değil. "Wave kendi uzamsal derleyicisine sahip. Sıkıca bağlanmış işlemci mimarilerinde, işlemci doğrudan (kayıt kullanmaya kıyasla) daha hızlı iletişim kurar.

Wave sisteminin erken deneme verileri

Derleme kaynakları hakkında daha fazla bilgi edinin:

https://www.nextplatform.com/2017/08/23/first-depth-view-wave-computings-dpu-architecture-systems/

Yasadışı olmayan ve yasadışı olmayan ancak çok sinir bozucu kaç tane araç kullanma davranışıyla karşılaştınız?
önceki
BMW'nin aynı ZF 8AT'ı Çin'de üretilecek! Bağımsız modellerin ürün gücü büyük ölçüde geliştirilebilir mi?
Sonraki
Yeni yıl için Dubai'ye gidin! 2019 Dubai Alışveriş Festivali fiyatları 40 günlüğüne düşürdü!
Beni anla kral
Lütfen ebeveynlere aktarın! Sağlık ürünleri satın almadan önce bu makaleyi okuyun
Yılda bir kez bekleyen Yaz Sarayı "Altın Işık Piercing" i yeniden ortaya çıkıyor! Bunu gördün mü?
ABD doları banknot baskı makinesi modeli yeniden başlamak üzere ve 100 milyardan fazla yabancı sermaye Çin'e akıyor. Buffett: Lütfen daha fazlasını yapın
"86 milyon ABD doları projesi için 57 satır kod" Açık kaynak araçlarıyla DIY plaka tanıma sistemi
Bu yaratıcı ve ilginç yabancı sokak grafiti
Çin, Rusya, Almanya ve Fransa ABD borçlarını boşaltıyor Dış medya Çin'in ne kadar altını var tahmin et Fed'in geri göndermeyi reddetme hakkı yoktur
Endişe ve yakıttan tasarruf edin + geniş alan! 200.000 iniş, dört sıcak satış Japon SUV büyük Hengping!
Luckin ve Hi Tea, Starbucks neden endişeleniyor?
"Derin Öğrenme Github 100.000+ Kaynak Kodu Analizi" Python, üçüncü en popüler dildir
Kötü bir ruh hali içindeyken, insanları iyileştirmek için bu yere git
To Top