Huang Renxun'u Sorgula: GPU 5 yıl içinde kesinlikle TPU kazanacak ve Çin'in bilgisayar endüstrisi dünyada ilk sırada yer aldı

Xinzhiyuan Raporu

GPU yalnızca Tensor işlemeyi değil aynı zamanda diğer birçok görevi de yapabilir

Huang Renxun, Mayıs 2017'deki GTC Amerika Birleşik Devletleri konferansında, Xavier DLA'nın tüm geliştiricilerin kullanması ve değiştirmesi için açık kaynaklı olacağını duyurdu. İlk sürüm Temmuz'da, tam sürüm ise Eylül'de satışa sunulacak. 26 Eylül'de GTC Beijing, Huang Renxun sadece Xavier'den bahsetti, ancak DLA'dan bahsetmedi.Ancak, 27'sinde NVIDIA'nın resmi blogu DLA'yı tanıttı ve kodu Github'da yayınladı.

NVIDIA Deep Learning Accelerator (NVDLA), derin öğrenme hızlandırıcı tasarım yöntemlerinin standardizasyonunu teşvik edebilen ücretsiz ve açık kaynaklı bir mimaridir. NVDLA, modüler mimarisi sayesinde ölçeklenebilir, yüksek düzeyde yapılandırılabilir ve entegrasyon ile taşınabilirliği basitleştirebilir. Donanımı çeşitli loT cihazlarını destekleyebilir. NVIDIA Open NVDLA lisansı altında açık kaynaklı bir proje olarak, tüm yazılım, donanım ve belgeler GitHub'da bulunabilir.

Ayrıntılı adres:

Açık kaynak adresi: https://github.com/nvdla

Birçok kişi lider Huang'ın yeni bir inanç-açık kaynağa sahip olduğu yorumunu yaptı.

GTC'nin Pekin'deki ilk konuşması olan 26 Eylül'de Huang Renxun, gişede yeterince para kazandı ve Nvidia'nın en yetkin satıcısı seçildi.

Huang Renxun açılış konuşmasında NVIDIA Tensor RT 3'ü tanıttı - bu programlanabilir bir AI çıkarım hızlandırıcısıdır. Caffe, Pytorch ve TensorFlow gibi tüm çerçeveleri destekler.

Konferans sonrası röportaj oturumunda, medya tarafından röportaj yapılan Huang Renxun, sabah konuşmasından daha rahat ve doğaldı. Önce herkese bir soru sordu: "Çin'de herkes bana Lao Huang mı diyor?"

Huang Renxun, "buz kırma" sorununun ardından birçok medya meslektaşıyla sohbet etmeye başladı. Kaçınılmaz olarak CPU'yu değerlendirmesi istendi. "Kurnazlık" "Lao Huang", aslında GPU'nun CPU'nun yerini almayacağını, sadece bir hızlandırıcının yerini alacağını, ancak belirli konularda performansın CPU'yu on hatta yüz kat aştığını açıkladı. Ayrıca en mükemmel mimarinin CPU + GPU olduğuna inanıyor. Olay yerinde, NVIDIA'nın genel amaçlı işlemciler yapmayacağına, ancak bazı özel alanlarda nihai GPU performansını elde edeceğine söz verdi.

Huang Renxun, muhabirlerden gelen soruları yanıtlarken çoğu zaman yukarıda gösterilen oturma duruşunu sürdürdü ve bu süre boyunca ara sıra koltukta oturdu. Xinzhiyuan soruyor: Google'ın TPU'su ile Nvidianın Tensor RT 3'ü arasındaki fark nedir? Huang Renxun, bu soruyu duyduktan sonra, belki de daha güçlü bir aura göstermek için kanepeden yanındaki kol dayama yerine oturdu.

Huang Renxun ciddiyetle şunları söyledi: "Öncelikle dünyada yalnızca bir TPU var, o da Google. Yalnızca TensorFlow ve Tensor işleme yapabilir. Ve GPU'muz sadece Tensor işleme yapmakla kalmaz, diğer birçok görevi de yapabiliriz. Örneğin, video kodlama ve kod çözme ve biraz görüntü işleme vb. Hepimiz yapabiliriz. "

Şöyle dedi: "Size bir örnek vereyim. Örneğin, bu sabah gösterdiğim" Game of Thrones "dizisinde, GPU'muz videonun kodunu çözebilir, akıl yürütebilir ve akıl yürütme sonrasında arama yapabilir. GPU, TPU'dan çok daha fazlasını yapabilir. TensorRT3'e sahip olduğumuz için, GPU mimarimiz tamamen esnek ve programlanabilir, bu nedenle Amazon gibi dünyadaki her türlü yapay zeka çerçevesini destekleyebiliriz veya Baidunun Paddle Paddle'ı, Facebookun dokunuşu ve Microsoftun CNTKı. Uzun vadeli bir tahmin yaparsam, aslında derin öğrenme için optimize edilebilen GPU'ların en başarılı olacağına inanıyoruz. "

GPU neden en büyük başarıdır? Huang Renxun, "Bunun nedeni çok esnek olmasıdır. Esnekliğinden dolayı daha fazla pazar fırsatına sahip olacak. Birçok pazar fırsatı nedeniyle, Ar-Ge bütçesi büyük olacak ve tüm ekosistemin parası olacak. Başka bir örnek vermek gerekirse, daha önce kullandığımız aptal tipi telefonları hala hatırlıyor musunuz? Şimdi kimler daha başarılı akıllı telefonlar? Aslında işlevleri açısından görebilirsiniz, bu TPU ve GPU arasındaki karşılaştırma Akıllı telefonun değeri çok yüksek.Akıllı telefon ile aslında sadece telefon işlevi değil, aynı zamanda kamera işlevi de var ve hatta bazı kişiler için bilgisayar gibi, ses kayıt cihazı vb. Olarak da kullanılabiliyor. Ama genel amaçlı bir tip ise daha da zor çünkü pil ömrüne, boyutuna bakmanız gerekiyor, çok büyük olamaz, fiyatı çok yüksek olamaz ve çağrı kalitesi iyi olmalıdır. . Ancak yukarıdaki sorunlar çözülebilirse, evrensel bir cep telefonu kesinlikle daha iyidir. "

Huang Renxun, Xinzhiyuanın ikinci sorusunu yanıtlarken, "Önümüzdeki 5-10 yıl içinde yapay zeka çağında Çinli ve Çinli işletmelerin oynadığı rolü nasıl görebilirim?" Dedi: "Çinin bilgisayar biliminin teknik düzeyi Dünyanın birinci sınıfı. Bence Çin'de, Tencent sadece mükemmel bir Çin İnternet şirketi değil, aynı zamanda dünya çapında bir şirket. Alibaba gibi, aynı zamanda. Baidu, biz onun Çin'de sadece bir arama şirketi olduğunu düşünmüyoruz, öyle Dünya standartlarında bir şirket. Yukarıda bahsedilen Li Feifei aynı zamanda iyi bir arkadaşım. Benim gözümde, onu kesinlikle seçkin bir Çinli AI bilim adamıyla sınırlamıyorum. Bence o dünyanın en iyi AI bilimcisi. Ayrıca Lu Qi gibi Yani, aslında, Çin'deki tüm bilgisayar endüstrisinin teknolojik seviyesi zaten dünya standartlarında, bu yüzden artık belirli bir ülkeyle sınırlı değil.

NVDLA'nın beş özelliğini ayrıntılı olarak açıklayın

Ayrıntılı olarak, bu açık kaynaklı mimari aşağıdaki beş özelliğe sahiptir:

Açık kaynak : Github'da geliştirin ve geliştiricileri katılmaya teşvik edin.

Tam çözüm : Eksiksiz bir Verilog ve C modeli, Linux sürücüleri, test karşılaştırmaları ve test araçları, çekirdek ve kullanıcı modu yazılım ve yazılım geliştirme kitlerine sahip olun. Diğer işletim sistemleri tarafından benimsenmesini kolaylaştırın.

Ölçeklenebilir : Çok çeşitli IoT cihazlarına genişletmek için çok uygundur.

Standart donanım mimarisi : NVIDIA tarafından otomasyon ürünleri ve diğer daha fazla işletme için tasarlanan dünyanın ilk otomatik işlemcisi olan Xavier'e dayanmaktadır.

Derin öğrenme anlayışı : Akıllı, verimli, NVIDIA tarafından desteklenen çok sayıda çözümle çalışmaya hazır.

Derin öğrenme muhakemesinin hesaplama çalışmalarının çoğu matematiksel işlemlere dayanır ve bunların çoğu dört bölüme ayrılabilir: evrişim, etkinleştirme, havuzlama ve normalleştirme. Bu işlemlerin, onları özellikle adanmış donanım uygulamaları için uygun kılan bazı özellikleri vardır: bellek erişim modelleri oldukça tahmin edilebilirdir ve kolayca paralelleştirilebilirler.

NVIDIA® Deep Learning Accelerator (NVDLA) projesi, çıkarımın hesaplama ihtiyaçlarını çözmek için standartlaştırılmış bir açık mimariyi destekler. NVDLA mimarisi hem ölçeklenebilir hem de oldukça yapılandırılabilir. Modüler tasarım esnekliği korur ve entegrasyonu basitleştirir. Standartlaştırılmış derin öğrenme, çoğu derin öğrenme ağının birlikte çalışabilirliğini hızlandırabilir ve makine öğreniminin büyük ölçekte birleşik büyümesini desteklemeye yardımcı olabilir.

NVDLA donanımı, basit, esnek ve güçlü bir çıkarım hızlandırma çözümü sağlar. Çeşitli performans düzeylerini destekler ve daha küçük, maliyete duyarlı Nesnelerin İnterneti (IoT) cihazlarından daha büyük, performans odaklı IoT cihazlarına kadar uygulama yelpazesini kolayca genişletebilir. NVDLA, açık endüstri standartlarına dayalı bir dizi IP çekirdek modeli olarak sağlanacaktır: Verilog modelleri, RTL biçiminde sentez ve simülasyon modelleridir ve TLM SystemC simülasyon modelleri, yazılım geliştirme, sistem entegrasyonu ve test için kullanılabilir. NVDLA yazılım ekosistemi, bir cihaz içi yazılım yığını (kısmen açık kaynaklı sürüm), derin öğrenmeyi içeren yeni modeller oluşturmak için eksiksiz bir eğitim altyapısı ve mevcut modelleri cihazlar tarafından kullanılabilecek bir forma dönüştüren bir ayrıştırıcı içerir. yazılım.

Donanım mimarisi

NVDLA mimarisi iki çalışma modunda programlanabilir: bağımsız mod ve füzyon modu.

1. Bağımsızlık. Bağımsız olarak çalışırken, her işlevsel blok yürütme süresi ve görevler için yapılandırılır ve her blok kendisine atanan görevler üzerinde çalışır (derin öğrenme çerçevesindeki bağımsız katmanlara benzer şekilde). Bağımsız işlem başlar ve biter ve tahsis edilen bloklar, ana sistem belleğinin veya ayrılmış SRAM belleğinin içinde ve dışında bellekten belleğe işlemleri gerçekleştirir.

2. Entegrasyon. Füzyon işlemi bağımsız çalışmaya benzer ancak bazı parçalar boru hatlarına monte edilebilir. Küçük FIFO'lar aracılığıyla birbirleriyle iletişim kurmak yerine bellek döngülerini atlayarak performansı artırın (yani, evrişim çekirdeği verileri düz bir veri işlemcisine aktarabilen tek bir veri noktası işlemcisine aktarabilir, Sırayla çapraz kanal veri işlemcisi).

İş ayrıntılarını görüntülemek için orijinal metni okumak için tıklayın ve katılmanızı dört gözle bekleyin ~

Petrol fiyatları aniden düştü ve tüm Wall Street kelimeye bakıyor, dolar ekonomisi en karanlık ana girebilir
önceki
Süper Lig'in 12. turu, birden fazla antrenör tarafından bir itfa savaşı haline geldi ve dört koç, görevden alınma kriziyle karşı karşıya.
Sonraki
Sahte hyaluronik asit, sahte Moutai, sahte Viagra ... İlgili 500'den fazla kişi Ganzhou polisi tarafından tutuklandı!
BYD'nin süper otomobili "Han", dört motor + 2.9S ile yüz kırdı, Tesla rakibiyle karşılaştı mı?
Zhao Liying ve Feng Shaofeng'in yeni dizileri burada çekildi! Ateşli Jiangnan Eski Kenti, bin yıldır Suhang'dan daha sade.
En Çinli kim | Tang Zhuang bir hanedan rengi yapar
ABD Hazinesinin "Büyük Rotası" gelmek üzere olabilir ve küresel pazarın terör tablosu ortaya çıktı
Şangay Otomobil Fuarı 29372 adım attı! Bu 10 yeni SUV'yi kaçırmayın!
Yine Double 11. Ali'yi kim yaptı?
"Bengio tek kişilik imzalı kağıt" "farkındalık RNN'si" önerir ve 4 sayfayla genel yapay zekaya girer
Çin Yeni Yılı, Tibet'e gitmek için en uygun maliyetli zamandır! Karla kaplı dağların kutsal gölü güzelce köpürüyor ve biletler bedava
8 yaşındaki çocuk çatı penceresine bastı ve düşerek öldü! Annem izledi, bağırmak için çok geç
Lexus'un Şangay Otomobil Fuarı'nda resmi olarak tanıtılan ilk MPV'si Elfa konumunu koruyabilir mi?
Çinli alıcıların ellerinden çıkmasının ardından, Avustralya ekonomisi bir domino fenomeni sergileyebilir ve Kanada bundan muaf olmayabilir
To Top