Xilinx, yıkıcı yapay zeka muhakeme ürünü VersaL'ı çıkardı! 7nm sürecini kullanarak

Organizatör: Akıllı şeyler, eetrend vb.

Dün düzenlenen Xilinx 2018 Geliştirici Konferansı'nda (XDF), Xilinx CEO'su Victor Peng, sektörde başka bir 7nm çarpıcı ürün çıkardı! Xilinx'in 7nm sürecini temel alan en yeni ACAP platformunun ilk ürünü olan Versal Versal kelimesi çeşitlilik ve çok yönlülük anlamına gelir. Bu, herhangi bir uygulama için AI hızlandırmalı olduğunu iddia eden platform düzeyinde bir üründür. İlk AI çekirdek sürümü piyasaya sürüldü. Ve temel sürüm, takip, amiral gemisi sürümünü, AI RF sürümünü, kenar bilgi işlem sürümünü, HBM sürümünü vb. Başlatacak, bu, çarpıcı olarak tanımlanabilecek başka bir 7nm ürünü olan Huawei Kirin 980, Apple A12'den sonra geliyor.

Victor konuşmasında dünyaya bakıldığında yapay zeka teknolojisinin hızla geliştiğine ve yonga teknolojisinin yapay zekanın gelişimine yetişemediğine dikkat çekti.Yeni algoritmalar, yeni çerçeveler ve yeni senaryolar sonsuz bir akış içinde ortaya çıkıyor.Böyle değişikliklerle başa çıkmak için esnek ve değiştirilebilir bir mimariye ihtiyaç var. Xilinx, bu tür değişikliklere uyum sağlamak için, dört yıl kadar erken bir tarihte, ACAP platformu olan bilgisayar hızlandırma işleminin uyarlanabilir ve esnek uygulanmasına sahip bir platform oluşturmak için "Qomolangma" teknolojisini piyasaya sürdü.

"Yapay zekanın ve büyük verinin patlayıcı gelişimi ve Moore Yasasının yavaşlamasıyla, endüstri kritik bir dönüm noktasına ulaştı. Çip tasarımı döngüsü yeniliğin hızına ayak uyduramadı. Versal, 4 yıllık geliştirmeden sonra endüstrinin ilk ACAP'sidir. Ürünler. Optimize edilmiş yazılım ve donanım aracılığıyla genel uygulamalarını hızlandırmak için her türden geliştiriciyi desteklemek ve aynı zamanda teknolojinin hızlı gelişimine ayak uydurmak için anında esnekliğe sahip olmak için onları benzersiz bir şekilde tasarladık.Sektörde talep En acil an ACAP'nin zamanında yardım olduğu söylenebilir. Diye vurguladı.

Toplantıdan sonra medya, Xilinx CEO'su Victor Peng ve diğer yöneticilerle röportaj yaptı ve Xilinx'in kendi AI çip çözümlerini başlatmak için Huawei ve Alibaba'yı (her ikisi de Xilinx müşterileri) nasıl gördüğüne ve Xilinx'in Çin yapay zeka pazarında nasıl olduğuna odaklandı. Genişletme ve diğer sorular cevaplandı.

1. 7nm işlem üzerine kurulu 6 Versal yonga, AI akıl yürütme performansı GPU'dan 8 kat daha yüksektir

Xilinx'in bugün Çin'de sergilediği yeni Versal serisi yongalar, yeni 6 serisi yongalar da dahil olmak üzere TSMC'nin 7nm sürecini temel alacak. Bugün, Xilinx CEO'su Victor Peng esas olarak AI Core çekirdek serisini ve Versal Prime temel serisini tanıttı. , Bu iki yeni ürün bu yıl çekilecek ve şu anda deneme için açık ve 2019'un ikinci yarısında büyük ölçekte resmi olarak piyasaya sürülecek.

Xilinx AI Core çekirdek serisi, yüksek performansa ve düşük gecikmeye odaklanan, bulutu ve ağı hedefleyen, Arm mimarisine dayalı, AI çıkarımı ve gelişmiş sinyal işleme için optimize edilmiş 128-400 AI motoru sağlayan 5 ürün içerir. Otonom sürüş ve diğer teknolojiler optimize edildi.

Xilinx verilerine göre, AI Core çekirdek serisi ürünlerin AI çıkarım performansı NVIDIA Tesla V100 GPU'nunkinden 8 kat daha yüksek olacak.

Versal Prime temel serisi, yine Arm mimarisine dayanan, her iş yükünün bağlanabilirliği ve çevrimiçi hızlanması için optimize edilmiş 9 ürün içerir ve birden çok farklı pazar için uygundur.

AI Core çekirdek serisi ve Versal Prime temel serisi ürünlere ek olarak, Versal serisi yonga setleri ayrıca AI Edge edge serisi, AI RF radyo frekansı serisi ve Versal Prime temel serisi, Versal Premium amiral gemisi serisi ve HBM serisini içerir.

Victor aynı zamanda, en düşük seviyeli Versal serisi yongalar, yeni bir birleşik yazılım geliştirme ortamı, belirli bir uygulama odaklı mimari ve kullanıcı odaklı C / C ++ / Python desteği dahil olmak üzere Xilinx'in geliştirici platformunu da gösterdi. Xilinx yazılım programlama araçlarıyla ilgili daha fazla ayrıntı gelecek yıl yayınlanacak.

2. Sabit çipler yalnızca birkaç alan için uygundur ve daha esnek çözümler daha popüler olacaktır

Kısa bir süre önce, hem Alibaba hem de Huawei bulut veri merkezi AI yongaları için planlarını duyurdu ve Huawei doğrudan ilk bulut AI yongası "Rising" i piyasaya sürdü. Tesadüfen bugün, hem Huawei hem de Ali'nin FPGA teknoloji liderleri Xilinx müşteri temsilcileri olarak konuşma yapmak için Xilinx'e geldi.

Xilinx CEO'su Victor Peng, Zhishi'ye, bu kadar çok teknoloji devinin yapay zeka çipleri üretmesinin sebebinin, devrimin ilk aşamalarında yapay zekanın özelliği olduğunu söyledi.Farklı endüstriler farklı çözümler arıyor.

ACAP, tüm GPU'ların ve ASIC'lerin yerini almayacak, ancak gelecekte sabit yongaların (ASIC'ler gibi) rol oynayabileceği yalnızca birkaç sektör olabilir ve gelecekte çoğu senaryo için genel ve esnek platformlar gerekli olacaktır.

Çin'in mevcut sıcak yapay zeka pazarına gelince, Victor Peng, Çin pazarındaki yapay zeka inovasyon hızının çok heyecan verici olduğuna inanıyor. Şu anda, Çin'de, yeni teknolojiler ortaya çıkıyor ve yeni ürünler çok hızlı bir şekilde piyasaya sürülüyor ve Xilinx ürünlerinin esnekliği, yalnızca Çinli yapay zeka kullanıcılarının çip yineleme hızıyla sınırlı değil, daha hızlı inovasyon yapmasına izin vermiyor (1- 2 yıl).

3. CPU'dan 90 kat daha güçlü olan Alveo U250 hızlandırıcı kartını itin

Ek olarak, Xilinx, 8.995 $ 'dan başlayan ve bugün satışa sunulan, Xilinx UltraScale + FPGA'lara dayanan 16nm veri merkezi ve AI hızlandırıcı kartları Alveo U200 ve U250'yi piyasaya sürdü.

Xilinx verilerine dayalı olarak, makine öğrenimi açısından, Alveo U250'nin gerçek zamanlı çıkarım hızı, üst düzey CPU'lardan 20 kat daha fazladır. Üst düzey GPU'larla (NVIDIA Tesla V100 gibi) karşılaştırıldığında, 2 nm'nin altındaki düşük gecikmeli uygulamaların performansını 4 kattan fazla artırabilir. .

Veritabanı araması gibi bazı uygulamalarda, Alveo U250'nin performansı CPU'ya göre 90 kattan fazla geliştirilebilir.

Dördüncüsü, yeni nesil ACAP mimarisi: araştırma ve geliştirme 4 yıl sürdü, 1 milyar ABD doları yatırım yaptı

ACAP ("A-CAP" anlamına gelir), tam adı Adaptive Compute Acceleration Platform olup, bu yıl Mart ayında Xilinx tarafından başlatılan "Adaptive Compute Acceleration Platform" olarak çevrilir.

Bu, donanım katmanını çeşitli uygulamalı iş yüklerinin ihtiyaçlarına göre esnek bir şekilde değiştirebilen son derece entegre, çok çekirdekli, heterojen bir bilgi işlem platformudur. Bu yeni mimari, Xilinx tarafından 4 yılda 1500 mühendis kullanılarak ve araştırma ve geliştirmeye 1 milyar dolardan fazla yatırım yapılarak geliştirildi.

ACAP'ın çekirdeği, dağıtılmış bellek ve donanımla programlanabilir DSP modüllerini, çok çekirdekli bir SoC'yi ve bir veya daha fazla yazılım programlanabilir ve donanım esnek hesaplamayı birleştiren, hala ARM mimarisini kullanan yeni nesil FPGA mimarisidir. Motorların tümü yonga (NoC) üzerinden ağ üzerinden birbirine bağlıdır.

Bu yılın Mart ayında piyasaya sürüldüğünde, Xilinx CEO'su Victor Peng bir keresinde ACAP'ı "Xilinx'in FPGA'nın icadından bu yana en önemli mühendislik başarısı ve önümüzdeki 5-10 yıl içinde piyasada önemli bir ürün haline gelecektir."

V. Versal derinlemesine sır

Xilinx ürün ve teknoloji pazarlamasının üst düzey teknik direktörü Kirk Saban, daha sonraki bir konuşmasında yapay zekanın uygulama ortamını değiştirebilecek bu ürünü ayrıntılı olarak açıkladı.

Röportajda, dağınık ve düzensiz bir veri birikimi çağında olduğumuz belirtildi: Bir mimari veri işlemeyi tek başına tamamlayamaz ve heterojen hesaplama gerektirir.

Son 40 yıldaki yarı iletken geliştirme geçmişi perspektifinden bakıldığında, hesaplama motoru CPU'su büyük zorluklarla karşılaşan "süreç ölçeklendirme" teknolojisi geliştirme yolunu basitçe benimser. Aynı miktarda hesaplama iyileştirmesi ve yarı iletken süreç değişikliği yoluyla aynı miktarda performans iyileştirmesi elde etmek zordur. Bilgi işlem motorunu paralel bir trend olmaya zorlamak.

"Moore Yasası'nın sona ermesinden sonra, CPU'lar ve GPU'lar gelecekteki eğilimlere adapte olmadılar. NV'nin yeni ürünleri yalnızca en yüksek hesaplama değerlerine sahip. Örneğin, en son T4'ün P4'ten 16 kat daha güçlü olduğu iddia ediliyor, ancak gerçek performans artışı yalnızca yaklaşık 2,5 kat, bu nedenle yeni bir mimariye ihtiyacımız var. "Kirk işaret etti.

Bu nedenle, yarı iletken endüstrisi şu anda, bazıları başlangıçta özel alanlarda dahil olmak üzere alternatif mimarileri araştırmaktadır, ancak bu mimarilerin kendi avantajları ve dezavantajları vardır En iyisi kim?

1. Skaler işleme (örneğin, CPU), farklı karar ağaçları ve çok sayıda kitaplık içeren karmaşık algoritmalarda çok etkilidir, ancak performans ölçeklendirme açısından sınırlıdır.

2. Vektör işleme öğeleri (örneğin, DSP, GPU) daha dar paralelleştirilebilir hesaplama işlevleri kümesinde daha etkilidir - ancak esnek olmayan bellek hiyerarşisi, gecikme ve güç tüketimi artışı nedeniyle,

3. Programlanabilir mantık (örneğin, FPGA), belirli hesaplama işlevleri için hassas bir şekilde özelleştirilebilir, bu da gecikmeye duyarlı gerçek zamanlı uygulamalarda (örneğin, araba sürücüsü yardımı) ve düzensiz veri yapılarında (örneğin, genom sıralaması) en iyi performansı göstermesini sağlar. -Ama algoritması = derlenmesi birkaç saat sürüyor, ki bu çok uzun!

Kirk, Xilinxin yeni heterojen bilgi işlem mimarisi olan Adaptive Computing Acceleration Platform'un (ACAP), her mimarinin avantajlarını birleştirdiğini ve yeni nesil programlanabilir mantıkla yakından bağlantılı en iyi birinci sınıf vektör toplamını sağladığını söyledi. Tümü yüksek bant genişliğine sahip yonga üzerinde ağ (NoC) ile entegre olan skaler işlem öğeleri (PL), üç işleme türünün hepsine bellek eşlemeli erişim sağlayabilir. Herhangi bir tek mimariye kıyasla, bu sıkı bir şekilde bağlı hibrit mimari, şaşırtıcı özelleştirme ve performans iyileştirmeleri sağlayabilir!

"Günümüzde geliştiriciler, yazılım programlanabilirliğine, geniş bir uygulama yelpazesini karşılayacak performansa ve hızlı yeniliğe uyum sağlama esnekliğine ihtiyaç duyuyor. Ürünlerimiz geliştiricilerin bu üç ihtiyacını karşılayabilir." Dedi. "Programlanabilir yazılım aracılığıyla çeşitli yükler için esnek destek sağlama ve performansta önemli bir artış elde etme."

Xilinx ACAP blok şeması

Raporlara göre, Versal tamamen yazılımla programlanabilir ve günümüzün en hızlı FPGA'sından 100 kat daha hızlı olan 20 kata kadar önemli bir performans artışı sağlayabilir! Versal ürün portföyü, en zorlu uygulamalar için endüstri lideri performans, bağlantı, bant genişliği ve entegre özellikler sağlayan Versal Prime serisini, Versal amiral gemisi serisini (Versal Premium amiral gemisi) ve HBM serisini içerir. Ek olarak, ürün portföyünde çığır açan bir AI motoru kullanan AI Core serisi (AI Core), AI Edge serisi (AI Edge) ve AI RF serisi (AI RF) de bulunur.

AI motoru, çeşitli uygulamalarda düşük gecikmeli AI çıkarımının yeni gereksinimlerini karşılamak için tasarlanmış yeni bir donanım modülü türüdür.Ayrıca, kablosuz ve radar uygulamalarının gereksinimlerini karşılamak için gelişmiş DSP uygulamalarını da destekler. Genel uygulama hızlandırmayı desteklemek için Versal uyarlanabilir donanım motoruyla yakından entegre edilmiştir, bu da hem yazılım hem de donanımın en yüksek performans ve verimliliği sağlayacak şekilde ayarlanabileceği anlamına gelir.

Bugün Versal Prime serisi ve Versal AI Core serisi.Sektör lideri GPU'larla karşılaştırıldığında, AI çıkarım performansının 8 kat artması bekleniyor.

VERSAL AI çekirdek serisi

Versal AI çekirdek serisi, serinin en yüksek bilgi işlem performansını ve en düşük gecikmeyi sunarak çığır açan yapay zeka çıkarım işlem hacmi ve performansı sağlar. Bu seri, bulut, ağ ve otonom sürüş teknolojileri için optimize edilmiştir ve sektörün en kapsamlı yapay zeka ve iş yükü hızlandırma işlevlerini sağlar. Versal AI çekirdek serisinde 128 ila 400 AI motoru sağlayan 5 ürün bulunur. Bu seri, çift çekirdekli Arm® Cortex -A72 uygulama işlemcisi, çift çekirdekli Arm® Cortex -R5 gerçek zamanlı işlemci, 256KB yonga üzerinde ECC bellek ve yüksek hassasiyetli ve düşük gecikmeli kayan nokta işlemleri için optimize edilmiş 1.900'den fazla DSP motorunu içerir. Ayrıca, herhangi bir motor tarafından doğrudan erişilebilen 1,9 milyondan fazla sistem mantık birimi ve 130Mb'den fazla UltraRAM, 34Mb'ye kadar blok RAM ve 28Mb dağıtılmış RAM ve 32Mb yeni hızlandırıcı RAM bloğu içerir.Bu ayrıca Versal AI serisine özgüdür. Her yerde ve özel bellek mimarisini destekleyebilir. Seri ayrıca PCIe® Gen48 ve 16 kanal ve CCIX ana bilgisayar arabirimi, gücü optimize edilmiş 32G SerDes, 4 adede kadar entegre DDR4 bellek denetleyicisi, 4 adede kadar çok hızlı Ethernet MAC, 650 yüksek performanslı I içerir. / O (MIPI D-PHY için), NAND, depolama düzeyinde bellek arabirimi ve LVDS, 78 çoklanmış G / Ç (harici bileşenleri bağlayarak) ve 40'tan fazla HD G / Ç (3,3 V arabirim). Yukarıdaki tüm aygıtlar, endüstrinin birinci sınıf yonga ağı (NoC) aracılığıyla birbirine bağlanır, 28 adede kadar ana / bağımlı bağlantı noktasıyla, düşük gecikmeyle saniyede birden çok Tb bant genişliği sağlar ve yüksek güç verimliliği ve yerel yazılım programlanabilirliği sağlar. Tam ürün listesi artık mevcut.

VERSAL PRIME serisi

Versal Prime serisi, çok sayıda pazardaki geniş bir uygulama yelpazesi için dikkatlice tasarlanmış ve çeşitli iş yüklerinin bağlanabilirliği ve çevrimiçi hızlandırılması için optimize edilmiştir. Bu orta sınıf seri, her biri çift çekirdekli Arm® Cortex-A72 uygulama işlemcileri, çift çekirdekli Arm® Cortex-R5 gerçek zamanlı işlemciler, 256KB yonga üzerinde bellek (ECC ile) ve 4000'den fazla düşük zaman için ayrılmış 9 ürünü içerir. Yüksek hassasiyetli kayan nokta işlemleri için optimize edilmiş DSP motoru. Ek olarak, 200Mb'den fazla UltraRAM, 90Mb'den fazla blok RAM ve özelleştirilmiş bellek mimarisini destekleyebilen 30Mb dağıtılmış RAM ile birleştirilmiş 2 milyondan fazla sistem mantık birimi içerir. Seri ayrıca PCIe® Gen48 kanallı ve 16 kanallı ve CCIX ana arabirimi, gücü optimize edilmiş 32 Gb / sn SerDes ve ana akım 58 Gb / sn PAM4 SerDes, 6 adede kadar tümleşik DDR4 bellek denetleyicisi, 4 adede kadar içerir Çok hızlı Ethernet MAC, 700 yüksek performanslı G / Ç (MIPI D-PHY desteği), NAND, depolama düzeyinde bellek arabirimi ve LVDS, 78 çoğullamalı G / Ç (harici bileşenleri bağlayın) ve 40'tan fazla HD I / O (3.3V arayüzü). Yukarıdakilerin tümü, endüstrinin birinci sınıf yonga ağı (NoC) aracılığıyla birbirine bağlanır, 28 adede kadar ana / bağımlı bağlantı noktasıyla, düşük gecikmeyle saniyede birden çok Tb bant genişliği sağlar ve yüksek güç verimliliği ve yerel yazılım programlanabilirliği sağlar. Tam ürün listesi artık mevcut.

Kirk, Xilinx'in gelecekteki hedefinin, Versal'ı milisaniyeler içinde yeniden yapılandırılabilir hale getirmek için programlanabilir yazılım kullanarak, eksiksiz işlev anahtarlama ve yük senaryoları için hesaplama hızlandırma elde ederek makine öğrenimini kolaylaştırmak olduğunu söyledi. "AI motorumuz da optimize edildi. AI'nın çekirdek sürümü, farklı senaryoları desteklemek için farklı AI uygulamaları için farklı AI motorlarına sahip." Victor ayrıca Xilinx'in ACAP platformunun AI teknolojisi nedeniyle sürekli değişen ve ilerleyen bir platform olduğunu söyledi. Geliştirmenin erken aşamalarında hala daha fazla algoritma ve daha fazla çerçeve vardır ve yalnızca değişen mimariler değişen ihtiyaçlara uyum sağlayabilir.

Ayrıca genel amaçlı AI yongalarının doğru yön olmadığına inandığını da belirtti.ASIC, belirli bir CNN veya DNN için optimize edilmiş sabit bir işlevdir.Yeni bir algoritma veya çerçeve olduğunda, yenisine ihtiyaç vardır, ancak şu anda yeni bir çip ile tasarım yapmak imkansızdır. Mevcut gelişme durumu altında, ASIC'ler yakında modası geçmiş olacak. Aslında, Google'ın TPU'su bile modası geçmiş olacak. "Çok az değişikliğin olduğu endüstriler için uygun, ancak hızlı değişmezse değil." Diye vurguladı.

Xilinx'in şu anda erken bir deneme programı aracılığıyla bir takım kilit müşterilerle çalıştığı bildiriliyor. Versal Prime serisi ve Versal AI Core serisi, 2019'un ikinci yarısında satışa sunulacak.

20 yıl önce Bali olarak anılıyordu, ancak Çin'de çok az kişi bunu biliyor ve en hızlı direkt uçuş 3,5 saat.
önceki
Burası dünyanın en büyük limanı! Doğu Liman Şehri'nde son 40 yılda karayolu trafik yönetimindeki değişikliklere bakmak
Sonraki
Hindistan Shu'yu dört gözle bekliyor. Çin sessizce büyük miktarda para enjekte ettikten sonra Hindistan, Çin'in ticaretini araştırmak için baskı yaptı
Motor o kadar kırılgan değil ve kolayca hurdaya çıkmayacak
En iyi dış yardım playoffları kaçırdı mı? Çift MVP çatışmaları ve takımdan ayrılma
Acemiden sonra kalbin dibinden gelen sözler, eski sürücünün hoşgörüsü için teşekkürler
Çin'de ünlülerle karşılaşmak için en kolay şehir olabilir! Bir çömelme, tek doğru!
3 Mutlu! İlerleme Ödülü kazandı + En Değerli Oyuncu Seçimi 4. + FIBA Listesine Gir Abdu, temelde Dünya Kupasına kilitlendi
Yapay zeka çip semineri için sadece birkaç boş yer kaldı, organizatör sizi kayıt olmaya çağırıyor!
Bak! Jingdezhen'in yıllar içindeki gelişimi sadece güzelliğin değerini artırmakla kalmadı, aynı zamanda hafızayı da korudu!
Aurora turu sadece bu sezonun en havalı turu olan aurora'yı izlemek değil, gerçek bir İskandinav turu
Burası bir dalış cenneti. Yerliler Çinlilere "kardeş" diyorlar Neden?
Dünyadaki doğru yol yemektir, Chang'an'da ne zaman el ele vereceksiniz?
Sigortayı yenileyecek araç sahiplerinin dikkatine! Dört tür araba sigortası vardır.
To Top