FPGA'ların ASIC düzeyinde yapay zeka performansına sahipken esnekliği korumaları mümkün müdür?

AI ses asistanı ve AI görüntü optimizasyonu bize en yakın AI uygulamalarıdır.Ancak bu, AI yeteneklerinin yalnızca daha temel bir tezahürüdür.Gelecekte, AI hayatlarımızı şu anda hayal bile edilemeyecek şekilde değiştirecek. Yapay zekanın önemli itici güçlerinden biri olarak, farklı yapay zeka işlemci türleri, yapay zekanın ihtiyaçlarını karşılamaya çalışıyor, ancak yine de yapay zekanın sürekli yinelemeli algoritmalarının ihtiyaçlarını karşılayamıyor. AI yongalarını çevreleyen yenilik bu nedenle sıcak bir nokta haline geldi.

Salı günü, merkezi ABD, Kaliforniya'da bulunan Achronix, yapay zeka ve makine öğreniminin ihtiyaçlarını karşılamak için ASIC çekirdek verimliliğini entegre eden yeni bir FPGA kategorisi başlattı.

AI çiplerinin yeniliğini ne yönlendiriyor?

Yapay zeka geliştirmenin üç ana unsuru hesaplama gücü, algoritmalar ve verilerdir ve bu yapay zeka çılgınlığının yükselişinin temel nedeni, derin sinir ağı algoritmalarının popülaritesidir. Bununla birlikte, AI henüz emekleme aşamasında olduğu için, derin öğrenme algoritmaları yalnızca çeşitli değil, aynı zamanda sürekli yineleniyor. Ek olarak, tam sayı ve kayan nokta türleri ve her veri türünün farklı doğruluğu da dahil olmak üzere veri türleri çok çeşitlidir ve bu da çipin çok yönlülüğü için gereksinimleri ortaya koyar.

Yapay zeka işlemcilerin donanım zorlukları

Bununla birlikte, çipin çok yönlülüğü, hesaplama gücünde en üst noktaya ulaşmanın zor olduğu ve farklı veri türleri ve hassasiyetlerin işlemcinin performansı için farklı gereksinimleri olduğu anlamına gelir.Bilişim gücü ve çok yönlülük gereksinimlerini aynı anda karşılamak istiyorsanız, yarı iletken üretim süreci Promosyon en doğrudan yöntemdir. Geçtiğimiz 30 yılda Moore Yasası, hesaplama gücünde önemli bir artış sağlamıştır.Yarı iletken üretim süreçleri mikrometreden nanometreye kadar uzanmaktadır. Günümüzün bilgisayar işlem hızları da petafloplara (1015 FLOPS) ulaşabilmektedir.

2018'de 10nm ve 7nm yongalar toplu olarak üretildi, ancak CMOS cihazlarının yanal boyutu birkaç nanometreye yakın ve kalınlık yalnızca birkaç atomik katmandan oluşuyor.Transistör yoğunluğunu artırma ve işleme performansında önemli bir gelişme sağlama sürecine güvenmeye devam etmek teknik olarak zordur. Giderek daha yüksek maliyetler, giderek daha fazla çip şirketinin cesaretini kırdı.

Yarı iletken işlemine ek olarak, hesaplama gücü belirli bir seviyeye ulaştığında, belleğe erişim hızı, veri tüketen hesaplama bileşenlerinin hızına yetişemez ve ek bilgi işlem bileşenleri tam olarak kullanılamaz. Von Neumann mimarisinin bu darboğazı (bellek duvarı) da engellemektedir. AI çip hesaplama gücü artar.

Açıkçası, Sürekli yinelenen algoritmalar, farklı AI modellerinin veri türü gereksinimleri ve sürekli artan veri hacimlerinin tümü, AI algoritmaları taşıyan AI çiplerinin sürekli yenilenmesini teşvik eder.

FPGA, ASIC ile nasıl birleşir?

Şu anda, CPU, GPU, FPGA ve ASIC, geniş anlamda AI çipleri olarak kabul edilmektedir. CPU'dan ASIC'e, çipin çok yönlülüğü azalır, ancak performans artar.Bunların arasında GPU, paralel hesaplamanın avantajları sayesinde en başarılı AI haline geldi. yonga. Birçok AI çip şirketi tarafından ASIC çip doğrulaması için ilk tercih olan FPGA, AI çip pazarında da belirli bir konuma sahiptir, ancak maliyet, büyük ölçekli uygulamalarda karşılaştığı zorluktur.

Achronix Semiconductor Başkanı ve CEO'su Robert Blake

Bu noktada hem ASIC performansına hem de FPGA esnekliğine sahip bir AI işlemci varsa, çok rekabetçi bir ürün olmalı, ancak birden fazla zorluğu çözmesi gerekiyor. Achronix Semiconductor Başkanı ve CEO'su Robert Blake, Lei Feng.com ve diğer medya ile yaptığı röportajda şunları söyledi: "Yeni piyasaya sürülen Achronix Speedster7t, yepyeni bir 'FPGA +' yonga kategorisi sağlayan esnek FPGA teknolojisi ve ASIC çekirdek verimliliğinin bir kombinasyonudur. Dört mimari neslinin donanım ve yazılım geliştirmesine ve ayrıca müşterilerle yakın işbirliğine dayanan inovasyonumuzu ve birikimimizi temsil ediyor. "

Robert, bu yeni ürün için üç yıl önce planlamaya başladıklarını da belirtti: Planlama sürecinde mühendislik ekibi tüm FPGA mimarisini yonga üzerinde işleme, ara bağlantı ve harici giriş ve çıkış arayüzlerini (I / O) dengeleyerek tamamen yeniden inşa etti. Veri yoğun uygulamaların iş hacmini en üst düzeye çıkarmak için, uç ve sunucu tabanlı AI / ML, ağ işleme ve depolama gibi yüksek bant genişliği gereksinimleri olan uygulamalar için uygundur.

Mimari iyileştirmeler, FPGA'leri AI hesaplama için daha uygun hale getirir

FPGA'nın ASIC düzeyinde performansa sahip olması için, öncelikle hesaplama gücünü artırması gerekir. Daha önce belirtildiği gibi, gelişmiş yarı iletken teknolojisi, işlemci performansının iyileştirilmesi için kritik öneme sahiptir, bu nedenle Speedster7t, TSMCnin 7nm FinFET sürecini kullanır. 7nm işleminin bant çıkışı maliyetinin çok yüksek olduğunu biliyoruz Bu, bu 7nm FPGA + 'nın yalnızca bulut pazarı için olduğu anlamına mı geliyor? Robert Leifeng.com'a, ister yapay zeka eğitimi ister çıkarım olsun, üst düzey uygulama pazarında, performans ve gecikme gereksinimlerinin 7nm teknolojisi gerektiren çok yüksek olduğunu söyledi. Elbette buluta ek olarak, farklı uygulamaların ve farklı pazarların yenilenmesini karşılamak için uç pazar için daha küçük ve daha düşük maliyetli ürünlere sahip olacağız.

Yarı iletken süreci açıklığa kavuşturulduktan sonra, FPGA'lar derin öğrenme algoritmalarına uygun olacaksa, mimari iyileştirmelere hala ihtiyaç vardır. Robert, geleneksel DSP tabanlı FPGA hesaplama birimi tasarımının DSP, LUT'lar ve depolama birimlerinin ayrık olduğunu ve kablolamanın performansını sınırladığını söyledi. Yapay zeka modelinin farklı sayısal doğruluğunu verimli bir şekilde desteklemekle kalmayıp, aynı zamanda ek mantıksal depolama kaynaklarını da tüketir. .

"Benim benimsediğimiz yöntem, geleneksel mimariyi geliştirmek ve dizi tabanlı, çok-biriktirmeli bir hesaplama mimarisi kullanan MLP birimini tasarlamaktır. Her bir çok-biriktirme birimi (MAC), yapılandırılabilir hesaplamalar elde etmek için 32'ye kadar çarpanı destekler. MLP birimi, sırasıyla kayan nokta ve tamsayı verileri için MAC'yi entegre eder ve 4 ila 24 bit tam sayı formatını ve verimli kayan nokta modunu destekleyebilir.Ayrıca, hesaplama birimi ve önbellek birimi, daha karmaşık algoritmalar elde etmek için yakından ilişkilidir. Ayrıca, verilerin 750 MHz'lik en yüksek performansla MLP'ye iletilmesini sağlamak için karmaşık kablolama kullanmaya gerek yok. Dedi Robert.

Robert dedi, MLP'nin etkinliği, geleneksel FPGA'dan 5 kat daha yüksektir. Bu FPGA, saniyedeki trilyon işlem sayısına (TOPS) bağlı olabilir. Algoritma sürekli değişiyor, ancak temel gereksinimler aynı: Algoritma nasıl değişirse değişsin gereksinimlerin karşılanabilmesi için iyi bir donanım alt katmanı oluşturmayı umuyorlar.

Yonga üzerinde ağ ile veri sorunlarını çözün

Bilgi işlem gücündeki artış, MAC artırılarak elde edilebilir, ancak bilgi işlem gücündeki artıştan sonra, veri aktarımının zorluğunun çözülüp çözülemeyeceği, AI işlemcisinin nihai performansını belirler. Raporlara göre Speedster7t cihazı, GDDR6 belleğini destekleyen ve 8 GDDR6 denetleyiciye kadar destekleyebilen, 4 Tbps GDDR6 kümülatif bant genişliğini destekleyebilen ve HBM'ye eşdeğer depolama bant genişliğini HBM'nin yarı maliyetine sağlayabilen tek FPGA'dır.

Ayrıca Speedster7t, 1'den 112 Gbps'ye kadar hızlara ulaşabilen 72 adet yüksek performanslı SerDes'e sahip.Robert, silikon ile doğrulandıklarını vurguladı. Ayrıca ileri hata düzeltmeli (FEC) bir donanım 400G Ethernet MAC'a sahiptir, 4x 100G ve 8x 50G yapılandırmalarını destekler ve her denetleyicide 8 veya 16 kanallı PCI Express Gen5 denetleyicileri bulunur. Achronix, 400G Ethernet verilerinin işleme ihtiyaçlarını karşılamak için verileri paralel işlemeye bölme yöntemini kullanır.

Ancak, bu en gelişmiş ve daha büyük bant genişlikleri yalnızca yonga ve harici veri alışverişini çözebilir ve yonga içindeki veri verimliliğinin iyileştirilmesi anahtardır. Bu, çip üzerinde yüksek bant genişliğine sahip iki boyutlu ağ (NOC) olan Achronix'in bu yeni ürün mimarisinin bir başka önemli yeniliğidir. Robert, FPGA mantık dizilerini kapsayan ve dikey olarak yayabilen NOC'yi kentsel bir cadde sistemindeki bir otoyol ağıyla karşılaştırıyor. NOC'deki her satır veya her sütun, 2Ghz'de çalışan ve her yönde 512 Gbps veri akışı sağlayan iki 256-bit, tek yönlü, endüstri standardı AXI kanalı olarak uygulanabilir.

Ayrıca, özel iki boyutlu NOC'nin yüksek hızlı veri hareketini büyük ölçüde basitleştirdiğini ve veri akışının tüm FPGA yapısındaki herhangi bir özel işleme motoruna kolayca yönlendirilebileceğini belirtti. En önemlisi, NOC, veri akışlarını FPGA boyunca taşımak için geleneksel FPGA'ların programlanabilir yönlendirme ve mantık arama tablosu kaynaklarını kullandığı tıkanıklığı ve performans darboğazlarını ortadan kaldırır. Speedster7t FPGA'nın toplam bant genişliği kapasitesini artırmakla kalmaz, aynı zamanda güç tüketimini azaltırken etkin LUT kapasitesini de artırabilir.

Yapay zeka çağında donanımın yanı sıra yazılım ve donanımın önemi daha fazla önemsenmiştir. Robert'a göre, Achronix'in yazılım ve donanıma benzer yatırımları vardır ve şirket kurulduğunda en büyük avantajı yazılım teknolojisiydi ve bu da günümüzde üst düzey konfigürasyonlara ulaşabilmelerinin önemli bir nedenidir.

Ancak Robert, temeldeki yazılımın çok önemli olduğunu vurguladı: NOC yazılımı iyi yapılmazsa, gerçek iyileştirmeler elde etmenin zor olacağını söyledi. Şu anda, Speedster7t için ACE tasarım aracımız artık destek sağlayabilir.Bu yılın üçüncü çeyreğinde, TensorFlow ve Caffe2 gibi çerçeve AI modellerini çiplerine dönüştürmek için araçlar yayınlayacağız. Değerlendirme için ilk cihaz grubu ve geliştirme kurulları 2019'un dördüncü çeyreğinde satışa sunulacak.

Ayrıca, güvenlik açısından, Speedster7t FPGA serisinin en gelişmiş bit akışı güvenlik koruma fonksiyonu ile ele alınabileceği anlaşılmaktadır. Ürün parti desteği açısından, Achronix, Speedster7t FPGA'da Speedster7t FPGA'dan ASIC'e sorunsuz dönüşümü destekleyebilen Speedcore eFPGA IP'de kullanılan teknolojinin aynısını kullanır. Ayrıca, Speedster7t FPGA'yı ASIC'e dönüştürmek için Speedcore eFPGA IP kullanırken, kullanıcıların güç tüketiminden% 50'ye varan oranda tasarruf etmesi ve maliyetleri% 90 oranında azaltması beklenir.

Yapay zeka yarışmasını hangi işlemci kazanacak?

Güç tüketimi ve maliyet önemli ölçüde azaltılabildiğine göre, bu Achronix'in yeni FPGA + 'nın AI yongalarının ana akımı olacağı anlamına mı geliyor? Robert, her bir CPU, GPU, FPGA ve ASIC çip türünün kendi teknik avantajlarına sahip olduğunu ve AI çipleri pazarının büyüdüğünü ve tüm çip türlerinin bundan yararlanacağını söyledi. Sadece FPGA'lara bakıldığında, pazar araştırma şirketi Semico Research'ün tahminlerine göre, FPGA'lerin yapay zeka uygulamalarındaki pazar büyüklüğü önümüzdeki 4 yıl içinde üçe katlanarak 5,2 milyar ABD dolarına ulaşacak.

Ancak bazı insanlar, AI algoritmalarının olgunlaşmasıyla birlikte, piyasanın gelecekte ihtiyaç duyduğu şeyin en çok yönlü ve adanmış AI işlemcisi olduğunu ve FPGA'lerin avantajlarını kaybedeceğini düşünüyor. Bu bağlamda Robert, AI'nın gelişmesiyle birlikte yongaların bazı değişikliklere uğradığını ve ASIC'lerin de bazı programlanabilir yeteneklere ihtiyaç duyduğunu ve şimdi FPGA'lara ASIC nitelikleri eklediğimizi, bu nedenle gelecekte FPGA'lerin ve ASIC'lerin artık olmayabileceğini söyledi. Geleneksel tanım.

Ayrıca FPGA avantajlarını hangi pazarda gösterecek? Robert, ürünlerinden yola çıkarak FPGA cihazlarının çoğunlukla bulut, ağ hızlandırma ve makine öğrenimi olduğunu ve IP'nin çoğunlukla 5G, otomotiv ve depolama olduğunu belirtti. Tabii ki, performansı ve mimarisi müşteri geri bildirimlerine ve ihtiyaçlarına göre müşteriler için en uygun olan FPGA ürünlerini piyasaya sürmek de gerekiyor.

Leifeng.com Özeti

Bilgi işlem performansının sürekli iyileştirilmesiyle, bellek duvarının darboğazı giderek daha belirgin hale geliyor.Bu koşullar altında, mimari yeniliğin değeri giderek daha belirgin hale geliyor. Tabii ki, bu ileriye dönük ve güçlü teknoloji araştırma ve geliştirme yetenekleri gerektiriyor Pazarda, entegre depolama ve bilgi işlem, depolama önceliği, yeniden yapılandırılabilir ve yeniden yapılandırılabilir mimari gibi bazı mimari yeniliklerin olduğunu görüyoruz.

Achronix, FPGA teknolojisinde iyidir. Yıllarca süren birikimden ve kullanıcı ihtiyaçlarının anlaşılmasından sonra, ASIC seviyesine ulaşmak için FPGA'nın esnekliğini korurken AI performansını optimize etmeyi ve yonga üzerindeki ağ üzerinden veri aktarımı sorununu çözmeyi seçti. Hem bilgi işlem gücü hem de veri iletimindeki yenilikler de rekabet gücünü artırmak için iyi bir seçimdir.

Weishui! Guangzhou'daki en eski ejderha botu üretim üssü olan Xinlong Junshui'yi doğrudan vurdu ve nehre "sıçradı"
önceki
Şiddetli yağmur ve şimşek + 7 galibiyet! Sonra şiddetle tersine döndü! Korkarım bu insanlar bir sonraki Dragon Boat Festivali için tatil yapamayacaklar!
Sonraki
Tencent Auto Union'dan Zhong Xuedan ile röportaj: Pist kalabalık, WeChat arabası pisti nasıl kapıyor?
"Kendi sınıfınıza iyi bakın", bu ilkokul öğrencileri grubu gerçekten iyi bir iş çıkardı
ICRA2019 canlı bir şekilde açıldı, Li Feifei'nin dokunsal ve görsel kendi kendini denetleyen öğrenme robotu grubu en iyi kağıdı kazandı
Endişeli! Shenzhen ayı çocukları, 32. kattaki çatı korkuluğunun kenarına tırmandılar ve "tavuk yeme" oyununu oynamak için atladılar
Zhu Zhengting, Polaris ve diğerleri "Iron Armored Ambition 2" ye katıldı, geleceğin Legion savaşı başlamak üzere
"Sekiz Oğul" ilk olarak ölümcül bir savaşın, Liu Duanduan, Shao Bing ve He Rundong'un birlikte yaşayıp öldüğünü ortaya çıkardı.
Hubei Eyaleti, şiddetli sel kontrol durumunun üstesinden gelmek için büyük ölçekli sel mücadele ve kurtarma tatbikatları düzenledi ve eyaletin yangın kurtarma ekipleri gerçek bir savaş durumuna girdi
Kardeş Hong Kong şampiyonu Chen Farong, Cai Shaofen ve Hong Xin'in dikkatini çekti ve bekar olmak baş suçluydu.
18 yaşında, saygıya tapmak ve yemin etmek için bir Han kostümü giymiş ve Zhuhai, Hong Kong ve Makao'dan gençler yetişkin törenini veriyor.
Da Zhangwei Yalan Dedektörü Cecilia Cheung: Aktrisin kişiliğini ifşa edebilirsiniz, bir anneyi utandırmamalısınız
Guangzhou geçen yıl 60.000'den fazla anlaşmazlıkta arabuluculuk yaptı ve Panyu Bölgesi Tüketici İşleri ve Arabuluculuk Komitesi ve Kişisel Arabuluculuk Stüdyosu açıldı
Üçüncü Yıl Kırsalda Canlandırmayı Okumak "Sayı": "Beyin Tohumları" Müreffeh Endüstri
To Top