Japonya'nın Süper Hesaplaması bunu bir adım öteye taşıyor: Fujitsu, Post-K süper bilgisayar işlemcisinin ayrıntılarını açıkladı

Süper bilgisayarlar, verileri hesaplama ve işleme konusunda güçlü bir yeteneğe sahiptir, Ana özellikler, çeşitli harici ve çevresel ekipmanlarla ve zengin, yüksek performanslı bir yazılım sistemiyle donatılmış yüksek hız ve büyük kapasitedir. . Mevcut süper bilgisayarların çoğu saniyede bir trilyondan fazla işleme ulaşabilir. . Bu devasa bilgisayar sistemi temel olarak büyük bilimsel araştırmaları, ulusal savunma teknolojisini ve büyük ölçekli bilgi işlem görevlerini ve ulusal ekonomideki veri işleme görevlerini üstlenmek için kullanılır: büyük ölçekli hava tahmini, uydu fotoğraflarını sıralama, nükleer fizik araştırması, kıtalararası füzeler üzerine araştırma ve uzay aracı Ve benzeri, ulusal ekonomik kalkınma planlarını formüle etmek vb.

2016 yılına kadar Çin'in " Shenwei · Taihu Gölü'nün Işığı "(Saniyede 930 milyon kayan nokta işlemi) ile " Tianhe 2 " Şampiyonu ve ikinciliği kazandı , Üçüncü ila onuncu sıralar Amerika Birleşik Devletleri'nde "Titan", "Sequoia", "Cori", Japonya'da "Oakforest-PACS" ve "Kyo" ve İsviçre'de "Dinter Peak". "Ve Birleşik Devletler'deki" Mila "ve" Trinity ".

Şimdi, süper bilgisayarlar ulusal yüksek teknoloji alanlarında ve en son teknoloji araştırmalarında kullanılıyor , Aynı zamanda bir ülkenin bilimsel araştırma gücünün ve teknolojik gelişme seviyesinin somutlaşmış halidir. .

Süper hesaplama alanında, iyi bilinen bir "İLK 500" listesi vardır. Liste 1993'te başladı ve dünyada kurulu süper bilgisayarların "sıralaması" nın iyi bilinen bir sıralama listesidir. , Amerika Birleşik Devletleri ve Almanya'dan süper bilgisayar uzmanları tarafından derlenen liste, her altı ayda bir yayınlanıyor.

Şekil | (Kaynak: TOP500 resmi web sitesi)

onların arasında, Japonya'nın süper hesaplaması " Pekin " 2011'de ilk 500 liste şampiyonunu kazandı , Fujitsu ve Japonya Fizik ve Kimya Enstitüsü tarafından geliştirilmiştir, 2018 Haziran ayı itibarı ile dünyada 16. sıraya geriledi . Fujitsu, yeni nesil süper bilgisayarlar geliştirmeyi planladığını söyledi ( Kod Post-K ) Küresel süper hesaplama listesinin başına yeniden girin , Performansı mevcut "Pekin" in 100 katı olacak, enerji tüketimi ise sadece üç katı olacak.

Post-K, yeni geliştirilen işlemci A64FX'i kullanacak, mimari ARM'e geçirilecek ve 2021'de piyasaya sürülecek. Bu yıl Silikon Vadisi'nde düzenlenen HotChips konferansında Fujitsu, A64FX işlemcisinin ayrıntılı mimarisini ve performansını açıkladı.

Şekil Fujitsu süper bilgisayar yapılandırması

A64FX, 8.786 milyar transistörden oluşur ve 7nm FinFET işlem teknolojisi kullanılarak üretilmiştir. Arm'ın ölçeklenebilir vektör uzantısını ilk uygulayan olacak (Ölçeklenebilir Vektör Uzantıları / SVE) İşlemci , Bu, yüksek performanslı bilgi işlem için tasarlanmış bir yönerge setidir.

Bu yılın Haziran ayında, Fujitsu işlemcinin prototiplerini üretmeye ve ön testlere başlamaya başladı.Ayrıca CPU'nun bazı temel detaylarını da açıkladı. Çekirdek sayısı (48 hesaplama çekirdeği artı 4 yardımcı çekirdek) ve SIMD vektör genişliği (512 bit) dahil . HotChips konferansında, Fujitsu'nun Toshio Yoshida mikromimarisi ve performans profili hakkında daha derinlemesine bir çalışma gerçekleştirdi.

Şekil | (Kaynak: TOP500 resmi web sitesi)

Hesaplama hızı açısından, ilk SVE Arm çipi olarak, A64FX bazı iyi kayan nokta performans verileri sağlar: 64 bit sistem (FP64) saniyede 2,7 trilyondan fazla kayan nokta işlemi yapabilir, 32 bit sistem (FP32) saniyede 5,4 trilyon işleme ulaşabilir ve 16 bit sistem (FP16) saniyede 10,8 trilyondan fazla işlem gerçekleştirebilir. . Son iki sistem derin öğrenme uygulamaları için özellikle önemlidir.Geleneksel olarak, sinir ağlarını eğitmek için daha düşük hassasiyetli FP32 ve FP16 kullanılır.

A64FX, aynı ağları çıkarmak için kullanılabilen 16 bit (INT16) ve 8 bit (INT8) formatlarında tamsayı nokta çarpım işlemlerini de uygular. Fujitsu, INT8 kullanan yeni CPU'nun saniyede 21.6 trilyondan fazla işleme ulaşabileceğini iddia ediyor. INT16 saniyede 10,8 trilyondan fazla işleme ulaşabilir .

A64FX'in kayan nokta performansı takdir edilmeye değer olsa da, Ancak en gelişmiş Xeon Skylake CPU'dan yalnızca% 35 daha hızlı ve var olmayan Xeon Phi CPU'dan% 20 daha yavaş. . İster Ice Lake Xeon CPU'ları, ister kanıtlanmamış Xeon AP işlemcileri kullanıyor olsun, Intel'in 2021'de Aurora exascale süper bilgisayarı için daha yüksek hızlı CPU'lar üreteceğini hayal etmek zor değil. Öte yandan, Fujitsu şimdi yalnızca A64FX için düşük seviye performans tahminleri sağlıyor ve son yonganın piyasaya sürülmesinden birkaç yıl sonra daha fazla test bilgisinin açıklanacağını ima ediyor.

Kayan nokta işlemlerinin hızı süper bilgisayarlar için her şey olmasa da, bize yüksek ölçekli bilgisayarlar için gereken işlemci sayısı hakkında bir fikir verir. Saniyede 2,7 trilyon kez ihtiyatlı bir tahmin kullanıldığında, zirveye ulaşmak 370.000'den fazla yonga, Linpack veya gerçek kayan nokta yoğun uygulamalarda zirveye ulaşmak 400.000'i alabilir. .

Fujitsu, her Post-K düğümüne yalnızca bir A64FX işlemci yerleştirmeyi planladığından, 400.000 işlemci bilgisayarın düğümleridir. Post-K, raf başına 384 düğüme sahip olacak ve son exascale bilgisayarda bu tür 1.000'den fazla raf gerekli olacaktır. . Önümüzdeki iki yıl içinde çipi geliştirmeye devam ederseniz hesaplama zirvesini tekrar artırabilirsiniz.

Bilgisayarın yüksek performanslı ara bağlantı yeteneklerine sahip olması gerektiğini gösteren çok sayıda işlemci düğümü var. Bu amaçla, A64FX çip üzerinde bir ağ denetleyicisi ile donatılacak, Veriler, "tofu" adı verilen büyük ölçüde paralel bir ara bağlantı ağı aracılığıyla iletilir . Post-K için bu yapı, altı koordinat eksenine sahip 6 boyutlu bir ağ / simit ağı olacaktır: X, Y, Z, A, B ve C. Her işlemci (düğüm), her biri 2 kanal sağlar. Her kanalın saniyede 28000 megabit hızında 10 bağlantı noktası vardır. Her CPU'nun veya düğümün iletim hızı 560000 megabit'e ulaşabilir .

Şekil "tofu" ağı, düğümler arasında nasıl bağlantı oluşturur (Kaynak: IEEE Computer Society)

Post-K'nin bir diğer önemli özelliği bellek bant genişliğidir . A64FX, her CPU için 1024 GB / sn'ye kadar sağlamak için 32 GB'lık paketlenmiş HBM2 bellek kullanır. Fujitsu'ya göre, Stream Triad benchmark testinde 830 GB / sn'yi aşan hızlara ulaşmayı başardılar , İşlemcinin en yüksek bant genişliğinin% 80'inden fazlası . Fujitsu, bu çipin geleneksel DDR belleğe bağlı olup olmadığından bahsetmedi.

Dahili olarak 48 + 4 çekirdek, CMG olarak da adlandırılan dört çekirdek bellek grubuna bölünmüştür. CME, 12 hesaplama çekirdeği ve 1 yardımcı çekirdekten oluşan 13 çekirdeğe sahiptir. CME, G / Ç ve arka plan programı işleme gibi işletim sistemi işlevlerini yönetir. 13 çekirdeğin her biri, 11 TB / sn'yi aşan bir hızda veri aktarabilen 64 KB L1 önbellek ile donatılmıştır. . Ve her CMG, 8MB L2 önbelleğe sahiptir ve çalışma hızı 3,6 TB / sn'yi aşmaktadır. L2 önbelleği, bellek denetleyicisine ve yonga üzerindeki ağ (NoC) arayüzüne bağlanır. NoC, diğer CMG, Tofu ağı ve PCIe denetleyicisine bağlanabilir.

Şekil A64FX çipinin iç yapısı (Kaynak: TOP500 resmi web sitesi)

ortalama olarak A64FX, SPARC64 XIfx'ten daha hızlıdır (Fujitsu'nun önceki yüksek performanslı CPU'su) 2,5 kat daha hızlı , Çeşitli yüksek performanslı bilgi işlem ve yapay zeka iş yükleri için uygundur. Akışkan dinamiği ve sismik dalga yayılımı alanlarında A64FX'in hesaplama hızı, SPARC64 Xifx'ten sırasıyla 3.0 kat ve 3.4 kat daha hızlıdır.

Şekil A64FX'in yüksek performanslı bilgi işlem ve yapay zeka alanındaki performansı (kaynak: TOP500 resmi web sitesi)

Yazılım açısından, Post-K makinesinin müşterisi olan Fujitsu ve Japonya Fizik ve Kimya Enstitüsü, A64FX işlemci ve sistemin kendisi için birlikte yazılım geliştiriyor. Arm tabanlı sistem yazılım ve araçlarının geliştiricisi Linaro ile çeşitli açık kaynak ve bağımsız yazılım geliştiricileri de katılacak. 2021 yılına kadar, Fujitsu'nun Linux, C / C ++ ve Fortran derleyicileri, hata ayıklayıcıları, MPI, OpenMP, matematik kitaplığı, kaynak yöneticisi ve Luster vb. Dahil olmak üzere eksiksiz bir yüksek performanslı bilgi işlem yazılımı bileşenleri seti geliştirmesi bekleniyor. .

Pekin'deki insansız bir market, açıldıktan sonra sadece iki gün içinde şehir yönetimi tarafından araştırıldı.
önceki
Artık "en güçlü" yapraklı yeşillikler soğuk ve daha az yağa neden olabilir ve aynı zamanda mide hastalıklarının da öldürücüsüdür!
Sonraki
Sichuan, bambu endüstrisinin yüksek kaliteli gelişimi için bir "yol haritası" yayınladı
BT liderlerinin boş zamanı nedir?
Çin-ABD ekonomik ve ticari istişarelerinde önemli konularda varılan ilkeli fikir birliğini nasıl anlıyorsunuz?
"Zenginlik yaratmak için bayrağı kaldırın, yeni bir çağa yelken açın" özel ekonomi Sichuan'ın gelişiminde yeni bir bölüm oluşturuyor
"Dolandırıcılığı" ve onun "Apple benzeri" yükselişini tersine çeviren bir İngiliz tek boynuzlu at
Yüksek teknoloji ürünü yeni terimler, yüksek yoğunluklu hükümet çalışma raporuna giriyor
Dünyanın en büyük yolcu uçağı A380 durdurulacak "Big Mac" neden "genç öldü"?
Diamond King ve Lao Wang Xiaochuan: Yapay zeka teknolojiye bağlıdır ve kız arkadaşlar kadere bağlıdır
Kadın Douyin'i vurmak için lüks arabayı durdurdu ve Shenzhen trafik polisinin operasyonu devam etti!
İngiliz medyası, Dünya Kupası'nı 11 güçlü oyuncuyla kaçırdıklarını söyledi: 2 Kings liderliğindeki Real Madrid, Manchester City pişman oldu
4 haftalık erkek bebek, ailesiyle uyurken sıkışarak öldü
MIT'nin en son araştırması: Epitel hücrelerinin kromozom ayrımı sandığınız kadar basit olmayabilir
To Top