Kuru x86! ARM Nova Mimarisi Neoverse N1 sunucu işlemcisi ilk analiz eden

Arm, kısa bir süre önce sunucu pazarı için büyük kahveler arasında tartışmalara neden olan yeni bir yıldız mimarisi olan Neoverse'yi piyasaya sürdü (EETOP tarafından yayınlanan makaleye bakın: Arm'ın iki yeni platform piyasaya sürmesi büyük tartışmaları tetikliyor: x86 ve ARM ile sunucu pazarına kim hakim olabilir?)

Son zamanlarda yabancı medya Anandtech, ARM Neoverse N1 sunucu işlemcisinin daha detaylı bir analizini verdi, performansın nasıl büyük bir sıçrama yaptığını görelim.

(Not: Bu makale Leifeng.com tarafından Anandtech'ten çevrilmiştir)

Mobil cihazların ana bilgi işlem platformu haline geldiği bu çağda, sektöre biraz önem veren herkes ARM'yi duymuştur. Bir teknoloji destekçisi olarak şirket, çeşitli işlemci mimarileri ve temel referans tasarımları sunmaktadır. Temelde günümüzde tüm mobil cihazların temel dayanağı haline gelmiştir. Güç kaynağı ve son 5 ila 7 yıl içinde akıllı telefon ve tablet SoC performansının hızla gelişmesine öncülük etti.

ARM'in hedefleri mobil ve gömülü cihazların çok ötesine uzanıyor. İş açısından bakıldığında, sunucular ve ilgili altyapı gibi üst düzey alanların daha yüksek kar marjları vardır ARM gibi şirketler için bu çok karlı bir pazar.

Bununla birlikte, ARM, mobil ve gömülü cihazlar alanında büyük başarılar elde etmesine rağmen, şimdiye kadar daha yüksek performanslı ürünler alanına dokunamadı.

Geçtiğimiz on yılda, "ARM sunucu ve altyapı pazarında devrim yaratacak" ile ilgili birçok öngörü birbiri ardına ortaya çıktı ve farklı satıcılar bu hedefe ulaşmaya çalıştı ancak önceki nesil ürünler başarılı olamadı. ARM'ın sunucu ekosistemi Sistem ayrıca önemli zorluklarla karşılaştı.

Sunucu alanı, hareketli sonbahar

Geçen yılın ortasında, yepyeni Cortex A76 mimarisi ortaya çıktı, ARM bu konuda büyük umutlar besledi, öyle ki daha sonra önümüzdeki üç yıl için CPU yol haritasını kamuoyuna paylaştı ve PC dizüstü bilgisayarlar alanında Intel ile kafa kafaya rekabet edeceğini duyurdu. Snapdragon 8CX ve diğer ürünlerin piyasaya sürülmesi uzun zaman alacak olsa da, yabancı medya Anandtech, Cortex A76 ile donatılmış ilk mobil cihaz grubunu çoktan aldı ve ARM'nin tüm performans ve verimlilik iddialarını doğruladı.

Yakın zamanda, ARM yeni yıldız mimarisi Neoverse'yi piyasaya sürdü ve yeni nesil işlemci tasarımıyla performansını büyük ölçüde iyileştirmeyi ve sunucu ve altyapı alanlarında rekabet gücünü artırmayı umuyor.

Bu yeni mimariler ARM için önemlidir ve pazarda bir dönüm noktasını temsil ederler: ARM işlemcilerin performansı, Intel ve AMD işlemcilerinkine yakın ve ARM, Intel ve AMD'nin yineleme aralığını büyük ölçüde aşan yıllık% 25-30'luk bir performans artışını sürdüreceğinden emin.

Geçtiğimiz birkaç ay, ARM sunucu ekosistemi için çok heyecan vericiydi. Geçen yılki Hotchips konferansında Fujitsu, şirketin yalnızca SPARC mimarisinden ARMv8 mimarisine geçişini temsil etmekle kalmayıp aynı zamanda ARM mimarisindeki yeni SVE'nin (Ölçeklenebilir Vektör Uzantıları) ilk uygulamasını sağlayan yeni A64FX yüksek performanslı bilgi işlem işlemcisini tanıttı. ) Yonga.

Cavium'un ThunderX2'si de etkileyici bir performans sıçraması yaptı ve yeni işlemcilerini Intel ve AMD ile ilk rekabet eden haline getirdi.

Bir süre önce, sektörün en yüksek performanslı ARM sunucu CPU'su olması beklenen, Huawei tarafından piyasaya sürülen yeni Kunpeng 920 sunucu çipini gördük.

Yukarıdaki üç ürün arasındaki en büyük ortak nokta, her ürünün çeşitli satıcıların ARMv8 mimari lisansına dayalı özelleştirilmiş mikro mimariler uygulama çabalarını temsil etmesidir. Bu aslında bir soruyu gündeme getiriyor: ARM'nin kendi sunucusu ve altyapı pazarı planları nedir?

Bu sefer, yeni Neoverse N1 platformunu ayrıntılı olarak tanıtacağız.Önümüzdeki birkaç yıl içinde ARM'ın altyapı stratejisinin çekirdeği olacak ve başlangıçta sunucu ekosistemini gerçekleştirecekler.

Neoverse N1 CPU: tavizsiz performans

Neoverse N1 platformunun çekirdeği Neoverse N1 CPU'dur, yani CPU markası platform markası ile aynı isme sahiptir. ARM tarafından açıklanan platform yalnızca CPU çekirdeği değil, aynı zamanda çevreleyen ara bağlantı IP'sidir, böylece tüm sistem çok çekirdekli bir sisteme genişletilebilir.

Neoverse N1 platformu ve CPU, ARM'nin sunucu ve altyapı pazarı için tasarlanmış ilk özel bilgi işlem IP'sini temsil eder. Bu, tüketici ürünleri ve endüstri çözümleri için aynı CPU IP'sini sağlayacak olan geçmiş IP ürünlerinde yapılan büyük bir değişikliktir. Bu IP aileleri arasındaki yeni teknolojik farklılıklar, ARM'ın yeni altyapı hedef ürünleri için yeni bir pazarlama adı benimsemesini sağladı ve bu nedenle Neoverse markası doğdu ve tüketici odaklı Cortex CPU markasından farklılaştı.

Neoverse N1 platformu, ARM Austin Tasarım Merkezi'nin "İkinci Nesil Austin Ailesi" nin ilk yinelemesini temsil ediyor. Neoverse N1 başlangıçta Cortex A76'ya karşılık gelen sunucu işlemci çekirdeğini temsil eden "God of War" olarak adlandırıldı. Aynı zamanda Austin ekibi, ikinci yineleme için gerekli olan Zeus mimarisinin tasarımını tamamlamış olabilir; daha sonra Poseidon mimarisi ailenin son yinelemesi olacak ve ardından batonu Fransız Sofia ekibi tarafından tasarlanan bir sonraki mimarlık ailesine aktaracak. .

Neoverse N1, Cortex A76 mimarisinin kardeşi olduğundan, iki çekirdek arasında doğal olarak pek çok benzerlik var. Cortex A76 mimarisini geçen yıl detaylı olarak tanıttık.Bu tasarım detayları Neoverse N1 için de geçerli. İkisinin altyapı kullanım durumlarına uyum sağlamada sadece bazı farklılıkları var.

Üst düzey tasarım hedefleri açısından, ARMün hedefleri oldukça basit görünüyor: Ödün vermeyen bir mimari oluşturun ve önümüzdeki birkaç yıl içinde yeniden kullanılabilirliğin temeli haline gelin.

Cortex A76'dan ARM'ın mimari tasarımını altyapı dağıtımında en yüksek frekansta çalışmasını sağlamak için ayarladığını görebildiğimizi özellikle belirtmek gerekir. Bu, Intel ve AMD'nin sunucu CPU'larında benimsediği strateji ile keskin bir tezat oluşturuyor.

ARM'nin sunucu CPU'larında avantajı, performansı, güç tüketimini ve alanı aynı anda optimize edebilmesidir.Intel ve AMD bu göstergelerden taviz vermek zorundadır.Ürünleri ilgili tüketici ürünleriyle benzer bir mimariye sahip olsa da, frekans genellikle çok yüksektir. Sınırlıdır, belirli bir SKU'nun hangi pazar segmenti için olduğuna bağlıdır.

Neoverse N1'in boru hattı yapısı, Cortex A76'nınki ile aynıdır, her ikisi de 11 aşamalı kısa boru hattı tasarımıdır ve ön uç 4 genişlikte okuyucu / kod çözücüdür. ARM buna "akordeon" boru hattı adını verir, çünkü talimat uzunluğuna bağlı olarak, ikinci tahmin aşamasını birinci edinim aşaması, programlama aşaması ve ilk salım aşamasıyla üst üste bindirebilir ve gecikmeye duyarlı bir durumda boru hattının uzunluğunu azaltabilir. 9. seviyeye.

Yürütme arka ucu, işleme toplama ve çıkarma için 2 basit ALU, çarpma ve bölme için 1 karmaşık ALU ve vektör ve kayan nokta işlemlerini işlemek için 2 tam genişlikte 128-bit SIMD ardışık düzeniyle Cortex A76 ile tamamen aynı görünüyor.

Veri çıkışı, işlemci mimarisinin önemli bir göstergesidir. ARM, Neoverse N1 için, yürütme işlem hattını sağlamak ve hizmet vermek için yeterli bant genişliğini koruyabilen iki 128 bitlik yükleme / depolama birimi tasarlamıştır.

Mimarinin ön ucu da Cortex A76'ya çok benziyor ve büyük kapasiteli L1 ve L2 düşük gecikmeli erişim performansına sahip. Burada ARM ayrıca, verinin çekirdekten akmasını sağlamak ve performansı artırmak için dal tahmini ve önbellek isabet hatası olasılığını en aza indirmek için sektörde bilinen en büyük dal hedef ve yön tahmin arabelleklerinden bazılarını kullanır.

Önbellek hiyerarşisi açısından Neoverse N1, Cortex A76'dan çok farklı. İkisinin L1 önbellek kapasitesi 64 KB ve okuma gecikmesi 4 döngüdür, ancak Neoverse N1'deki en büyük fark, önbelleğin tamamen tutarlı olmasıdır.

Donanım I-önbelleğinin tutarlılığının ISA tarafından gerekli olmadığına dikkat edilmelidir.Şimdiye kadar genellikle yazılım bakım işlemleri yoluyla yapılır.

N1 için donanım tutarlılığının sağlanması ARM için çok önemlidir çünkü performansı büyük ölçüde artırır ve sanal ortamların uygulanmasını basitleştirir. ARM ultra büyük ölçekli müşteriler arasında rekabet etmek istiyorsa, bu özelliklere sahip olmalıdır. I-Cache tutarlılığına sahip olmak, sistemin çok büyük bir çekirdek sayısına sahip olmasını sağlayan temel bir destek faktörü olarak kabul edilir. ARM, 16 çekirdek ve üzeri sistemlerin bu özelliğe sahip olması gerektiğini söylüyor.

L2 önbellek, 512KB veya 1MB olarak yapılandırılabilir; bu, temelde 512KB yapılandırması kullanılırken Cortex A76 ile aynıdır, 1MB önbellek ise daha büyük bellek ayak izlerine sahip uygulamaları idare edebilir. Bununla birlikte, L2 önbelleğini 1MB'ye ikiye katlamak maliyetsiz değildir, bu da önbelleğin gecikmesini 2 döngü artıracak ve 11 döngü yük kullanım gecikmesine ulaşacaktır.

Neoverse N1 ve Cortex A76 arasındaki büyük fark, büyük ölçekli önbellek işlemleri gerçekleştirirken Neoverse N1'in kümeleri aramayacak, ancak karışık ara bağlantı kullanacak olmasıdır.

Şekilde gösterildiği gibi, bağlantı önce bir CAL veya bileşen birleştirme katmanından geçer. Her bir CAL en fazla iki arabirimi destekler, bu nedenle her "kümede" yalnızca iki CPU görebiliriz (bu gerçek bir kümenin kendisi değildir). Daha sonra CAL, esasen ağın anahtar / yönlendirici bileşeni olan şebekenin XP'sine (çapraz nokta) bağlanır. Her XP'de iki kullanılabilir bağlantı noktası vardır; ARM referans tasarım örneğinde, ikinci bağlantı noktası sistem düzeyinde bir önbelleğe bağlanır.

64 çekirdekli bir sisteme ve 2MB sistem düzeyinde önbelleğe sahip örnek bir sistemde, 64MB önbelleğin tamamının ortalama yük kullanım gecikmesi 22ns'dir. ARM tarafından verilen gecikme verileri, döngü yerine nanosaniye cinsindendir çünkü sistem düzeyinde önbellek ve ağ, CPU ile eşzamansız bir frekansta, genellikle çekirdek frekansın yaklaşık 2 / 3'ünde çalışır.

Doğrudan bağlantı, Neoverse N1 ve CMN-600'ün ayrılmaz bir özelliğidir. Bu özellik yalnızca bu platformda mevcuttur ve Cortex mimarisinde elde edilmesi imkansızdır. Esasen, DSU'nun tüm L3 ve gözetleme filtresi mantığını siler, ancak CPU çekirdeğini doğrudan CMN'nin CHI arayüzüne bağlar. Bu nedenle, bellek denetleyicisi ile CPU çekirdeği arasındaki iletişimin esasen yalnızca bir ara katmandan, mash ağından geçmesi gerekir.

Doğrudan bellek denetleyicisinden CPU'ya veri aktarımını açıklamak biraz zor olabilir. CPU, bellek denetleyicisine bir veri talebi gönderdiğinde, ona anında ve aynı zamanda örgü ağ gözetlemesinde XP ana düğümü aracılığıyla "önceden getirme" tipi bir istek gönderebilir Filtre komutu normal olarak iletir ve ardından isteği bellek denetleyicisine yönlendirir. Bu nedenle, bellek denetleyicisi, talebin geldiğini ve zaten veri almaya başladığını önceden bilecek ve böylece seri sıradaki tüm iletim yerine etkin bellek gecikmesinin bir kısmını gizleyecektir.

Ön yükleme, tüm sistemin performansı için çok önemlidir.Veri önceden getirmenin akıllı yönetimi, sistem düzeyinde bant genişliğini etkili bir şekilde optimize edebilir. 64 çekirdekli ve 8 DDR43200 bellek kanallı Neoverse N1 referans sisteminde 175 GB / sn'ye varan bir bellek bant genişliğine ulaşılabileceği söyleniyor. ARM ayrıca gecikme verilerini de duyurdu, ancak ARM verileri LMBench verilerini temsil ediyor ve 256MB test derinliğine sahip 2MB büyük bir sayfa yapılandırıldı. Büyük sayfaların seçilmesi TLB ihmalini azaltabilir ve gerçek bellek gecikmesine yaklaşabilir. Bu, bu durumda ARM'in ölçümleri yayınlamasının temel ilkesidir.

Büyük sayfaların etkinleştirildiği rakip bir sistemi test etme şansımız olmadı, ancak AMDnin EPYC 7601 (LRDIMM DDR4266619-19-19), LMBenche benzer bir testle yonganın önbellek hiyerarşisinin sonunda yaklaşık 73ns elde edebilir Gecikme ve özel olarak geliştirilmiş gecikme testi TLB arızasını en aza indirir ve gecikme yaklaşık 57ns'dir. Intel W-3175X (RDIMM DDR 266624-19-19), aynı test altında 94ns ve 64ns gecikme süresine sahiptir.

TSMCnin 7nm işlemi kullanılarak üretilen Neoverse N1 yongası çok küçük bir alana sahiptir. 512KB L2 önbelleği kullanılırken çekirdek alan yaklaşık 1,2 milimetre karedir ve bu da Kirin 980 tarafından kullanılan 1,26 milimetre Cortex A76 ile hemen hemen aynıdır. L2 önbelleğini 1MBye ikiye katladıktan sonra çekirdek Alan sadece 1,4 milimetredir.

Frekans aralığı açısından, ARM'nin vizyonu 0.75V'de 2.6GHz ve 1V'de 3.1GHz'e ulaşmaktır. Bu frekans eğrisinin sonunda, güç tüketiminde% 44'lük bir artış, frekans ve performansta yalnızca% 19'luk bir artış sağlayabilir, bu nedenle çoğu tedarikçi güç eğrisinin daha etkili kısmına daha yakın olmak ister.

Ama mutlak sayılarla, Neoverse N1'in güç tüketimi, 64 çekirdekli SoC için yeterli alan sağlayan yalnızca 1 ~ 1.8W'dır. ARM'nin 64 çekirdekli Neoverse N1 referans tasarımı için toplam güç bütçesi yaklaşık 105W'tır.

Neoverse N1 Süper Büyük Ölçekli Referans Tasarım

ARM, ARM tarafından tamamen doğrulanmış bir IP seti içeren tam bir Neoverse N1 referans tasarımı sağlar. Bu referans tasarımın amacı, tedarikçilere nispeten minimum çabayla optimum performans elde edebilmeleri için "tatlı" konfigürasyon seçenekleri sunmaktır.

Neoverse N1'in referans tasarımı, 64 veya 128 çekirdekle yapılandırılabilir ve 64 MB veya 128 MB sistem düzeyinde önbelleğe sahip CMN-600 mash ağına entegre edilebilir. G / Ç arabirimi açısından, G / Ç ve CCIX arabirimi için sırasıyla 128 PCI-E 4.0 kanalı kullanılır ve bu da yeterli G / Ç bant genişliği sağlayabilir.

Bellek açısından, ARM bunun için 3200 MHz'e kadar destekleyen 8 kanallı bir DDR4 denetleyici yapılandırdı. Ancak aslında ARM, kendi bellek denetleyicileri geliştirmesinden vazgeçmiştir, çünkü çoğu durumda müşteriler kendi iç tasarımlarını kullanacak veya diğer üçüncü taraf tedarikçilerden (Cadence veya Synopsys gibi) seçim yapmayı seçecektir.

Mevcut referans tasarım için, ARM'nin kendi DMC-520 bellek denetleyicisi hala en sonuncusudur ve şirket için iyi anlaşılmış bir modüldür. Ancak gelecekte, DDR5 gibi daha yeni bellek denetleyicilerinin de üçüncü taraf IP'ye güvenmesi gerekecek.

SoC'nin fiziksel uygulaması, tasarımı kolay olan yeniden kullanılabilir hiyerarşik yapı taşlarını kullanacaktır. Her CPU modülü iki Neoverse N1 çekirdeğinden, bir dizi sistem düzeyinde önbellekten ve CMN ile yerel düğümlerin kesişiminin bir parçasından oluşur. CPU modülünü kopyalamak için çevirerek ve aynalayarak, son SoC üst seviye ızgarası oluşturulabilir.

7nm işlem düğümünde, ARMün 64 çekirdekli Neoverse N1 referans tasarımı 64 MB önbellek ile eşleştirilir ve yonga boyutu 400 milimetre kareye yakın olup bu, tedarikçinin istediği üretilebilirlik hedefinden biraz daha yüksek olabilir. Bu endişeyi hafifletmek için ARM ayrıca küçük çip tasarımı fikrini önerdi, çok sayıda küçük yonganın CCIX bağlantısı üzerinden iletişim kurmasına izin vererek gerekli esnekliği sağladı ve tedarikçi çözümün nasıl tasarlanacağına karar verebilir.

Akıllı ağ kartının entegrasyon yeteneği, tasarımının ve esnekliğinin de önemli bir yönüdür.Büyük ölçekli bir sistemde bilgi işlem gücünü en üst düzeye çıkarmak için, ağ bağlantısını hızlandırmak aslında mümkün olduğunca yoğun ve etkili form faktörlerinde yüksek verim elde etmenin anahtarıdır. .

CMN-600, 128 GB / sn'ye kadar yüksek bant genişliğine sahip bir veri yolu aracılığıyla bellek yönetim birimine bağlanan ve diğer sabit işlevli donanım modüllerini kolayca takabilen çapraz noktalarında yardımcı bağlantı noktalarının ayarlanmasına izin verir.

CCIX, ARM için çok önemlidir çünkü ürün portföyünün üçüncü taraf IP ürünleriyle entegre olmasını sağlar. Harici IP modülleri için önbellek tutarlılığını etkinleştirmek çok çekici bir özelliktir çünkü satıcının yazılım tasarımını büyük ölçüde basitleştirir. Temel olarak bu, yazılımın yalnızca büyük bir bellek bloğu gördüğü ve uyumlu olmayan sistemlerin, belleğin hangi bölümlerinin geçerli olup hangilerinin geçerli olmadığını bilmesini ve izlemesini gerektirdiği anlamına gelir. ARM, IP entegrasyonu açısından, CMN-600 ile entegre CCIX uyumlu ağ geçitleri sağlarken, CCIX dönüşüm katmanını sağlamak üçüncü taraf IP sağlayıcılarının sorumluluğundadır.

ARM için CCIX, ürün portföyünün üçüncü taraf IP ürünleriyle entegre olmasına izin verdiği için çok önemlidir. Harici IP blokları için önbellek tutarlılığını etkinleştirmek, satıcı yazılım tasarımını büyük ölçüde basitleştiren ve geçerli belleğin ne olduğunu takip etmek için sistemlere, sürücülere ve yazılıma olan ihtiyacı ortadan kaldıran çok çekici bir özelliktir. IP entegrasyonu açısından ARM, CMN-600 ile entegre bir CCIX uyumlu ağ geçidi sağlarken, üçüncü taraf bir IP sağlayıcısı bir CCIX çeviri katmanı sağlar.

Çipin mantık tasarımında, tedarikçi aynı zamanda fiili kullanımda çeşitli ani ve katı güç gereksinimlerini desteklemek için sağlam bir güç dağıtım ağı tasarlamalıdır. Bu, birçok tedarikçi için çok baş ağrısıdır, çünkü tasarım karmaşık modeller gerektirir ve çoğu durumda, dağıtım ağının kararlılık garantileri sağlamak için aşırı tasarlanması gerekir, bu da uygulama karmaşıklığını artırır. Seks ve maliyet.

ARM, özel bir mikro denetleyici biçiminde çok ince taneli bir DVFS (Dinamik Voltaj Frekans Ayarlama) mekanizması sağlayarak bu sorunları hafifletmeyi amaçlamaktadır. Denetleyici, kaç transistörün gerçekten aktif olarak çalıştığını görmek için CPU çekirdeği içindeki ayrıntılı etkinlik izleme birimine erişir ve bu bilgiyi DVFS durumunu değiştirmek için sistem denetleyicisine geri gönderir. Bu, tedarikçilerin dağıtım ağlarını daha muhafazakar toleranslara göre tasarlamalarını ve böylece uygulama maliyetlerinden tasarruf etmelerini sağlar.

Performans tahmini

Performans ve verimlilik hakkındaki tartışmalar belirli sayılarla ölçülmelidir. ARM, Neoverse N1'i duyurduğunda, performans verilerinin çoğu Cortex A72'ye göre iyileştirmelerdi ve bu, Neoverse N1'i rekabet ortamında en alakalı veri noktası olarak gerçekten yerleştirmedi. Cortex A72, 2015 yılında piyasaya sürülen bir mimaridir ve iki ürün arasında 3-4 yıllık bir zaman aralığı vardır.

Aynı frekansa sahip Cortex A72 platformuyla karşılaştırıldığında ve aynı zamanda sistem düzeyinde önbellekle donatılmış olan yepyeni Neoverse N1 platformu, ezici bir tavırla doğrudan kazanır. SPEC'in tek iş parçacıklı testinde, Neoverse N1'in tam sayı aritmetik PPC'si (saat başına performans) ve mutlak performansı, Cortex A72'ye kıyasla% 60 ~% 70 arttı ve kayan noktalı aritmetik performansı% 100'e varan bir artışla daha da etkileyiciydi ~ % 120. Ve Neoverse N1'in diğer birçok SoC düzeyinde iyileştirme ve yazılım optimizasyonuna sahip olduğu göz önüne alındığında, gerçek performans daha da yüksek olacaktır.

Mevcut çözümlerle karşılaştırıldığında, ARM bir kez daha çok önemli bir performans evrimini yineledi ve vektör iş yüklerinde 2 kattan fazla performans artışı sağladı. Doğal olarak Neoverse N1, ARMv8.2 komut setini destekler, bu da 8-bit nokta ürünü ve FP16 yarı hassasiyetli talimatları desteklediği anlamına gelir.Bu talimatlar özellikle makine öğrenimi iş yükleri için uygundur ve önceki platforma göre yaklaşık 5 kat daha fazla performans artışı sağlar.

Yaklaşık 2.6 GHz'de çalışan 64 çekirdekli Neoverse N1 ultra büyük ölçekli referans tasarımı için SPECint2006 tek iş parçacığı puanı 105 watt TDP'de yaklaşık 37 iken, çok iş parçacıklı puanın yaklaşık 1310 olması bekleniyor.

Bununla birlikte, bu performans gerçek çalışan üründe ölçülmez, ancak ARM sunucu çiftliğindeki RTL simülasyon ortamında tahmin edilir.

Neoverse N1'in tek iş parçacığı puanı, aynı kaynak Cortex A76'da ölçülen 26 puandan önemli ölçüde daha yüksektir.Yazılım ve derleyici ile ilgili hususlardan bağımsız olarak,% 42'lik performans farkının nedenlerinden biri, Neoverse N1'in daha iyi belleğe sahip olması olabilir. Ve önbellek sistemi, genel sistem bant genişliği Cortex A76 mobil SoC'den 6 kat daha yüksektir.Tek iş parçacıklı bir iş yükünde iş parçacığı, Cortex A76 tarafından tasarlanan L3 önbelleğinden 16 kat daha büyük olan 64 MB sistem düzeyinde önbelleğe tam olarak erişebilir.

ARM, ekosistemin performansını artırmaya yönelik birçok çabada daha iyi donanım sağlamanın yanı sıra daha iyi yazılım sağlaması gerektiğini vurguladı. Geçtiğimiz birkaç yıl içinde, ARM açık kaynaklı araçları ve derleyicileri iyileştirmek için çok fazla enerji harcadı. Örneğin, GCC9'un en son sürümünü GCC5'in eski sürümüyle karşılaştırdığınızda, tam sayı ve kayan nokta iş yüklerinin performansı% 13 ~ 15 arttı ve bunlar Optimizasyon, SPEC puanlarını iyileştirmeyi amaçlayan hedeflenmiş değişiklikler değil, gerçek kullanım durumları için bir iyileştirmedir.

Tek iş parçacıklı performans açısından Neoverse N1 çok iyi görünüyor, şu anki en iyi performans gösteren ARM sunucu CPU'sunu, yani Cavium'un ThunderX2'sini büyük bir farkla yeniyor.

Sunucu odaklı bir ürün olduğu için, eski satıcılar Intel ve AMD ile karşılaştırmak kaçınılmazdır.Intel ve AMD'nin en yeni ve en iyi Xeon W-3172X ve EPYC 7601'de, GCC8 bir dizi ikili dosyayı derlemek için de kullanılır.

Intelin Xeon W-3172X'i pek temsilci hiper ölçekli CPU değildir, ancak 4,5 GHz tek çekirdekli turbo frekansı çok çekirdekli CPU'lar arasında en güçlü tek iş parçacıklı performansı sağlayabilir. AMD'nin EPYC 7601'i daha temsili bir veri noktasıdır. 3.2GHz frekansı Neoverse N1 ile oldukça benzerdir ve gerçek sonuçlar da doğrudur.

SPECrate2006'nın çok iş parçacıklı testine bakalım. Bu, tüm platformlar için en iyi genişletilmiş senaryodur. Serileştirme veya iş parçacıkları arası iletişim yoktur. Test paketi yalnızca birden fazla işlemi paralel olarak çalıştırır.

ARM tarafından verilen simülasyon test sonuçlarından, 64 çekirdekli Neoverse N1, 105 watt'lık TPD ile son derece yüksek performans ve verimlilik elde ediyor ve x86 çözümlerinin rekabet etmesi bile zor.

Test 64 çekirdekli ARM platformunu 32/28 çekirdekli x86 platformuyla karşılaştırsa da, AMDnin gelecek 64 çekirdekli Roma işlemcisini kullanmak daha adil görünüyor, ancak veri açısından bakıldığında, AMD'nin 64 çekirdekli işlemcisi mevcut performansın iki katı performans elde edebilse bile, TDP'sinin Neoverse N1 (EPYC 7601'in 180 watt TDP'si vardır) gibi 105 watt seviyesine düşmesi pek olası değildir.

sonuç olarak

Neoverse N1 mükemmel bir mimari gibi görünüyor, ARM'nin sürekli olarak lider güç verimliliğini koruyor ve en yüksek bilgi işlem performansı ile genel verim arasında en iyi dengeyi sağlıyor.

ARM, Intel gibi satıcılardan x86 işlemcilerin yerleşik pazar payını ellerinden almayı umarak, Neoverse N1 ve nihai halefi için yüksek beklentilere sahip. ARM elinden gelenin en iyisini yapıyor Neoverse N1, amiral gemisi x86'nın çekirdek rakibi olmayacak olsa da, iş yüklerinde kolaylıkla daha fazla çekirdeğe genişletilebilecek büyük bir tehdit oluşturacak.

Elbette, gerçek donanım ürünleri ortaya çıkmadan önce herhangi bir sonuca varamayız, ancak ARMün Cortex A76ya ilişkin önceki performans tahmini, gerçek cihazdaki ölçüm sonuçlarıyla çok tutarlıdır, bu nedenle Neoverse N1in performans tahminine güvenmek ve tahmini gerçekleştirmek için nedenimiz var. Performans kesinlikle umut verici.

Yeni donanım IP'si etkileyici olsa da, aynı derecede önemli olan, ARM'in ARM yazılım ekosistemini güçlendirme çabalarıdır. Yazılım yığınını ve ARM ile birlikte çalışabilirliği teşvik etmek için farklı sektörlerdeki donanım ve yazılım ortaklarıyla işbirliği yapmak, bu yalnızca ARMün kendi donanım IP'sini kullanan satıcılar için elverişli olmakla kalmaz, aynı zamanda kendi özel CPU ve SoC tasarımlarını kullanmayı seçmeye de elverişlidir. Tedarikçi. Benzer şekilde, ürünlerini iyileştirmeye ve güçlendirmeye çalışan tedarikçiler de ARM ekosistemini güçlendirecek. Aslında bu, birçok şirket arasındaki ortak bir çabadır ve gelecekte ivme kazanmaya devam edecektir.

ARM'nin altyapı yapımını çok ciddiye aldığı görülüyor.Geçen yıl ARM ekosistemi için devrim niteliğinde bir yıl oldu.İlk defa ARM satıcı platformlarının Intel ve AMD gibi ana satıcılarla rekabet ettiğini gördük. ARM, Neoverse N1 platformunu ilk olarak kimin kullanacağını açıklamasa da, ARM tartışmasız endüstrinin ana akımı haline geliyor.

Neoverse N1'in önümüzdeki 12 ila 18 ay içinde ticari olarak konuşlandırılacağı ve bunun ARM için kritik bir an olacağı söyleniyor. Her şey yolunda giderse, ARM ve ortakları vaat edilen iyileştirmeleri gerçekleştirmişlerdir ve sunucu endüstrisi önümüzdeki 1-2 yıl içinde büyük bir dönüşümü başlatacaktır.

İpuçları

EETOP'un makalesini okuduğunuz için teşekkür ederiz.Bu makaleyi beğendiyseniz, lütfen arkadaş çevrenizi paylaşın ve daha fazla bilgi alın lütfen beni takip edin.

Bakış Açısı: Dünya futbolunda en çok ihmal edilen, Ronaldonun yeteneği ve Messinin çabaları
önceki
Yasa Popülerleştirme Sınıfı Ganzhou Şehri, Rongjiang Yeni Bölgesi'nde ortaya çıkarılan ihalelerin ekonomik suçu
Sonraki
30 yaşındaki Hainan tamamen açık ve tüm dünya kıskanç!
Özet | Karar Ağacı Algoritmalarının Özeti
Huawei'nin yeni akıllı şehir modeli
Çin sermayesi artık İsrail'in teknoloji efsaneleriyle kolayca karıştırılmıyor ve İsrail şirketleri için bir cennet haline geliyor
En çok tavsiye edilen antik şehrin aslında bu küçük kasabada olduğunu biliyorum! Phoenix'ten sessiz, Guilin'den daha çekici
Lüks evlerin fiyatlarının yaklaşık 30 milyon yuan düşürülmesini kimse umursamıyor. Avustralya emlak alıcılarına ders verebilir
Messi ve Ronaldo'nun farklı olduğu söyleniyor ama ortak paydalarını buldum
Dakongyi adında bir çocukluk olduğunu hatırlıyor musun?
Güzel ağlama! Binlerce kiraz çiçeği çiçek açmış durumda ve gitmezsen çok geç olacak!
Odak - ABD altıncı nesil süpersonik gizli avcı
Çip alanı çok büyük! Samsung Exynos 9820 çekirdek fotoğrafları ortaya çıktı
Çift, 400 gün boyunca arkadaş çevresinden kayboldu, 300.000 harcadı ve ardından herkesi şaşırtan fotoğraflar gönderdi.
To Top