ARM'ın yeni Cortex A76 mimarisinin analizi: 2.4GHz, Snapdragon 845'i öldürebilir

Haziran ayında bir başka yıl, ARM San Francisco'da yeni bir Cortex A76 mimarisi yayınladı.

Dijital meraklılar, ARM'ın mimari kod adlarına aşina olmalıdır, ancak bu mimarilerin kimden geldiğini bilmeyebilirler. Aslında, ARM'in dünya çapında üç tasarım ekibi vardır: Teksas'ta bulunan Austin ekibi, Güney Fransa'da bulunan Sofia ekibi ve İngiliz ana kampında bulunan Cambridge ekibi.

Bu üç ekibin kendi iş bölümü vardır. Austin ekibi, Cortex A57 ve Cortex A72 olarak temsil edilen yüksek performanslı mimarileri tasarlamaktan sorumludur; Cambridge ekibi, Cortex A53 ve Cortex A55 gibi düşük güçlü mimariler tasarlamada uzmanlaşmıştır ve Sophia ekibi, Cortex A73 ve Cortex A73 gibi dengeye odaklanmaktadır. Cortex A75 onun elinden.

Ancak, Moore Yasası 28 nm düğümde yavaşladığından, Austin ekibi Cortex A57 ve Cortex A72 mimarilerinde iki darboğazla karşılaştı.Güçlü performans sahte değil ve güç tüketimi ve ısı üretimi de ürkütücü. O zamandan beri Austin ekibi pek hareket etmedi. Tam da insanlar bu güçlü Amerikalıları neredeyse unuttuğunda, Austin ekibi yeni Cortex A76 ile geri döndü.

Cortex A76, tasarım açısından ARM için çok önemlidir. Tamamen yeniden inşa edilmiş yepyeni bir mikro mimaridir. "İkinci nesil Austin ailesinin" lideridir ve yeni bir başlangıcı temsil eder. ARM buna "dizüstü bilgisayar düzeyinde performansa sahip bir işlemci" diyor.

En son 7nm işlemi altında, Cortex A76'nın çalışma frekansının 3GHz'e ulaşması bekleniyor.10nm işleme dayalı ve 2.8GHz'de çalışan Cortex A75 ile karşılaştırıldığında, enerji tüketimi% 40 azalacak, performans% 35 artırılabilecek ve makine öğrenme yetenekleri 4 kat artırılabilecektir. .

Cortex A76 Mimarisinin Analizi

Cortex A76, sıra dışı bir süper skalar çekirdektir.Ön uç, sıra dışı 4 sorunlu komut kod çözme, arka uç 13 aşamalı bir ardışık düzen ve yürütme gecikmesi 11 aşamadır. ARM, bir "yönlü tahmin edinme" birimi tasarlamaktadır, bu, dal tahmin biriminin getirme birimine geri besleneceği anlamına gelir. ARM ayrıca, tahmin birimini getirme biriminden ayıran ve çekirdekteki her modülün bağımsız çalışmasını destekleyen endüstride bir "hibrit dolaylı tahmin birimi" kullanımına öncülük etmiştir.Çalışma sırasında güçten tasarruf etmek için geçişi hızlandırmak daha kolaydır.

Cortex A76 şube tahmin birimi, 16 bağlantılı nanoBTB, 64 bağlantılı microBTB ve 6000 bağlantılı ana BTB dahil olmak üzere 3 seviyeli bir BTB (şube hedef tamponu) tarafından desteklenir. Cortex A73 ve Cortex A75 nesillerinde ARM, şube tahmin biriminin hemen hemen tüm dalları öngörebileceğini iddia etti.Cortex A76'nın bu yeni birimi öncekinden daha güçlü görünüyor.

Getirme biriminin çalışma hızı saat döngüsü başına 16 bayttır ve dal tahmin biriminin çalışma hızı, döngü başına 32 bayt olan getirme biriminin bant genişliğinin iki katıdır. 12 "bloktan" oluşan getirme biriminden önce bir talimat getirme sağlanabilir. kuyruk. Bunun amacı, dallanma tahmini yanlış olduğunda boru hattındaki dal balonunu gizlemek ve getirme biriminde ve çekirdeğin geri kalanında durgunluğu önlemek. ARM, Cortex A76'nın döngü başına 8 adede kadar dal tahmin hatasını işleyebileceğini iddia ediyor.

Cortex A76'nın talimat getirme birimi, 1632bit'e kadar talimat sağlayabilir ve komut getirme işlem hattı iki komut hizalama ve kod çözme döngüsünden oluşur. Komut kod çözme ve yeniden adlandırma aşamasında Cortex A76, döngü başına 4 talimatı işleyebilir ve talimat başına ortalama 1.06 Mops hızında makro talimatlarını verebilir.

Önceden Cortex A72 ve Cortex A75 döngü başına 3 talimatı işleyebiliyordu, Cortex A73 ise yalnızca 2 talimatı işleyebiliyordu. Leifeng.com tarafından tutulan bilgilere göre Cortex A73'ün Cortex A72'ye göre daha düşük kod çözme bant genişliği enerji verimliliğini optimize etmektir.Mobil işlemci performans gereksinimlerinin iyileştirilmesiyle Cortex A75, döngü başına 3 iş hacmi tasarımına devam ediyor. Bu kez Cortex A76 daha da ileri gitti ve genel sürüm mimarisinde en yüksek kod çözme bant genişliği oldu, ancak yine de Samsung ve Apple'ın özel mimarilerinden daha düşüktü (döngü başına Samsung M36 işlem hacmi / döngü başına Apple A117 işleme hızı).

Komut yeniden adlandırma aşamasında, ARM yeniden adlandırma birimini ayırır ve tamsayı / ASIMD / işaret işlemleri için saat geçişini kullanır Yeniden adlandırma ve programlama, A73 ve A75 için her seferinde 2 döngüden 1 döngüye kısaltılır. Makro, talimat başına 1,2 op oranında mikro işlemlere genişletilir ve döngü başına 8 ops planlama gerçekleştirilir; bu, Cortex A75'in 6 op / döngüsüne ve Cortex A73'ün 4 ops / döngüsüne kıyasla önemli ölçüde geliştirilmiştir.

Cortex A76'nın sıra dışı gönderim penceresi boyutu 128'dir ve tampon, hibrit gönderim sistemi adı verilen talimat yönetimi ve kayıt kurtarmadan sorumlu iki yapıya bölünmüştür. Performans ölçekleme oranı yalnızca 1/7 olduğu için, yani arabellekte% 7'lik bir artış performansı yalnızca% 1 artırabilir, bu nedenle ARM, tasarımın bu bölümünü geliştirmeye odaklanmaz.

İşlem hatları açısından, tamsayı bölümü 6 soru kuyruğu ve yürütme portu, 16 derinlikli soru kuyruğu tarafından sunulan toplam 3 tamsayı yürütme işlem hattı içerir. Tamsayı işlem hatlarından ikisi basit aritmetik işlemleri gerçekleştirebilir ve biri çarpma, bölme ve CRC gibi karmaşık işlemler gerçekleştirebilir. ASIMD / kayan nokta bölümü, 216 derinlikli soru kuyruğu tarafından sunulan 2 işlem hattı içerir.

Tamsayı işlemleri açısından, Cortex A76, Cortex A75'in 3 döngüsünden çarpma ve çarpma biriktirme gecikmesini 2 döngüye düşürür ve toplam verim değişmeden kalır. Ve Cortex A76'nın 3 tamsayı ardışık düzeni olduğundan, basit aritmetik işlemleri gerçekleştirirken üretilen iş hacmi Cortex A75'in 2 işlem hattına kıyasla% 50 artar.

ARM ayrıca kayan nokta ve ASIMD işlemlerinden sorumlu "VX" (vektör yürütme) işlem hattında önemli iyileştirmeler yaptı. Cortex A76'nın kayan noktalı aritmetik işlem gecikmesi 3 döngüden 2 döngüye, çarpma ve biriktirme de 5 döngüden 4 döngüye indirilir. ARM, Cortex A75 ile karşılaştırıldığında, Cortex A76'nın ikili 128bit ASIMD'sinin yürütme bant genişliğini iki katına çıkarabileceğini ve dört kat hassas işlemlerin yürütme veriminin ikiye katlandığını söyledi.

ARM ayrıca Cortex A76'da dördüncü nesil ön getirme birimini tanıttı.Her çekirdek, paralel çalışan, çeşitli veri modellerini görüntüleyen ve mükemmel bir önbellek isabetine yaklaşmak için verileri önbelleğe yükleyen 4 farklı ön getirme motoruna sahiptir. Operasyonun amacı. ARM, Cortex A76'nın önbellek sisteminin tasarımında herhangi bir taviz vermemiş, hem bant genişliğinde hem de gecikmede mükemmel bir seviyeye ulaşmış, önbellek bant genişliğini% 90'a varan oranlarda artırabileceği söyleniyor.

Performans ve güç tüketimi tahmini

Bu mimari iyileştirmelere dayanarak, ARM, Cortex A76'nın Cortex A75'e kıyasla döngü başına tamsayı performansını ve kayan nokta performansını sırasıyla% 25 ve% 35 artırabileceğini iddia ediyor. Önbellek bant genişliğinde% 90 artışla birlikte Cortex A76nın GeekBench4 çalışma puanı iyileşti. JavaScript performansı% 28 oranında yaklaşık% 35 arttı (Octane, JetStream).

ARM, SPECint2006 testini çalıştırmanın bir performans karşılaştırmasını verdi.GCC tarafından derlenen kıyaslama ikili dosyasını çalıştırırken, Cortex A76 Snapdragon 845'i 2.4GHz'de öldürdü ve enerji verimliliği oranı% 15 arttı. Bu aynı zamanda 3GHz frekansına beklendiği gibi ulaşılırsa Cortex A76'nın performansının Samsung'un kendi geliştirdiği M3 mimarisini kullanan yepyeni Exynos 9810 ile aynı olacağı anlamına geliyor.

Performans geliştirmelerine ek olarak, Cortex A76'nın enerji verimliliği oranı da iyileştirildi. 750 mW'lık bir çekirdek güç bütçesi ile 7nm Cortex A76, 10nm Cortex A75'e kıyasla performansı% 40 artırabilir. ARM, Cortex A76'nın dört çekirdek sürekli olarak tam olarak yüklendiğinde frekans azaltma olmadan tam hızı koruyabileceğini söyledi.

Tabii ki, SoC'nin performansı sadece döngü başına performans gelişimine bağlı değildir.Yarı iletken işleminin getirdiği frekans payı da çok önemlidir TSMC'nin 7nm süreci başarıyla üretime alınırsa ve Cortex A763GHz + frekansında çalışırsa, performans artışı daha da etkileyici olacaktır.

Bununla birlikte, daha önce ARM tarafından belirlenen frekans hedefleri genellikle çok iyimserdir.Örneğin, Cortex A73'ün başlangıçta 2.8GHz'de ve Cortex A75'in 3GHz'de çalışması bekleniyordu ve ikisinin gerçek maksimum çalışma frekansları sadece 2.45GHz ve 2.7GHz idi. Yarı iletken tedarikçileri için, proses olgunluğu ve farklı montaj hatları arasındaki farklılıklar, çipin çalışma frekansını etkileyecek, üst frekans sınırını düşürmek, son çare tedarikini sağlamaktır.

Ek olarak, Leifeng.com'a göre, her çekirdek mimarinin belirli bir süreç altında en iyi enerji verimliliği oranına sahip bir frekans aralığı vardır. Örnek olarak Samsung'un kendi geliştirdiği M3 mimarisine sahip yepyeni Exynos 9810'u ele alalım.Bu çipin CPU çekirdek kümesi, tek çekirdekli, çift çekirdekli ve dört çekirdekli tamamen yüklendiğinde 2,7 GHz, 2,3 GHz, 1,8 GHz'dir ve tüm güç tüketimi budur. Yaklaşık 3,5 watt. Diğer bir deyişle, ters hesaplamadan sonra, M3 çekirdeğinin güç tüketimi 1.8GHz'den 2.3GHz'e iki katına çıktı ve 500MHz frekansı artırıldı ve 2.3GHz'den 2.7GHz'e, sadece 400MHz artış güç tüketimini ikiye katladı.

1.8GHz'den 2.7GHz'e, performans doğrusal ve eşzamanlı olarak geliştirilmiş olsa bile, genlik yalnızca% 50'dir ve güç tüketimi dört katına çıkmıştır. Optimum enerji verimliliği oranı aralığını geçtikten sonra, yüksek frekanslı etkilerin büyük güç tüketimi gerektirdiği görülebilir. Snapdragon 845'in Kryo 385 Gold çekirdeğinin performansı benzerdir.Yaklaşık 2,1 GHz eşiğini aştıktan sonra, güç tüketimi Samsung'un M3 çekirdeğinden bile daha fazla yükseldi.

Bu nedenle, Cortex A76 mimarisini kullanan ilk SoC grubu, frekansın hala 3GHz'e ulaşmaması muhtemeldir. Leifeng.com, çekirdek mimarideki değişiklikleri ve ölçek artışını göz önünde bulundurarak, gerçek frekansının 2.5GHz civarında olacağına inanıyor, ancak daha sonraki süreç olgunlaştıkça veya güç tüketimi için daha fazla toleransa sahip dizüstü bilgisayarlara ve diğer cihazlara uygulandığında bunun aceleye getirilebileceğini göz ardı etmiyor. 3GHz + yüksek frekans.

Sonuç ve düşünme

Son yıllarda insanlar Apple ile rekabet edebilecek güçlü bir yapıyı dört gözle bekliyorlar. Samsung'un kendi geliştirdiği M3 mimarisi kısa bir süre önce Apple A11'i performansta yakaladı, ancak fiyat tek çekirdekli 3.5W güç tüketimi. Bu durumda, ARM hala nesillerin yerini almayı tercih ediyor. Bu sefer Austin ekibinin Cortex A76'sı bir performans canavarı değil. Dengeli bir mikro mimarinin ne kadar önemli olduğunu tam olarak gösteriyor.

Qualcomm ve Huawei HiSilicon'ın Cortex A76 SoC'nin geliştirilmesi ve üretimi için hazırlandığı ve bu yılın sonundan önce ticari ürünlerde sevk edildiğini görmemizin muhtemel olduğu bildirildi. Samsung daha incelikli, Cortex A76'nın performansı M3'ü geçmiyor, bu nedenle teoride Samsung'un yalnızca M4'ün (varsa) enerji verimliliği oranını iyileştirmeye odaklanması gerekiyor.

Şaşırtıcı olmayan bir şekilde, Cortex A76 tabanlı mimari, önümüzdeki birkaç yıl içinde en az iki yinelemeli yükseltmeden geçecek. ARM, 5 yıl üst üste yıllık planlama hedefine ulaştı ve yıllık bileşik büyüme oranı% 20-25. Mobil işlemciler X86 işlemcilerin performansına hızla yaklaştıkça, önümüzdeki birkaç yıl içinde işlemci pazarı daha ilginç olacak.

üzerinden: Anandtech

Vahşi Doğa Operasyonu Noel Arifesinde başlıyor ve "Noel Baba" yenilmez modunuz etkinleştirildi!
önceki
Resim, yeni "numara taşınabilirliği" yönetmeliğini okuyor: numarayı değiştirmeden operatörü değiştirin
Sonraki
AR teknolojisi destekleniyor mu? Nubia resmi 5 fotoğrafı, Z17'nin 5 detayını gösteriyor
adidas Originals Iniki Runner, renk uyumu çok sıkıcı olduğu için yeni bir renk eşleştirme giysisi mi piyasaya sürdü?
Apple, Microsoft WP üst gövdesi gibi bir değişiklik olan yeni bir iPhone sistemi yayınladı
Zhai Tianlin'in gerçek üniversiteye giriş sınavı sonuçları alındı! Netizenler, bir çizgi üzerinden kendi kendine maruz kalma, aslında bunun sadece 348 puan olabileceğini tahmin ediyor
Bugün sizlerle çocukların veri ihlali hakkında konuşmak istiyorum | Çocuk Bayramı Özel
4 yerli arama motoru, Sogou gelecekte bir numara olabilir
LPL'nin yeni RW takım logosu! Çin stili? Hâlâ çöp mü? Netizenler çılgınca şikayet etsin!
Samsung Galaxy Tab S3 renderları ortaya çıktı: veya 26 Şubat'ta piyasaya sürülecek
Bu yaz istediğiniz A BATHING APE® köpekbalığı şortları burada!
China UnionPay nihayet harekete geçti, mobil ödemenin bir sonraki konusu güvenlik
Honor 10 Youth Edition yanıyor! İnci şekeri bunun gibi
32 bit uygulamalar Apple tarafından terk edilecek: iOS 11 yalnızca 64 bit yazılımı destekler
To Top