Turing Ödülü sahibinin uzun raporu: Bilgisayar mimarisinin yeni altın on yılını açan nedir? (açık)

Lei Feng.com'a göre: Son yıllarda, hem sıradan tüketiciler hem de bilimsel araştırmacılar iki dalga hissedebiliyor: Birincisi, CPU hızındaki artışın giderek daha az önemli hale gelmesi. CPU üreticilerinin tekrar "diş macunu sıktığını" söylüyoruz. Öte yandan, derin öğrenmenin teşvik ettiği çeşitli yarı iletken devler ve bir grup AI start-up, AI çiplerini tanıtmaya başladı. Bir çip türünün yavaş yavaş yavaş şeride doğru ilerlediğini görürken, diğer çip türü şarkı söylemeye ve denemeye hazır.

Bu yanılsamanın arkasında bilgisayar bilişim mimarisi çağı var; yeni yöntemler, yeni düşünce ve yeni hedefler yeni dalgalara yol açtı. 2017 Turing Ödülü'nün iki kazananı John L. Hennessy ve David A. Patterson, bu yeni dalganın tanıkları ve liderleridir. Kısa bir süre önce, ACM Communications'da (ACM'nin İletişimi) "Bilgisayar Mimarisi için Yeni Altın Çağ" adlı uzun bir rapor yayınladılar; bu rapor, bilgisayar mimarisinde yeni bir çağın gelişini tetikleyen çeşitli değişiklikleri ayrıntılı olarak anlatıyor ve gelecek on yılını da dört gözle bekliyorlar. Mimarlık alanında "Yeni Altın On Yıl".

Leifeng.com, bu makalenin tam metnini şu şekilde derlemektedir, bu birincisi ve bir sonraki de burada.

Diğer ikisi burada bulabileceğiniz rahatlatıcı bir röportaj yaptı.

ISCA 2018, 2017 Turing Ödül töreni, John L. Hennessy (solda) ve David A. Patterson (sağda) Alan Turing'in büstleriyle

4 Haziran 2018'de 1960'lardan itibaren bilgisayar mimarisinin gelişimini gözden geçirdik ve bununla Turing dersimize başladık. Bu incelemeye ek olarak, derste güncel sorunları ve gelecekteki fırsatları da tanıttık. Bilgisayar mimarisi alanı bir altın on yılı daha başlatacak, tıpkı 1980'lerde araştırma yaptığımız gibi, yeni mimari tasarım daha düşük maliyetler, daha iyi enerji tüketimi, güvenlik ve performans getirecek.

"Geçmişi hatırlayamayanlar, aynı hataları tekrar etmeye mahkumdur"

George Santayana, 1905

Yazılım ve donanım arasındaki diyalog, komut seti adı verilen bir mimari aracılığıyla gerçekleştirilir. 1960'ların başlarında, IBM'in küçük işletmeler, büyük işletmeler, bilimsel araştırma kurumları ve gerçek zamanlı bilgi işlem için dört uyumsuz bilgisayar serisi vardı.Her serinin kendi komut seti, yazılım yığını ve G / Ç sistemi vardı.

ACM Turing Ödülü'nü kazanan Fred Brooks dahil olmak üzere IBM mühendisleri, bu dört dizi talimatı etkili bir şekilde birleştirmek için yeni bir ISA oluşturmayı umuyor. Bu nedenle, düşük kaliteli bir 8 bit'e ihtiyaçları var Bilgisayarlar ve ileri teknoloji 64 bit bilgisayarlar, bir dizi komut seti çözümünü paylaşır.

Aslında, veri yolunu genişletmek ve küçültmek görece daha kolaydır.O zamanlar mühendislerin karşılaştığı en büyük zorluk işlemcinin denetleyici kısmıydı. Yazılım programlamadan esinlenen, bilgisayar öncüsü ve Turing Ödülü sahibi Maurice Wilkes, kontrol sürecini basitleştirme fikrini ortaya koydu, yani denetleyici kısmı, bellek yoluyla gerçekleştirilebilen "kontrol belleği" adı verilen iki boyutlu bir dizi olarak tanımlandı. Mantık kapılarını kullanmanın maliyeti çok daha düşüktür. Dizinin her bir sütunu bir kontrol hattına karşılık gelir ve her satır bir mikro talimata karşılık gelir.Mikro talimat yazma işlemine mikro programlama adı verilir.Kontrol hafızası, mikro talimatlar kullanılarak yazılmış bir komut seti yorumlayıcısı içerir, bu nedenle geleneksel bir talimatın yürütülmesi, tamamlanması için birden fazla mikro talimat gerektirir. .

Aşağıdaki şekil IBM tarafından 7 Nisan 1964 tarihinde piyasaya sürülen yeni System / 360 serisi bilgisayarın komut setini listelemektedir. Dört model arasındaki veri yolu genişliği farkı 8 kat, bellek kapasitesi farkı 16 kat ve frekans farkı yaklaşık 4 kattır. Nihai performans 50 kat farklı. Bunlar arasında, M65 modeli en büyük kontrol belleği kapasitesine sahiptir ve maliyet ve fiyat en pahalıdır, en düşük uç M30 modeli ise en küçük kontrol belleği kapasitesine sahiptir, bu nedenle System / 360 talimatlarını yürütmek için daha fazla mikro talimat gerekir.

IBM, bilgi işlem endüstrisinde devrim yaratacağını ve geleceği kazanacağını umarak, bu yeni talimat setinde şirketin geleceğine bahse girer. Sonunda, IBM arzusuna kavuştu, pazara başarılı bir şekilde hakim oldu ve bugüne kadar etkisini sürdürdü. 55 yaşındaki bu modellerin torunları, IBM'e yıllık 10 milyar ABD doları gelir getirmeye devam edebilir.

Donanım sistemi mimarisi ve ticari bilgisayarlar arasındaki yakın bağlantı nedeniyle, piyasanın teknik sorunlara ilişkin değerlendirmesi mükemmel olmasa da, piyasa sonunda bilgisayar mimarisi yeniliklerinin başarısında kilit bir faktör haline geliyor. Bu yenilikler genellikle mühendislik gerektiriyor. Personele ağır yatırım.

Tümleşik devre, CISC, 432, 8086, IBM PC

Bilgisayarlar entegre devreler çağına girdiğinde, Moore Yasasının gücü kontrol belleğini büyütebilir ve bu da 1977'de Digital Equipment tarafından piyasaya sürülen VAX-11/780 modeli gibi daha karmaşık komut setlerini doğurdu. , Kontrol hafıza kapasitesi 5120 komut kelimesi * 96bit'e ulaşırken, önceki modeli sadece 256 komut kelimesi * 56bit'tir.

Aynı zamanda, bazı üreticiler kaydedilebilir kontrol belleği (WCS) tasarlamaya ve müşterilerin işlevleri özelleştirebilmesi için mikro programlama işlevini bırakmaya başladılar.En ünlü modeller Turing Ödülü sahibi Chuck Thacker ve Butler Lampson ve meslektaşlarıdır. Alto bilgisayarı, 1973'te Xerox'un Palo Alto Araştırma Merkezi için geliştirildi. Bu, ilk nokta vuruşlu ekran ve ilk Ethernet LAN ile donatılmış ilk kişisel bilgisayardır ve denetleyicisi 4096 komut kelimesi * 32bit kapasiteli bir WCS'de saklanır.

Öte yandan, 1970'lerde mikroişlemciler hala 8-bit çağındaydı (Intelin 8080 işlemcisi gibi) ve esas olarak montaj dili programlamasını kullanıyorlardı. Çeşitli şirketlerin tasarımcıları rakiplerini aşmak ve benimsemek için yeni talimatlar eklemeye devam edeceklerdi. Assembly dili avantajlarını gösterir.

Gordon Moore, Intelin yeni nesil talimat setinin Intelin yaşamına eşlik edeceğine inanıyor. Çok sayıda akıllı bilgisayar bilimi doktorasını işe aldı ve bir sonraki harika talimat setini oluşturmak için onları Portland'daki yeni bir fabrikaya gönderdi. Mimari. Intel tarafından orijinal adı 8800 olan bu bilgisayar mimarisi projesi iddialı, 32 bit adresleme yetenekleri, nesne yönelimli mimari, değişken bit uzunluklu komutlar ve o zamanın en son programlama dili Ada ile yazılmış bir işletim sistemine sahip. 20. yüzyılın 80'leriydi. Çağın en zorlu projesi.

Ne yazık ki, bu proje defalarca birkaç yıl ertelendi ve Intel'i Santa Clara'da bir acil durum değiştirme programı başlatmaya, 1979'da daha sonra 8086 olan 16 bit işlemciyi başlatmaya zorladı. Intel, yeni ekibe yeni bir komut seti geliştirmeleri ve çipler tasarlayıp inşa etmeleri için 52 hafta verdi. Zaman kısıtlamaları nedeniyle, ekip aslında 8080'in 8 bitlik kayıtlarını ve komut setini 16 bit'e genişletti ve ISA bölümünü tasarlamak yalnızca 10 kişi ve 3 hafta sürdü. Sonunda 8086 planlandığı gibi tamamlandı, ancak piyasaya sürüldüğünde pek ilgi görmedi.

Bu sefer Intel şanslıydı. O sırada IBM, Apple II ile uyumlu olan ve 16 bit işlemciye ihtiyaç duyan bir kişisel bilgisayar geliştiriyordu. IBM, bir zamanlar Motorola 68000 işlemcisiyle çok ilgilendi, IBM 360'a benzer bir komut setine sahip, ancak performansı IBM'in agresif taleplerini karşılayamadığı için Intel 8086'nın 8 bitlik veri yolu sürümüne geçti. IBM, bu modelin 12 Ağustos 1981'de 100 milyon adetlik küresel satışla lansmanını duyurdu ve Intel'in talimat seti için çok parlak bir geleceğin yolunu açtı.

Intelin orijinal 8800 projesinin adı iAPX-432 olarak değiştirildi ve sonunda 1981'de piyasaya sürüldü, ancak birden çok yonga gerektirdi ve ciddi performans sorunları yaşadı ve sonunda 1986'da sona erdirildi. Yine bu yıl Intel, 8086 komut setinin kayıtlarını 16 bitten 32 bit'e çıkaran 80386 işlemciyi tanıttı. Gordon Mooreun tahmini gerçeğe dönüştü. Intelin yeni nesil talimat seti gerçekten de hayatta kaldı, ancak piyasanın tercihi, çok beklenen iAPX-432 değil, tehlikede olan 8086 idi. Bu, Motorola 68000 ve iAPX için iyi bir eşleşme. 432 mimarları için bu pratik bir ders ve piyasa her zaman sabırsız.

CISC'den RISC'ye

1980'lerin başında insanlar bellekteki büyük mikro programları kontrol etmek için CISC (Karmaşık Komut Seti Bilgisayarı) üzerinde çalışmaya başladılar ve Unix sisteminin doğuşu, işletim sistemlerini yazmak için yüksek seviyeli dillerin kullanılabileceğini kanıtladı. Bu nedenle, sonraki sorunun anahtarı "programcılar" dan geliyor. "Hangi montaj dili kullanılacak", "derleyicinin hangi talimatları üreteceği" haline geldi ve donanım ve yazılım arayüzlerindeki önemli gelişmeler mimari yenilik için fırsatlar getirdi.

Turing Ödülü sahibi John Cocke ve meslektaşları, küçük bilgisayarlar için daha basit bir talimat seti ve derleyici geliştirdiler ve derleyicinin hedefini "IBM 360 komut setindeki basit kayıt-kayıt işlemlerini yalnızca basit bir şekilde kullanmak" olarak belirlediler. Yükleme ve Depolama işlemleri belleğe erişir ". Böylesine basitleştirilmiş bir işlemin programı 3 kat daha hızlı çalıştırabileceğini buldular. Emer ve Clark, VAX talimatlarında yaygın olarak kullanılan talimatların% 20'sinin mikrokodun% 60'ını gerektirdiğini, ancak yürütme süresinin yalnızca% 0,2'sini kapladığını buldu.

David Patterson, VAX direktifindeki boşlukları azaltmak için DEC'te akademik bir izin belgesi yatırdı. İşlemci üreticileri daha büyük ve daha karmaşık bir komut seti tasarlamak istiyorlarsa, kaçınılmaz olarak mikrokod güvenlik açıklarını düzeltmek için bir yola ihtiyaç duyacaklarına inanıyor. Patterson bu konuda bir makale yazdı, ancak "Bilgisayar" dergisi bunu yayınlamayı reddetti. Gözden geçirenler, yamalanması gereken kadar karmaşık bir komut setine sahip bir işlemci tasarlamanın kötü bir fikir olduğuna inanıyorlardı.

Şimdi bakılmasına rağmen, modern CISC işlemcileri bir mikro kod onarım mekanizması içeriyor, ancak o zamanki reddedilme, insanların işlemcideki karmaşık talimat setinin değerinden şüphe duymasına neden oldu ve bu da ona daha basit ve modern talimatlar geliştirmesi için ilham verdi. Set ve RISC (azaltılmış komut seti bilgisayarı).

Bu görüşlerin oluşturulması ve montaj dilinden yüksek seviyeli dile geçiş, CISC'den RISC'ye geçiş için gerekli koşulları yarattı. İlk olarak, azaltılmış komut seti basitleştirilmiştir. Talimatlar genellikle mikro talimatlar kadar basittir ve donanım doğrudan çalıştırılabilir, bu nedenle mikro kod yorumlayıcıya gerek yoktur. İkincisi, mikro kod yorumlayıcı için kullanılan hızlı bellek RISC olarak kullanılır Komut önbelleği; üçüncü olarak, Gregory Chaitin grafik renklendirme yöntemine dayalı yazmaç ayırıcı, derleyicinin yazmaçları daha kolay ve verimli kullanmasını sağlar.Bu komut seti, yazmaç-yazma işlemleri için büyük faydalara sahiptir; son olarak, entegre devre ölçeğinin geliştirilmesi , Böylece 1980'lerde tek bir yonga, tam bir 32-bit veri yolu ve karşılık gelen talimat ve veri önbelleklerini içermek için yeterlidir.

Aşağıdaki resim, Berkeley'deki California Üniversitesi tarafından 1982 yılında geliştirilen RISC-I işlemcisini ve 1983 yılında Stanford Üniversitesi tarafından geliştirilen MIPS işlemcisini göstermektedir. İki yonga RISC'nin avantajlarını tam olarak gösterdi ve sonunda 1984 IEEE Uluslararası Katı Hal Devreleri Konferansında yayınlandı. California Üniversitesi ve Stanford'dan irili ufaklı yüksek lisans öğrencileri, sektördeki mevcut ürünlerden daha iyi bir işlemci geliştirdiler.Bu çok dikkate değer bir andır.

Akademik kurumlar tarafından geliştirilen bu çipler, birçok şirkete RISC işlemcileri üzerinde çalışmaya başlamaları için ilham verdi ve önümüzdeki 15 yıl içinde en hızlı büyüyen alan haline geldi. Nedeni, işlemcinin performans formülüdür:

Zaman / program = işlenen / program * (saat döngüsü) / talimat * zaman / (saat döngüsü)

DEC mühendisleri daha sonra her program için CISC işlemcisi tarafından gerçekleştirilen işlem sayısının RISC işlemcisininkinin (yukarıdaki formülün ilk maddesi) yaklaşık% 75'i olduğunu gösterdi. Benzer teknolojiler kullanıldığında, CISC işlemcisi her bir talimatı yürütmek için daha fazla tüketir. 5 ila 6 saat döngüsü (yukarıdaki denklemin ikinci terimi), RISC işlemcisini yaklaşık 3 kat daha hızlı hale getirir.

Bu tür formüller henüz 1980'lerde bilgisayar mimarisi kitabına girmedi, bu nedenle, bilgisayar mimarisini nicel olarak değerlendirmek için ölçümler ve kıyaslama testleri kullanarak 1989'da "Bilgisayar Mimarisi: Bir Niceliksel Yaklaşım" kitabını yazdık ve Mimarın sezgisine ve deneyimine daha fazla güvenmek yerine, kullanılan nicel yöntem, Turing Ödülü sahibi Donald Knuth'un algoritmalar hakkındaki kitabından da esinlenmiştir.

VLIW, EPIC, Itanium

Komut seti mimarisindeki bir sonraki yenilik, hem RISC hem de CISC'ye, yani çok uzun komut kelimesine (VLIW) ve açık paralel komut bilgisayarına (EPIC) fayda sağlamaya çalışır. Bu iki icat, Intel ve Hewlett-Packard tarafından ortaklaşa adlandırılmıştır ve her talimat, birlikte paketlenmiş, bağımsız olarak çalıştırılan birden çok geniş talimat kullanır. RISC gibi, VLIW ve EPIC'in amacı da iş yükünü donanımdan derleyiciye aktarmaktır. Savunucuları, altı bağımsız işlemin (iki veri aktarımı, iki tamsayı işlem ve iki Alt kayan nokta işlemleri) ve derleyici teknolojisi işlemleri etkili bir şekilde altı komut yuvasına tahsis edebilir, donanım daha basit hale gelebilir.

Intel ve Hewlett-Packard, EPIC konseptine dayalı bir 64 bit işlemci Itanium (Itanium) tasarlamak için işbirliği yaptı ve 32 bit x86 işlemciyi bununla değiştirmek istedi. Intel ve HP'nin Itanium için yüksek beklentileri var, ancak gerçek durum beklentilerini karşılamıyor EPIC yüksek yapılandırılmış kayan nokta programları için uygun olmasına rağmen, önbellek atlamalarını veya düşük öngörülebilirlikle önbellek atlamalarını önlemek zordur. Dalları tahmin etmesi zor olan tamsayı programlarında yüksek performans elde edin.

Donald Knuth daha sonra Itanium'un vizyonunun harika olduğuna işaret etti, ancak bu vizyonu karşılayan bir derleyici yazmanın temelde imkansız olduğu ortaya çıktı. Geliştiriciler Itanium'un gecikmesini ve zayıf performansını fark ettiler ve Titanic olayına dayanarak onu "Itanic" olarak yeniden adlandırdılar. Bununla birlikte, daha önce de belirtildiği gibi, pazar her zaman sabırsızdır ve sonunda 64-bit x86-64 halefi oldu ve sıra Itanium'da değildi.

Bununla birlikte, iyi haber şu ki, VLIW hala yüksek dal tahmini ve önbelleğe alma gerektirmeyen dijital sinyal işleme gibi alanlarda küçük bir aralıkta kullanılıyor.

RISC ve CISC, PC ile PC sonrası dönem arasındaki kader hesaplaşması

Intel ve AMD, x86 ile RISC arasındaki performans açığını daraltmak için 500 kişilik bir tasarım ekibine ve mükemmel yarı iletken teknolojisine güveniyor. Intel ve AMD, karmaşık talimatlara göre basitleştirilmiş talimatların performans avantajlarından esinlenerek, RISC mikro talimatlarının yürütülmesini kolaylaştırdı. Komut kod çözücünün, çalışma sırasında karmaşık x86 talimatlarını RISC benzeri dahili mikro talimatlara dönüştürmesini sağlar, böylece x86 işlemcisi, RISC'nin performans ayırma talimatlarını, veri önbelleğini, ikinci seviye yonga önbelleğini, derin işlem hattını ve birden çok parçanın eşzamanlı olarak alınması ve yürütülmesini Talimatlar gibi birçok mükemmel tasarım. 2011'de PC çağının zirvesinde, Intel ve AMD her yıl yaklaşık 350 milyon x86 işlemci sattı. Bilgisayar endüstrisinin yüksek üretim hacmi ve düşük kar marjları, fiyatların RISC bilgisayarlardan daha düşük olduğu anlamına da gelir.

Unix pazarında, yazılım satıcıları farklı karmaşık komut setleri (Alpha, HP-PA, MIPS, Power ve SPARC) için farklı yazılım sürümleri sağlarken, PC pazarında yalnızca tek bir mutlak genel komut seti seti varken ve yalnızca yazılım geliştiricileri X86 komut setiyle uyumlu olması gerekir. Her yıl dünya çapında gönderilen yüz milyonlarca PC ile yazılım büyük bir pazar haline geldi. Daha büyük yazılım tabanı, benzer performans ve daha düşük fiyat, x86 işlemcilerin 2000'den önce aynı zamanda masaüstü ve küçük sunucu pazarlarına hakim olmasını sağladı.

Apple, iPhone'u 2007'de piyasaya sürerek PC sonrası dönemi başlattı. Akıllı telefon şirketleri artık işlemci satın almıyor, ancak kendi SoC'lerini oluşturmak için diğer şirketlerin tasarımlarını kullanıyor. Mobil cihaz tasarımcılarının çip alanını, enerji verimliliğini ve performansı kapsamlı bir şekilde değerlendirmeleri gerekir.CISC işlemcileri bu noktada dezavantajlı durumdadır. Ek olarak, Nesnelerin İnternetinin gelişi çok sayıda işlemci gerektirir ve yonga boyutu, güç, maliyet ve performans açısından ödünleşimler yapmak daha da gereklidir. Bu eğilim, tasarım süresinin ve maliyetinin önemini artırdı ve CISC işlemcisini daha da dezavantajlı duruma getirdi. Bugünün "PC sonrası çağında" x86 işlemci sevkiyatları, 2011'deki zirveden bu yana her yıl yaklaşık% 10 düşerken, RISC işlemci sevkiyatları 20 milyara yükseldi. Bugün, 32 bit ve 64 bit işlemcilerin% 99'u RISC işlemcileridir.

Bu geçmişi özetleyerek, piyasanın RISC ile CISC arasındaki kader tartışmasını çözdüğü söylenebilir. CISC, PC çağının sonraki aşamalarını kazandı, ancak RISC, PC sonrası dönemde hakim durumda. Karmaşık komut setleri alanında, onlarca yıldır hiçbir yeni komut seti ortaya çıkmadı Günümüzün genel amaçlı işlemcileri için, en iyi seçim hala basitleştirilmiş komut setidir.

İşlemci mimarisinin karşılaştığı mevcut zorluklar

"Eğer bir sorun çözülemezse, bu bir sorun değil, gerçek olabilir. Çözmemize gerek yok, ancak zamanla halledelim."

Shimon Peres

Önceki kısım komut seti mimarisinin tasarımına odaklansa da, çoğu bilgisayar mimarı yeni bir komut seti tasarlamaz, ancak mevcut ISA'yı uygulamak için mevcut uygulama teknolojisini kullanır. 1970'lerin sonlarından bu yana, tercih edilen teknoloji MOS (Metal Oksit Yarı İletken) tabanlı entegre devreler, önce nMOS (n-tipi metal oksit yarı iletken) ve ardından CMOS (tamamlayıcı metal oksit yarı iletken) olmuştur.

Gordon Moore, 1965'te entegre devrelerin transistör yoğunluğunun her yıl ikiye katlanacağını ve 1975'te her iki yılda bir ikiye katlanacağını tahmin etmişti. Bu tahmin sonunda Moore Yasası olarak adlandırıldı. Bu tahminde, transistör yoğunluğu iki kat arttı ve inanılmaz evrim hızı, mimarların performansı artırmak için daha fazla transistör kullanmasına izin veriyor.

Moore Yasası ve Dennard'ın Ölçeklendirme Yasasının Başarısızlığı

Şekil 2'de gösterildiği gibi, Moore Yasası on yıllarca sürdü, ancak 2000 civarında yavaşlamaya başladı. 2018'e gelindiğinde, gerçek sonuç Moore Yasası'nın tahmininden 15 kat farklıydı, ancak Moore'un 2003'te verdiği karar Kaçınılmaz (GE Moore tarafından yazılan "Hiçbir üstel sonsuza kadar değildir: Ama 'sonsuza kadar' ertelenebilir!" Makalesine bakın). Mevcut duruma bağlı olarak bu boşluk artmaya devam edecek çünkü CMOS sınıra yakın.

Şekil 2 Tek bir Intel mikroişlemci üzerindeki transistörlerin sayısı ve Moore Yasası

Moore yasasına eşlik eden, Robert Dennard tarafından öngörülen Dennard ölçeklendirme yasasıdır (Dennard ölçeklendirme; MOSFET ölçeklendirme yasası olarak da bilinir). Robert Dennard, 1974'te transistörün küçülmeye devam ettiğini ancak çipin güç yoğunluğunun değişmediğini öne sürdü. Transistörlerin yoğunluğu arttıkça, her transistörün enerji tüketimi azalacak, bu nedenle silikon çipte milimetre kare başına enerji tüketimi neredeyse sabit kalacaktır. Silikon yongaların milimetrekare başına düşen bilgi işlem gücü, teknolojinin yinelenmesiyle artmaya devam ettikçe, bilgisayarlar daha enerji verimli hale gelecektir. Ancak, Dennard'ın Ölçeklendirme Yasası, 2007'den beri önemli ölçüde yavaşladı ve 2012'de sona ermek üzere (bkz. Şekil 3).

Şekil 3 Her yonga üzerindeki transistörler ve milimetre kare başına güç

1986'dan 2002'ye kadar, yönerge düzeyinde paralel (ILP) kullanımı, mimarinin performansını iyileştirmenin ana yöntemiydi.Transistör hızındaki artışla, performansı her yıl yaklaşık% 50 oranında iyileştirilebilirdi. Dennard'ın ölçeklendirme yasasının sonu, mimarların paralellikten yararlanmak için daha verimli yollar bulmaları gerektiği anlamına geliyor.

ILP eklenmesinin getirdiği yüksek verimliliği anlamak için ARM, Intel, AMD gibi mevcut işlemci çekirdeklerine göz atabilirsiniz. Çipin 15 aşamalı bir boru hattına (boru hattı) sahip olduğu ve saat döngüsü başına 4 talimat gönderebildiği varsayıldığında, yürütülen talimatların yaklaşık% 25'ini oluşturan yaklaşık 15 şube dahil olmak üzere herhangi bir zamanda 60 kadar talimata sahiptir. İşlem hattından tam olarak yararlanabilmek için, şubeyi tahmin etmeniz ve kodu, spekülasyona dayalı olarak yürütmek üzere ardışık düzene koymanız gerekir. Spekülatif kullanım aynı zamanda ILP'nin yüksek performansının ve düşük enerji verimliliğinin kaynağıdır. Şube tahmini mükemmelse, spekülasyon ILP performansını artırabilir, ancak enerji tüketimi artacaktır (ve enerji tasarrufu sağlayabilir), ancak şube tahmini yanlışsa, işlemci yanlış spekülasyon talimatından vazgeçmelidir ve hesaplama enerjisi Boşa harcandı. İşlemcinin dahili durumu da, ek enerji ve zaman tüketecek olan yanlış tahmin edilen şubeden önceki duruma geri yüklenmelidir.

Bu tasarımın zorluğunu anlamak için, zorluğu bilmek için 15 şubeyi doğru tahmin etmeyi düşünün. İşlemci mimarisi, performans israfını% 10 içinde kontrol etmek istiyorsa, her şubeyi% 99,3 oranında doğru bir şekilde tahmin etmesi gerekir. Çok az genel amaçlı program bu kadar doğru tahmin edebilir.

Performans israfının üst üste binmesinin sonucunu anlamak için, etkili bir şekilde yürütülen ancak işlemci spekülasyon hataları nedeniyle boşa harcanan talimatları gösteren Şekil 4'e başvurabilirsiniz. Intel Core i7 kıyaslama testinde, talimatların% 19'u boşa gitti, ancak enerji israfı daha da ciddidir çünkü işlemcinin spekülasyon hatasından önceki duruma dönmek için ekstra enerji kullanması gerekir. Bu tür testler, birçok kişinin, performans iyileştirmeleri elde etmek için mimarların farklı bir yaklaşıma ihtiyaç duydukları sonucuna varmasına neden oldu. Böylece çok çekirdekli çağın doğuşunu başlattı.

Şekil 4 Farklı SPEC tamsayı karşılaştırma testleri, Intel Core i7, tamamlanan talimatların toplam sayısının yüzdesi olarak talimatları boşa harcadı

Çok çekirdekli, paralelliği tanımlama ve nasıl kullanılacağına karar verme görevini programcılara ve programlama dillerine aktarır. Çok çekirdek, enerji tasarrufu sorununu çözmez ve bu zorluk, Dennard'ın ölçeklendirme yasasının sona ermesi nedeniyle daha ciddidir. Her aktif çekirdek, hesaplamaya etkili bir şekilde katkıda bulunup bulunmadığına bakılmaksızın enerji tüketir. Paralel hesaplamada birden çok işlemcinin uygulama hızlanmasının programın gerektirdiği seri sürenin yüzdesi ile sınırlı olduğunu belirten Amdahl Yasası ile büyük bir engel ifade edilebilir. Bu yasanın önemi Şekil 5'de gösterilmiştir. Tek bir çekirdek ile karşılaştırıldığında 64 çekirdeğe kadar uygulama hız farklarını yürütür.Seri yürütmenin farklı bölümlerinde sadece bir işlemcinin aktif olduğu varsayılır. Örneğin, zamanın yalnızca% 1'i seri ise, 64 çekirdekli bir yapılandırma yaklaşık 35 kat hızlanabilir.Elbette, enerji 64 işlemciyle orantılıdır ve enerjinin yaklaşık% 45'i boşa harcanır.

Şekil 5 Amdahl yasasının program hızlandırma üzerindeki etkisi

Gerçek program elbette daha karmaşıktır ve bazı bileşenler belirli bir anda farklı sayıda işlemcinin kullanılmasına izin verir. Ancak, düzenli iletişim ve senkronizasyon ihtiyacı, çoğu uygulamanın işlemcinin yalnızca bir bölümünü verimli bir şekilde kullanabileceği anlamına gelir. Amdahl yasası 50 yılı aşkın süredir yürürlükte olmasına rağmen, bu hala büyük bir zorluk.

Dennard'ın ölçeklendirme yasasının sona ermesiyle birlikte çip çekirdek sayısındaki artış, enerji tüketiminin de artması anlamına geliyor. Ne yazık ki, işlemciye giren elektrik enerjisinin bir kısmı ısıya dönüştürülür, bu nedenle çok çekirdekli işlemciler, paket ve soğutma sistemi tarafından maksimum yükte dağıtılan maksimum ısı miktarı olan termal dağıtım gücü (TDP) ile sınırlıdır. Bazı üst düzey veri merkezleri daha gelişmiş paketleme ve soğutma teknolojileri kullanabilse de, hiçbir bilgisayar kullanıcısı masasına küçük bir ısı eşanjörü koymak veya bir cep telefonuna radyatör eklemek istemez. TDP'nin sınırlandırılması doğrudan karanlık silikon çağına yol açtı, yani işlemci saat frekansını düşürdü veya işlemcinin aşırı ısınmasını önlemek için boştaki çekirdeği kapattı. Bu yaklaşımın bir başka açıklaması, bazı yongaların değerli enerjilerini boş çekirdeklerden aktif çekirdeklere aktarabilmeleridir.

Dennard'ın ölçeklendirme yasasının sonu, Moore yasası yavaşlıyor ve doğru zamanda Amdahl yasası, verimsizliğin yıllık performans iyileştirmesini birkaç yüzde puanla sınırladığı anlamına geliyor (6'da gösterildiği gibi). Yüksek performans elde etmek isteyenler (1980'lerde ve 1990'larda olduğu gibi) yeni mimari yöntemler gerektirir, yeni yöntemler entegre devrelerin daha verimli kullanılması gerekir. Daha sonra, modern bilgisayarların bir başka büyük kusurunu tartışacağız - bilgisayar güvenliğinin desteği ve eksikliği ve ardından entegre devreleri etkili bir şekilde kullanmanın yeni yollarını keşfetmeye devam edeceğiz.

Şekil 6 Bilgisayar performans iyileştirmesi (SPECintCPU)

İhmal edilen bilgisayar güvenliği

1970'lerde işlemci mimarları, koruma halkaları ve işlevsel güvenliği içeren esas olarak bilgisayar güvenliğine odaklandılar. Mimarlar, güvenlik açıklarının çoğunun yazılımda olduğunun farkındadır, ancak mimarinin yardımcı olabileceğini düşünüyorlar. Bu işlevlerin çoğu, kasıtlı olarak sözde iyi huylu ortamlara (kişisel bilgisayarlar gibi) odaklanan işletim sistemleri tarafından kullanılmaz ve bu işlevler çok fazla tüketim içerir, bu nedenle ortadan kaldırılır. Yazılım topluluğunda birçok kişi, mikro çekirdekler gibi resmi doğrulama teknolojilerinin yüksek güvenlikli yazılımlar oluşturmak için etkili garantiler sağlayacağına inanıyor. Ne yazık ki, yazılım sistemi boyutumuz ve performans sürücülerimiz, bu tür teknolojilerin işlemci performansına ayak uyduramadığı anlamına gelir. Sonuç, büyük yazılım sistemlerinin hala birçok güvenlik açığına sahip olması ve büyük çevrimiçi kişisel bilgilerin ve bulut bilgi işlemin kullanılması nedeniyle etkinin artmasıdır.

Dennard'ın ölçeklendirme yasasının sonu, mimarların paralelleştirmeden yararlanmak için daha verimli yollar bulmaları gerektiği anlamına geliyor.

Mimarlar ve diğerleri güvenliğin önemini çok geç fark ettiler, ancak sanal makineler ve şifreleme için donanım desteği sağlamaya başladılar. Ne yazık ki, spekülasyon birçok işlemciye bilinmeyen ancak bariz güvenlik açıkları getirdi. Özellikle Meltdown ve Spectre güvenlik açıkları, yeni exploit bit mimarisinde güvenlik açıklarına yol açarak korumalı bilgilerin hızla sızdırılmasına olanak tanır.Her iki güvenlik açığı da yan kanal saldırılarını kullanır. 2018'de araştırmacılar, saldırganın kodu hedef işlemciye yüklemeden ağ bilgilerini sızdırmak için Spectre varyantlarının nasıl kullanılacağını gösterdi. NetSpectre adı verilen bu saldırının bilgi sızdırması yavaş olsa da, aynı yerel alan ağındaki (veya buluttaki aynı kümedeki) tüm makinelerin saldırıya uğramasına neden olacak ve bu da birçok yeni güvenlik açığı oluşturacaktır. Ayrıca, sanal makine mimarisinde, biri Foreshadow adı verilen ve özellikle yüksek riskli verileri (şifreleme anahtarları gibi) koruyan Intel SGX güvenlik mekanizmasını etkileyen bildirilen iki güvenlik açığı vardır. Artık her ay yeni güvenlik açıkları keşfediliyor.

Yan yana saldırılar yeni değildir, ancak ilk vakaların çoğunda yazılım güvenlik açıkları başarılı saldırıların anahtarıdır. Ancak Meltdown ve Spectre gibi saldırılarda, donanım kusurları korumalı bilgilerin açığa çıkmasına neden olur. İşlemci mimarının doğru ISA'yı nasıl tanımladığı kaynakta bir sorundur, çünkü standart, talimat dizilerinin yürütülmesinin performans etkisini belirtmez, sadece ISA tarafından görülebilir yürütme mimarisi durumunu içerir. Mimarların, benzer güvenlik açıklarından kaçınmak için ISA'nın doğru uygulanmasının tanımını yeniden düşünmesi gerekir. Aynı zamanda, bilgisayar güvenliğine ve mimarların ve yazılım tasarımcılarının daha güvenli bir sistem elde etmek için nasıl birlikte çalışabileceklerine odaklanmalarını da yeniden düşünmelidirler. Mimarlar (ve herkes) bilgi sistemlerine o kadar bağımlıdırlar ki, birinci sınıf tasarıma göre güvenliğe daha az dikkat ederler.

Lei Feng Net tarafından derlenmiştir.Bu makale A New Golden Age for Computer Architecture, John L. Hennessy, David A. Patterson Lei Feng Net tarafından derlenmiştir.

Yeni nesil Magotan neden Çinliler için özel olarak üretilmiş bir otomobil?
önceki
Bugünün rüzgarı | Bir "Wine Song" şarkısı sahneleniyor: Baijiu% 6,35 yükseldi, Moutai rekor seviyeye ulaştı ve Golden Seed Liquor dahil 9 hisse senedinin günlük limiti vardı!
Sonraki
Bir araç kuralları ihlal ettikten sonra, bilet ödemenin en uygun yolu hangisidir?
Çin Sevgililer Günü'nü sizinle geçirmek için iyi bir film seçin
Şişman adam yetenekli ve hünerli, Zotye Damai X72.0T'yi test ediyor
Şanghay Moda Haftası'nda bazı insanlar sırtlarına basketbol takıyor ve bazıları da bebekleri küpe olarak kullanıyor?
Turing Ödülü sahibinin uzun raporu: Bilgisayar mimarisinin yeni altın on yılını açan nedir? (altında)
Pratiklik hala ana özellik, test sürüşü Dongfeng Fengxing Jingyi X61.5T
Sıfırdan bir transfer öğrenme modeli eğitmeye gerek yok! Amazon açık kaynak geçiş öğrenme veritabanı Xfer
Hedef Apple Watch'a mı yönelik? Samsung Galaxy Watch piyasaya çıktı: uzun pil ömrü övgü
Korkusuz, Lexus'un yeni LS / LC tasarım yorumu
Mikro vizyon video kırmızı zarf resmi olarak piyasaya sürüldü.Kırmızı zarflar Bahar Şenliği sırasında verilecek.
Bu yazın en kaçırılmayacak Amerikan dizisi!
Lisans eğitimini canlandırmak için Yüksek Öğretim Bölümü 2018'de bu 10 önemli şeyi yaptı!
To Top