Ana akım çip mimarisi değişmek üzere!

[CSDN editörünün notu] Ekipman genişletmenin faydaları gittikçe azaldıkça, insanlar yerel olarak daha fazla veriyi işlemek için yerleşik yapay zeka ile sistemler tasarlamaya başlıyor. Çip üreticileri, enerji tüketimi ve saat döngüsü başına işlenebilecek veri miktarını önemli ölçüde artırabilecek ve önümüzdeki birkaç on yılda yonga mimarisinde büyük değişikliklerin temelini atabilecek yeni bir yapı üzerinde çalışıyorlar.

Tüm büyük çip üreticileri ve sistem üreticileri yön değiştiriyor

Tüm büyük yonga üreticileri ve sistem üreticileri yön değiştiriyorlar. Verileri belleğe okuma yönteminden veri işleme ve yönetim yöntemine ve çeşitli öğelerin nihayet nasıl paketlendiğine kadar mimari bir rekabeti tetiklediler. Tek bir çip tüm yönlere sahiptir. Düğümlerin küçülmesi devam edecek olsa da, çeşitli sensörler ve gittikçe daha fazla makine arasındaki iletişimin patlayıcı veri büyümesiyle başa çıkmak için hiç kimse ölçeklenebilirlik üzerine her şeye bahse girmeyecek.

Bu değişiklikler arasında dikkatimizi çekecek bazı şeyler var:

  • Yeni işlemci mimarisi, her saat döngüsünde büyük veri bloklarını işlemeye odaklanır.Uygulamanın farklı ihtiyaçlarına bağlı olarak, bazen daha düşük bir doğruluk seçebilir veya bazı işlemlere daha yüksek bir öncelik verebilirsiniz.
  • Verilerin saklanma, okuma, yazma ve erişilme şeklini değiştirecek yeni bir hafıza mimarisi geliştirilmektedir.
  • Belleğe en yakın yere yerleştirilmek üzere sistemin çeşitli bölümlerine daha yönlü işlem elemanları dağıtılır. İleride, hızlandırıcı veri türüne ve uygulamaya göre seçilecektir.
  • Farklı veri türlerini örüntüler oluşturmak için karıştırmak, böylece veri yoğunluğunu etkin bir şekilde artırmak ve veriler arasındaki farkı en aza indirmek için AI hakkında birçok araştırma da vardır.
  • Ambalaj artık mimarinin temel bir parçasıdır ve tasarım modifikasyonunun kolaylığına giderek daha fazla vurgu yapılmaktadır.

Rambus'un önde gelen mucidi Steven Woo şunları söyledi: "İnsanların mevcut çözümlerden en fazla faydayı elde etmek istemesine neden olan çeşitli trendler var. İnsanlar veri merkezinde, donanım ve yazılımın tüm performansını sıkıştırmak istiyor. Bu, insanların veri merkezinin ekonomisini yeniden düşünmesini sağlıyor. Mod. Yeniliğin maliyeti çok yüksek. Ancak teknoloji değişimi darboğazdır, bu nedenle özel yongaları göreceğiz ve bilgi işlem verimliliğini artırmanın birçok yolunu göreceğiz. Bellek ile giriş ve çıkış arasındaki veri alışverişini azaltabilirsek, Büyük bir etki yaratın. "

Edge cihazlarındaki değişiklik özellikle belirgindir

Bu değişiklik özellikle uç cihazlarda belirgindir ve sistem satıcıları aniden on milyarlarca cihazın ürettikleri tüm verileri işlenmek üzere buluta göndereceğini keşfettiler. Bu veri miktarı açıkça çok büyük. Bununla birlikte, uç cihazlarda büyük miktarda verinin işlenmesi yeni zorluklar ortaya çıkarır ve işlem performansı, enerji tüketimini önemli ölçüde artırmadan iyileştirilmelidir.

Nvidia'nın Tesla ürün serisinin baş platform mimarı Robert Ober, "Şimdi odak noktası doğruluğu azaltmaktır. Bu yalnızca daha fazla hesaplama döngüsü gerektirmekle kalmaz, aynı zamanda belleğe daha fazla veri yerleştirilmesini gerektirir ve yalnızca kullanılabilir 16-bit komut formatı. Bu nedenle, verileri önbelleğe koyarak verimlilik iyileştirilemez. İstatistiksel olarak konuşursak, iki yöntemin sonuçları aynıdır. "

Ober, bir dizi mimari optimizasyon yoluyla, öngörülebilir gelecekte her iki yılda bir işlem hızını ikiye katlamanın tamamen mümkün olduğunu tahmin ediyor. "En modern değişiklikleri göreceğiz" dedi.

"Bunu yapmak için, üç darboğazı çözmemiz gerekiyor. Birincisi bilgi işlem. İkincisi bellek. Bazı modeller bellek erişimi, diğer modeller hesaplama sorunları. Üçüncüsü ana bilgisayar bant genişliği ve G / Ç bant genişliği. . Depolama ve ağı optimize etmek için çok çalışmamız gerekiyor. "

Bazıları zaten uygulanmıştır. Samsung Austin Ar-Ge Merkezi'nin çekirdek mimarı Jeff Rupley Hot Chips 2018 konferansında yaptığı konuşmada, Samsung'un M3 işlemcisindeki birkaç önemli mimari değişikliğe dikkat çekti. Bunlardan biri saat döngüsü başına daha fazla komut yürütebilir, önceki dört M2 ile karşılaştırıldığında M3 altıyı çalıştırabilir. Dal tahmin işlevi (kabaca aramada ön getirme gerçekleştirme gibi birkaç sinir ağının işlevi) ve iki katı derinlikli bir talimat kuyruğu ile birleştiğinde, bu sorunları çözmesi beklenir.

Başka bir perspektiften, bu değişiklikler yeniliğin odağını üretim ve işleme teknolojisinden ön uç mimari ve tasarıma ve arka uçta üretim sonrası paketleme sürecine kaydırıyor. İşleme teknolojisinde hala yenilikler olacak olsa da, her yeni düğümün performansını% 15 ila% 20 oranında artırmak çok karmaşıktır ve mevcut hızlı veri büyümesine ayak uydurmak zordur.

Xilinx Başkanı ve CEO'su Victor Peng Hot Chips'te yaptığı konuşmada, "Değişiklikler üstel bir oranda meydana geliyor. Her yıl 10ZB (1021 bayt) veri üretiliyor ve bunların çoğu yapılandırılmamış verilerden oluşuyor."

Yeni bir hafıza yolu

Bu kadar çok verinin işlenmesi, verilerin işlenme biçiminden depolanma biçimine kadar sistemin her bileşenini yeniden düşünmeyi gerektirir.

ESilicon EMEA Kıdemli İnovasyon Direktörü Carlos Maciàn, "Yeni bir bellek mimarisi oluşturmak için boşuna çabalar oldu. Sorun şu ki, tüm satırları okumanız ve her satırdan bir parça seçmeniz gerekiyor. Alternatif bir yol Soldan sağa ve yukarıdan aşağıya okunabilen bir bellek oluşturmaktır. Bir adım daha ileri giderek hesaplamaları her belleğe en yakın yere dağıtabilirsiniz. "

Bu değişiklikler, belleğin okunma şeklini, belleğin konumunu, işlem öğelerinin türlerini ve tüm sistemdeki verilerin depolanmasını, konumunu, işlenmesini ve hareketini optimize etmek için AI kullanımını içerir.

"Seyrek veri durumunda, başka şeylere enerji harcamadan, bellek dizisinden bir seferde yalnızca bir bayt okuyabilir veya aynı bayt kanalından bir seferde ardışık 8 bayt okuyabiliriz. İlgili bayt veya bayt kanalında ne olur? "Dedi Cadence ürün pazarlama direktörü Marc Greenberg.

"Gelecekte, bu değişiklikle daha fazla ilgilenebilirsiniz. Örnek olarak HBM2'nin mimarisini alın. HBM2'nin wafer stack organizasyonu 16 sanal kanaldır, her kanal 16 bit genişliğindedir, bu nedenle hangi kanala erişirseniz erişin, yalnızca 4 tane almanız gerekir. Ardışık 64 bit sözcükler yeterlidir. Dolayısıyla, bir seferde dikey yönde dört 64 bit sözcük okurken, 1024 bit genişliğinde bir veri dizisi oluşturmak ve bunu yatay olarak yazmak tamamen mümkündür. "

Bellek, von Neumann'ın mimarisindeki temel bileşenlerden biridir, ancak aynı zamanda en büyük deneysel alan haline gelmiştir. AMDnin müşteri ürünlerinin baş mimarı Dan Bouvier, "En büyük cezalardan biri, verileri taşımak için birçok anormal yöntem kullanan sanal bellek sistemidir. Sürekli olarak adres çevirisi yapmanız gerekir. Ve biz buna alıştık. Ama yapabilirsek DRAM'deki banka çakışmalarını ortadan kaldırmak, daha etkili veri aktarımına olanak tanır. Bu nedenle, ayrık GPU'lar DRAM'i etkili aralığın% 90'ına kadar kullanabilir, bu çok küçüktür. Ancak veri iletimi daha düzgün olabilirse, APU ve CPU ayrıca% 80 ila% 85'lik etkili bir aralığa da ulaşabilir. "

IBM, esasen modern bir disk şeritleme versiyonu olan başka bir bellek mimarisi türü üzerinde çalışıyor. Bu mimari artık tek bir bellekle sınırlı değildir, ancak mevcut tüm belleği zamanında kullanmak için bir bağlantı teknolojisi kullanır.

Bu bağlantı teknolojisine, IBM'in sistem donanım mimarı Jeff Stuecheli tarafından bağlanabilirliğin "İsviçre Çakısı" adı verilmiştir. Bu yöntemin avantajı, farklı türde verilerin kullanılabilmesidir.

Stuecheli, "CPU daha çok merkezi bir yüksek performanslı sinyal arabirimi gibidir. Mikro mimari değiştirilirse, çekirdek saat frekansını artırmadan her saat döngüsünde daha fazlasını yapabilir."

Bağlantı ve verim, bu mimarilerin sürekli olarak üretilen verileri işlemesi için son derece önemlidir. Rambustan Woo, "Darboğaz artık verilerin hareketinde yatıyor. Tüm endüstri, bilgi işlemde harika bir iş çıkardı. Ancak, verileri beklemeniz veya belirli bir veri modelini beklemeniz gerekiyorsa, bellek hızının artırılması gerekir. Yani DRAM için NVM ile performans, veri akışı modeline bağlıdır. Akış erişimi için bellek verimliliği çok yüksektir. Rastgele erişimin etrafta gezinmesi o kadar hızlı değildir. Ve ne olursa olsun, veri miktarı arttıkça Harika, yapabileceğimiz tek şey hızı artırmak. "

Daha fazla hesap, daha az hareket

Daha karmaşık olan sorun, uç cihazların farklı hız ve frekanslarda üretilen birçok farklı türde veri oluşturmasıdır. Verilerin çeşitli işleme unsurları arasında daha sorunsuz hareket edebilmesi için, verilerin daha etkili bir şekilde yönetilmesi gerekir.

Arteris IP'nin Yönetim Kurulu Başkanı ve CEO'su Charlie Janac, "Çoktan çoğa, bellek alt sistemi, düşük güç giriş ve çıkışı ile şebeke ve halka topolojisi olmak üzere dört ana yapılandırma vardır. Bu dört parça aynı yere yerleştirilebilir. Çipte, IoT yongaları üretirken yapılan budur.Ya da, yüksek verimli bir HBM alt sistemi ekleyebilirsiniz.Ancak karmaşıklık büyük ölçüde artacaktır, çünkü yükün bir kısmı belirli yongaya bağlıdır ve her yonga daha fazlasına sahip olacaktır. Özel bir yük ve pin. Örneğin, bazı IoT yongaları, özellikle arabalardaki radar ve LiDAR yongaları gibi büyük miktarda veriyi işleyebilir. Bazı özel gelişmiş bağlantı işlevleri olmadan, bu yongalar mümkün olmazdı. "

Sorun, veri hareketinin gerçekleştirilmesi gerektiğinde veri akışını en üst düzeye çıkarırken, veri hareketini olabildiğince azaltmak ve çok fazla enerji tüketmeden yerel işlem ile merkezi işlem arasında bir denge sağlamaktır.

NetSpeed Systems'ın ürün pazarlama müdürü Rajesh Ramanujam, "Bir özellik bant genişliğidir. Verileri taşımamak için mümkün olan her şeyi yapacaksınız, böylece verileri işlemciye mümkün olduğunca yakın taşıyacaksınız. Ancak verileri taşımanız gerekiyorsa, Veriler. Ancak tüm bunlar gökten düşmüyor.Tüm bunlar sistemin yüksekliğinden incelenmeli.Her adım birden çok açıdan düşünülmeli ve geleneksel okuma ve yazma yöntemine göre belleğin mi yoksa güncelleme mi kullanılacağına karar vermek gerekir. Bellek teknolojisi. Bazı durumlarda, verilerin kendisini saklama şeklinizi değiştirmeniz gerekir. Daha hızlı performans istiyorsanız, bu genellikle daha yüksek alan yükü anlamına gelir ve bu da enerji tüketimini etkileyecektir. Ardından, güvenliği göz önünde bulundurmalısınız. , Veri aşırı yüklemesi sorununu göz önünde bulundurmalıyız. "

Bu nedenle, birçok kişi uç cihazlarda işlemeyi ve birden çok işlem öğesi arasındaki verim sorunlarını önemsiyor. AI motoru, katı hal depolamada kendi başına analiz yapabilir.

Marvellin baş mühendisi Ned Varnica, "Modeli doğrudan SSD denetleyicideki donanıma yükleyebilir ve donanım işlemeyi gerçekleştirebilirsiniz. Bugün, bulut hizmetindeki ana bilgisayar bunu yapıyor. Her sürücünün buluta gönderilmesi gerekiyorsa Veriler, çok fazla ağ trafiğine neden olur. Bu nedenle, uç cihazların verileri kendi başlarına işlemesine izin vermek en iyisidir, böylece ana bilgisayar yalnızca meta verileri içeren komutlar göndermeye ihtiyaç duyar. Bu şekilde, daha fazla depolama cihazı, daha güçlü işlem gücü. Gelmenin faydaları çok büyük. "

Bu yaklaşımda bahsetmeye değer olan şey, farklı uygulamalar arasında veri hareketinin esnekliğini vurgulamasıdır. Bu nedenle, ana bilgisayar görevler oluşturabilir ve bunları bellek işleme için depolama cihazına gönderebilir ve ardından yalnızca meta verileri veya hesaplama sonuçlarını döndürebilir. Diğer bir durum, depolama cihazlarının verileri depolayabilmesi, verileri ön işleyebilmesi ve meta veriler, etiketler ve indeksler oluşturabilmesidir. Bu veriler, gelecekteki analizler için ana bilgisayar tarafından alınır.

Bu sadece bir seçenektir. Başka seçenekler de var. Samsung'dan Rupley özellikle sıra dışı yürütmeyi ve bir seferde iki komutu deşifre edip bunları tek bir işlemde karıştırabilen karışık geleneksel talimat yöntemini vurguladı.

AI denetimi ve optimizasyonu

Tüm bunların içinden geçen, çip mimarisi alanındaki en son özellik olan yapay zeka. İşlevler artık işletim sistemi ve ara yazılım tarafından yönetilmiyor, ancak sistem düzeyinde yonga içindeki çeşitli yerlere ve farklı yongalar arasında dağıtılıyor. Bazı durumlarda, çipe bir sinir ağı yerleştirilebilir.

ESilicon'da pazarlama başkan yardımcısı Mike Gianfagna, "Aslında yapmamız gereken, daha fazla şeyi bir araya getirmek ve geleneksel yolu değiştirmek. Yapay zeka ve makine öğrenimi yoluyla, tüm bunları daha etkili olmak için sistemin çeşitli yerlerine dağıtabiliriz , Daha öngörülebilir işlem. Bazı durumlarda sistemde ayrı farklı yongalar kullanabilir, diğer durumlarda aynı paketi kullanabilirsiniz. "

Arm, bu yıl içinde birden fazla pazarda satılması planlanan ilk makine öğrenimi çipini duyurdu. Arm'ın iletişim mühendisi Ian Bratt, "Bu yeni bir işlemci. Temel bir modülü, bir hesaplama motoru, bir MAC motoru ve bir DMA motoru, ayrıca bir kontrol ve yayın ağı var. Toplamda 16 tane var. 7 nanometre teknolojisini kullanan böyle bir bilgi işlem motoru, 1 GHz frekansında 4 trilyon talimatı işleyebilir. "

Arm, ekosistem ortaklarıyla işbirliği yaptığı için, çipleri daha çok yönlü ve hala geliştirilmekte olan diğer AI / ML çiplerinden daha yapılandırılabilir.

Arm, her şeyi makro çekirdek mimarisine koymaz, işlemeyi işlevlere göre sınıflandırır, böylece her hesaplama motoru farklı işlevlerden sorumlu olabilir. Bratt, statik görev planlaması, etkili evrişim, bant genişliği azaltma mekanizması ve gelecekteki tasarımlar için programlanabilir mekanizma olmak üzere dört temel işlev olduğunu söyledi.

Aynı zamanda Nvidia farklı bir yol izledi: Görüntülerin ve videoların akışını optimize etmek için GPU'nun yanında bağımsız bir derin öğrenme motoru oluşturdular.

sonuç olarak

Yonga üreticileri, bu yöntemlerin bir kısmını veya tamamını uygulayarak, yongaların güç tüketimini belirli bir aralıkta tutarken, verilerin patlayıcı büyümesine ayak uydurmak için yongalarının performansını iki yılda bir ikiye katlayabileceklerini söylüyorlar.

Bu farkındalık, daha fazla bilgisayardan daha fazlasıdır. Bu, tüm çip tasarımı ve sistem mühendisliğindeki değişikliklerin başlangıç noktasıdır.O zamandan beri çip, donanım ve yazılımla sınırlı olmaktan ziyade verilerin büyümesini takip etti.

Synopsys Yönetim Kurulu Başkanı ve CEO Yardımcısı Aart de Geus şunları söyledi: "Bilgisayarlar şirkete girdiğinde, birçok insan tüm dünyanın çok hızlı geliştiğini hissetti. Hala bir kağıt yığını üzerinde muhasebe işi yapıyorlardı. O zamandan beri üstel Büyüme ve şimdi aynı şeyi tekrar göreceğiz.

Şimdi gelişmekte olan şeyi, muhasebe kitaplarından delikli kartlara evrim olarak düşünebilirsiniz. Tarım arazilerinde, doğru tarihte ve sıcaklık yükseldiğinde sulamalı ve gübrelemelisiniz, bu nedenle makine öğrenimi geçmişte önemli bir ilerleme sağlamamıştır. "

Bu değerlendirmeyi verirken yalnız değil. Siemens'in bir yan kuruluşu olan Mentor'un başkanı ve CEO'su Wally Rhines, "İnsanlar sonunda yeni mimariyi kabul edecek. Yeni mimari sonunda tasarlanacak. Çoğu durumda, bu mimariler tıpkı beyninizin deneyimlerden öğrenebileceği gibi makine öğrenimini içerecek. Her birinin belirli bir amacı olan kendi benzersiz yapay zeka işlemcilerini kullanan 20'den fazla şirket gördüm.Ama onları daha fazla uygulamada görecek ve sonunda geleneksel von Neue'ye meydan okuyacaklar Mann mimarisi. Nöron hesaplama ana akım haline gelecek. Bu, bilgi işlem verimliliğini artırmak, maliyetleri düşürmek ve mobiliteyi ve ara bağlantıyı iyileştirmek için bizim için büyük bir adım. "

Orijinal: https://semiengineering.com/big-changes-for-mainstream-chip-architectures/

Yazar: Ed Sperling

Çevirmen: Crescent Moon, Kurgu: Hu Weiwei

ASUS ZenFone Max Pro M2 yakında piyasaya sürülecek: 11 Aralık'ta görüşürüz
önceki
Mercedes-Benz'in ilk saf elektrikli SUV siparişleri dolu, satışa çıkmadan önce satmak nasıl bir şey
Sonraki
Gökyüzüne meydan okuyan bu motor teknolojilerini anlayın, şarap masasının kralı sizsiniz
Çok iş parçacıklı yüksek eşzamanlılık senaryosunda Java önbellek sorunu nasıl çözülür?
Laixi kamu güvenlik organları, 5 temel göreve saldırı başlatmak için 2 "ön kuvvet" kurdu
İlk kez ortaya çıkan yeni BMW 1 serisi iç mekan casus fotoğrafları çok keskin oluyor
En çok parayı hangi Python programcısı kazanıyor?
2017'de Hangzhou'nun Animasyon ve Oyun Endüstrisi Gelişimindeki On Önemli Nokta
Pandalar SQL'de nasıl açılır?
100 gün geri sayım, Cai Qi bu büyük etkinlik için bir sprint seferberlik emri yayınladı
Samsung'un ilk "delikli ekran" cep telefonu burada: çentikli ekranı ve su damlası ekranını karşılaştırın
2019 Tianheng Festivali Deniz Festivali burada! 3 ana bölüm ve 6 ana vurgu. Kılavuz gönderilir ~
Pekin'in ilk "Air Surge" si açıldı ve popüler eğlence sporları bir arada sunuldu
Devlet İlaç İdaresi hatırlatıyor! Bu ilaçlar çocuklar için yasaktır! Ebeveynler görmeli!
To Top