Tegra K1 ve Denver'dan, yıllardır yanlış anladığımız NVIDIA CPU'ya bakın

NVIDIA'dan bahsetmişken,% 99'dan fazla arkadaşın ilk tepkisi "grafik kartı" ve "GPU" olabilir. Dünyanın en büyük iki GPU devinden biri ve GPU alanındaki mutlak hegemon, dünyadaki herkes yeni Turing mimarisinin ve RTX 2080Ti / 2080/2070 grafik kartlarının birkaç gün önce piyasaya sürüldüğünü biliyor.

Aslında, bunda yanlış bir şey yok, ancak son yıllarda insanlar NVIDIA GPU'ların gücüne uyuşurken bir şeyi gözden kaçırmış gibi görünüyor. NVIDIA'nın GPU'su güçlü mü? Gerçekten güçlü ve patlayıcı. İster PC'de ister SoC'de olsun, herkes için açıktır, herkes bilir ... emmm, ve sonra?

Bir süre öncesine kadar böyle bir resim gördüm:

Açıkçası, bu piyasadaki mevcut ana akım SoC'lerin kısa, canlı ve anlaşılması kolay bir özetidir. Ama sonuncusunu gördüğümde, insanların daha önce neyi gözden kaçırdıklarını anında fark ettim: NVIDIA SoC'nin CPU'su gerçekten resimle aynı mı?

CPU iyi değil mi? Bu gerçekten kabul edilemez

Aslında NVIDIA, SoC tasarımına yabancı değil, şimdiye kadar 7. nesil Tegra serisi SoC'yi piyasaya sürdüler. NVIDIA, Tegra SoC'de her zaman kendi GPU mimarisini kullandı, ancak önceki nesil CPU parçası, Arm genel CPU çekirdeğini kullanıyordu. Aynı dönemdeki Qualcomm Samsung MediaTek işlemcisi ile karşılaştırıldığında, "atalardan kalma" GPU dışında olağanüstü bir şey yok. Aksine, pek çok cep telefonu ve tablet, tatmin edici olmayan Tegra işlemcileri kullanır.

Ancak, zaman sadece burada bitse bile, NVIDIA SoC'deki CPU ile ilgili sorunun ne olduğunu bulamıyoruz gibi görünüyor. Söylemem gerekirse, NVIDIA lideri Huang'ın Apple Joe çetesinin sıkı bir hayranı olup olmadığını bilmiyorum. Bu nesil Tegra, entegre bir neon işlemciye sahip değil ve flash oynatma özelliği zayıf. CPU çekirdeğinin ARM genel sürümünün kullanımına gelince, doğru olmasına rağmen, aynı dönemde Samsung, Huawei MediaTek Texas Instruments da çekirdeğin genel sürümünü kullandı.

Dahası, NVIDIA'nın CPU konusundaki hırsı ve gücü, insanların ölçülebilen doğal izleniminden çok uzaktır.

2011'de CES'te NVIDIA, mobil cihazlardan sunuculara kadar çeşitli cihazlar için 64-bit Arm v8 komut setine dayanan kendi geliştirdiği bir mimari geliştireceğini duyuran Denver planını duyurdu. Sadece üç yıl sonra, 2014'te CES'te NVIDIA, kendi geliştirdiği Denver mimarisini kullanarak Tegra K1'i piyasaya sürdü ve böylece Apple'dan sonra Arm v8 talimat setine dayalı bir tüketici SoC'si yayınlayan ikinci şirket oldu.

Zaman 4 ay öncesine gitti Eylül 2013'te Apple beklenmedik bir şekilde A7 işlemcisindeki Arm v8 komut setine dayanan Cyclone mimarisini kullandı. Önümüzdeki yıl içinde, Arm v7 komut setine ve Qualcomm Krait'in piyasadaki kendi geliştirdiği mimariye dayanan Cortex A15 genel sürüm mimarisi, Cortex A57 de Arm v8 komut setine dayalı olsa bile, diğer tüm CPU mimarileri aynı anda Cyclone tarafından süpürüldü.

Denver hariç.

Leifeng.com'a göre, iki tür geleneksel CPU mimarisi tasarımı vardır: sıralı yürütme ve sıra dışı yürütme. Adından da anlaşılacağı gibi, sıralı yürütme sistemi mikro talimatları kesinlikle alınan sırada yürütürken, sıra dışı yürütme sistemi, komut işleminin sonucunu değiştirmeden yürütme sırasının ayarlanmasına izin verir.

Uzun bir süredir, sıra dışı yürütme, sıralı yürütme sınırına ulaştıktan sonra bir evrim olarak kabul edildi. CPU tarafından gerçekleştirilen görevler karmaşık ve karmaşıktır. Bazı durumlarda, RAM gibi çevresel bileşenler komutların sıralı olarak yürütülmesini engeller. Şu anda, sıra dışı yürütme işlemlerin esnekliğini önemli ölçüde artırabilir ve verimi etkili bir şekilde artırabilir.

Lei Feng.com'da Arm Cortex A76 ve Samsung Exynos M3 mimarisini tanıtan önceki makalelerde, sıra dışı yürütmeden birden fazla kez bahsedilmişti, bu yüksek performanslı Kol çekirdekleri arasında sıra dışı yürütmenin en iyi seçenek haline geldiği görülebiliyor. Bununla birlikte, sıra dışı yürütmeye geçiş, yeniden sıralanabilen talimatları etkin bir şekilde tanımlamak ve talimatların güvenli bir şekilde sıra dışı olarak yürütülebilmesini sağlamak için bir sıra dışı yürütme penceresi gerektirir. Bu, mimarinin karmaşıklığını açıkça artırır ve yonga boyutu ve güç tüketimi önemli ölçüde artacaktır.

NVIDIA, sıra dışı uygulamanın soruna tek çözüm olmadığına inanarak mimari performansını iyileştirmede farklı bir yaklaşım benimsemiştir. Denver, yalnızca düşünmeye cesaret etmekle kalmayıp, Arm kamuya açık yüksek performanslı mimaride ana akım sıra dışı yürütme yönteminden gerçekten vazgeçti ve bunun yerine düşük güçlü işlemcilerde ortak sıralı yürütmeyi benimsedi ve onu bir dizi verimli ikili çeviriyle donattı ve Kod optimizasyon programı.

NVIDIA'nın fikri basittir: Sıralı yürütme sisteminin karşılaştığı temel sorunlar açıktır, bellek durgunluğu gibi donanım sorunlarından ve kötü komut sıralaması gibi yazılım sorunlarından başka bir şey değildir. Öyleyse bu problemler mimari sistemi değiştirmek zor olmalı, "yumuşak seviyede" çözülebilir mi? Ve bu, Denver'ın ana fikri.

Bu mimari sıradışı

Denver ile ilgili alışılmadık bir şey, dahili talimat formatının ARMv7 veya ARMv8'den çok farklı olmasıdır. Spesifik dahili yapıda, Denver komutları yürütmek için GPU'larda oldukça yaygın olan VLIW (Çok Uzun Komut Sözcüğü) biçimini kullanır (sonuçta NVIDIA).

Mimarinin ön ucunda, Denver'ın komut kod çözme genişliği, Cortex A15 (3 lansman), Cortex A57 (4 lansman) ve Apple Cyclone'dan (6 lansman) daha geniş olan eşi görülmemiş bir 7 lansmana ulaştı. NVIDIA bunu resmi olarak "7+" mimarisi olarak adlandırır; burada "+", NVIDIA tarafından Denver için tasarlanan DCO'ya (Dinamik Kod İyileştirici) karşılık gelir.

DCO'nun görevi, Arm kodunu Denver'ın yerel biçimine dönüştürmek ve bu kodu Denver'da daha iyi çalışması için optimize etmektir. Bir bütün olarak CPU için, DCO en kritik bağlantıdır, çünkü performansı doğrudan DCO tarafından belirlenecektir.

Uzun bir süredir, Denverin orijinal tasarım amacının x86'yı hedeflediğine ve temel tasarımının ve ikili çeviri mekanizmasının herhangi bir x86 patentini ihlal etmeden x86 talimatlarının yürütülmesiyle uyumlu olacak şekilde tasarlandığı söylentileri vardı. Bu söylentinin doğru olup olmadığına bakılmaksızın, nihai sonuç NVIDIA'nın donanım tasarımını ve komut setini ayırabilen bir dizi mimari oluşturarak yumuşak seviyede şaşırtıcı sonuçlar elde etmesidir.

Ancak, DCO'nun gökyüzüne bu kadar aykırı olmasına rağmen, NVIDIA hala dışında bir dizi Arm yönerge kod çözücüsü ile donatılmıştır. Yetkili, bu Kol kod çözücünün bir "yedek lastik" olmadığını söylemesine rağmen, gerçekte açıkça "dik konuşulur". Denver'ın talimatlarının çoğu ikili çeviriden gelir. Bu Kol kod çözücünün yalnızca 2 komut genişliği vardır (Cortex A8 seviyesi) ), yalnızca ikili çeviri verimli bir şekilde işlenemediğinde Arm talimatlarının kodunu doğrudan çözmeyi devralır.

Aynı zamanda, NVIDIA problemi "yumuşak katmanda" çözmeyi seçtiği için, Denver ayrıca diğer mimarilerin sahip olmadığı bir yükseltilebilirliğe de sahiptir.DCO iyileştirilirse, NVIDIA ayrıca DCO'nun yeni bir sürümünü dağıtabilir.

Sonunda, Denver'ın gerçek performansı onu şok edici bir dörtlü olarak tanımlamak için yeterli. SPECint2000 testinde, Denver, Cortex A15'e kıyasla ortalama% 35'lik bir artışa sahip ve en yüksek artış% 67'ye kadar bile yükseliyor:

Daha spesifik olmak gerekirse, Denver çekirdeği kullanan Tegra K1'in performansı, aynı zamanda Cyclone çekirdekli Apple A7'nin performansını tamamen aşıyor.Intel Haswell çekirdekli Celeron 2955U ile karşılaştırıldığında, aynı zamanda ileri geri var.

Sarhoşluk şarap demek değildir

Bunu gördüğünüzde bazı arkadaşlar merak edebilir.NVIDIA SoC'nin CPU'su sadece zayıf değil, aynı zamanda GPU gibi patlayıcı olduğu için, NVIDIA neden cep telefonları ve tabletler alanında hiçbir şey yapamadı ve sonunda bıraktı?

Çok basit çünkü insanlar bunun için savaşmak bile istemediler ...

Büyük şeylerden korkmayan sıradan kullanıcıların aksine NVIDIA, kendi SoC'sinin durumunu daha net bilir. Oyuna yeni giren bir oyuncu olarak, temel bant, dip torbası, SDK, enerji tasarrufu ve tüketim azaltma açısından geç gelen bir dezavantajda Piyasadaki bu köklü saç derisi ile mücadele etmek gerçekten akıllıca değil.

2014 yılında cep telefonu SoC alanından çıkan başka bir Texas Instruments görmedim. Tegra'nın 4. nesli için Xiaomi Mi 3 iyi bir başlangıç olarak kabul edilebilir, arkadaşlar edinin ...

Açıkçası, NVIDIA, SoC-AI ve diğer yüksek performanslı mobil bilgi işlem platformları için daha iyi bir uygulama alanı gördü ve bunu açıkça söylemek gerekirse, otonom sürüş ve robotlar.

Tegra K1 ve Tegra X1 arasındaki geçişin ardından, Tegra Parker (yani NVIDIA Drive PX) nihayet Denver2 mimarisinin geliştirilmiş bir versiyonuyla otonom sürüş aşamasına başarıyla adım attı. Bu yıl henüz piyasaya sürülen NVIDIA Jetson Xavier platformu, kendi geliştirdiği, o kadar güçlü ki, arkadaşı olmayan Carmel'i de beraberinde getiriyor. Komut kod çözme, Denver temelinde ileriye doğru büyük bir adım olan şaşırtıcı bir 10 genişliğe ulaştı. adım.

Leifeng.com'a göre, mevcut AI yonga alanı saf AI hesaplamasının modern tasarımını takip ederken, NVIDIA yüksek performanslı CPU'lardan vazgeçmeyen tek şirket ve aynı zamanda CPU, GPU ve AI'nın üç parçasını dengeleyen en iyi şirket. .

Öyleyse, eski millet, NVIDIA "CPU GPI kayışını kullanamaz" demeyi bırakın. NVIDIA gerçekten kötü bir CPU değil, ancak çok güçlü, bildiğimiz boyutu aşacak kadar güçlü ...

Bu Oscar vuruşu ne kadar iyi? Yabancı medya incelemesi "Green Book": son on yılın en iyi filmlerinden biri
önceki
Hayal edilemez performans canavarı: Mijia hava temizleyici MAX detaylı değerlendirme
Sonraki
2017 Changan Auchan, 5.69-70.900 satarak resmen başlatıldı
Yeni Supreme "Phantom" Logosunun sergilenmesine ek olarak, en güçlü gizli öğe süpermarket raflarında mı göründü? !
Gece Okuması | Polis sadece evlilik gününde tatile çıktı Polis eşi: Düğüne katılmak için zaman ayırdığınız için teşekkür ederim.
Guangdong CPPCC üyesi: Küçüklerin gece geç saatlerde çevrimiçi oyun oynamalarının yasaklanması önerilir
Aşka bir içecek gibi davranırsanız, aşkınız ne kadar şekerdir?
Dijital dünyada mavi büyücü, bu güzel mavi şeyleri dik
TT ağlayacak! "Çin'in Hip Hop'u Var" adlı popüler kadın sanatçı VAVA, Tayvan'a "uzaklaşmayı" duyurdu
Dolaşmak şiddet içeren çıkışı destekler ve Guan Yu'nun ikili kıyafeti açıklanır
Bir önceki nesil golf "kutsal bir araba" ise, yeni golf tek kelimeyle inanılmaz!
"Mavi Yaşam ve Ölüm" nihai fragmanı Xu Kai "teklif" Zhao Lusi yayınladı
Supreme sadece 4 $ 'a bir tişört satıyor! ? Bir Reddit kullanıcısı düşük fiyatlara çok sayıda hazine buldu!
Wushuang et kalkanı grubu kontrol ustası, baskıya karşı duran, Xiang Yu'yum
To Top