[Geçmiş] GTX'ten RTX'e, NVIDIA GPU mimarisi değişikliklerinin geçmişi

Bu makale expreview'den çoğaltılmıştır, teşekkürler.

Modern GPU geliştirme tarihinde 2006, kaçırılmaması gereken bir düğümdür - AMD, bu yıl 5,4 milyar ABD doları fiyatla ATI'yi satın aldı. O zamandan beri, CPU ve GPU için iki iyi kart tuttu. AMD o zamandan beri bununla gurur duyuyor. Sektörde aynı anda yüksek performanslı CPU'lar ve yüksek performanslı GPU'lar sağlayabilen tek şirket olduklarını vurgulayın .. CPU, NVIDIA'yı ve GPU Intel'i alt ediyor. O yıl bir başka şey de Microsoft'un DX10 API üzerinde birleşik bir işleme mimarisi sunmasıydı. 2006 yılında NVIDIA tarafından piyasaya sürülen G80 mimarisine sahip GeForce 8800 GTX grafik kartı, birleşik görüntülemeyi destekleyen ilk karttı. O zamandan beri NVIDIA'nın CUDA'sı da piyasaya çıktı.

2006'da meydana gelen iki olayın doğası gereği birbiriyle hiçbir ilgisi yok, ancak o yıl ve sonrasında GPU'ların gelişimini düşündüğümde, yardım edemiyorum ama ATI AMD tarafından satın alınmasaydı bugün ATI ve NVIDIA'nın nasıl gelişeceğini düşünüyorum. ? 2006 yılı civarında ATInin bağımsız grafikler için GPU pazarındaki payı NVIDIAninkinden çok da farklı değildi. 2005ten önce pazar payı biraz ilerideydi. Ancak 2006daki satın alımdan sonra AMD / ATIyi entegre etme ihtiyacı nedeniyle CPU ve GPU ürünlerinin yol haritası kaçınılmaz olarak etkilenecek. O zamandan beri AMD grafik kartlarının payı düşüyor ve NVIDIA ile olan boşluk, önceki 55'ten 46 ve 37'ye, bu yılın başına kadar iki taraf arasındaki boşluğa kadar genişliyor. Zaten 28.

Reddit'te 2002'den 2017'ye kadar GPU pazar payındaki değişiklikleri tartışan gönderiler var.

NVIDIA'nın büyümesi AMD'nin ATI'yi edinme fırsatına mı bağlı? Elverişli koşullar ve coğrafi koşullar olabilir, ancak temelde iki taraf arasındaki uçurumun genişlemesi ürünler / teknolojilerdeki farklılıklardan kaynaklanmaktadır.NVIDIA, G80 mimarisinden sonra üstünlük kazanmaya başlamıştır.Bu dönemde GTX 480 devrilme kazaları da olsa, genel olarak, Hala sonuna kadar yükseliyor 40nm Fermi mimarisi, Kepler, Maxwell, Pascal, Volta (bu nesilde sadece Titan V'nin bir masaüstü sürümü var) ve geçen yılki Turing grafik kartından sonra NVIDAI'nin GPU pazarındaki konumu istikrarlı oldu. Köpekler, AMD'nin son nesil ekran kartları dalga yaratamaz.

NVIDIAnın GPU yol haritası dört veya beş yıldır güncellenmedi ve en sonuncusu 15 yıllık sürüm

NVIDIA, GPU yol haritasını GTC konferansında iki veya üç yıl önceden duyururdu. Ancak 2015'ten sonra, Pascal grafik kartı güncellendikten sonra, yeni bir GPU yol haritası sunulmayacaktır. Turing grafik kartı, piyasaya sürülmeden önce yol haritasında görünmüyordu. , Turing'den sonraki GPU mimarisi resmi olarak ağzı sıkıdır. Mevcut argümana Amper Ampere denir, ancak durumun bu olup olmadığı hala bilinmemektedir.

Bugünün Süper Sınıfında, NVIDIA GPU'nun geliştirme sürecini gözden geçireceğiz ve NVIDIA GPU'nun son 10 yılda nasıl değişikliklere uğradığını inceleyeceğiz. Benzer şekilde, AMD'nin GPU geliştirme yolunda bir yardımcı makale olacak, bu yüzden bizi izlemeye devam edin.

NVIDIA G80 - GF100 mimarisi: 40nm Fermi GPU'dan dersler

NVIDIAnın GPU geliştirme geçmişi G80 dönemi CUDA mimarisinden başlamalıdır, ancak uzay nedeniyle burada çok derin kazmayı planlamıyorum. G80 ve türev G92 çekirdekler NVIDIA GPU'larda çok klasiktir. Yelek kartı orijinaldi Bu dönemdeki değişimleri anlatmaktır.Güncel bıçak becerilerinden çok daha mükemmel olan sık hilelerin olduğu söylenebilir.

Microway, daha önce GF100 mimarisini ve önceki NVIDIA GPU mimarisini özetledi.

Sektör, bir süredir AMD ile NVIDAnın GPU stratejileri arasındaki farkı "AMD küçük çekirdeklerde iyidir, orta performans, ancak düşük güç tüketimi, NVIDIA nispeten büyük çekirdek, güçlü performans, ancak yüksek güç tüketimi daha pahalıdır" şeklinde tanımladı. GT200 çekirdeği gerçekten büyük bir çekirdek stratejidir.GF100 çekirdeğinde zirveye ulaştı. SP tek duyarlıklı ve DP çift duyarlıklı oranlardan, herkes şu anda NVIDIA'nın GPU'nun hesaplama performansını büyük ölçüde iyileştirdiğini görebilmelidir.

40nm Fermi Fermi mimarisinde, NVIDIA birden bire CUDA çekirdek sayısını GT200 çekirdek sayısının iki katı olan 512'ye yükseltti ve tek ve çift hassasiyet 1: 2'ye ulaştı ve çift hassasiyetli hesaplamalar için çok sayıda çekirdek kullanıldı. Ancak birinci nesil Fermi çekirdekli GTX 480 grafik kartı da devrildi. 100 ° C + kızılötesi sıcaklığa sahip ünlü grafik kartının resmini hatırlıyor musunuz? GTX 480 çağından bahsediyoruz.

GTX 480 grafik kartı (üst) ve GTX 580 grafik kartı (alt)

GTX 480'in güç tüketimi ve ısı konusundaki devrilme dersleri, NVIDIA'nın bir süre utanmasına neden oldu ve GTX 580 grafik kartı daha sonra tanıtılıncaya kadar rahatlamadı.

Genel olarak, 40nm Fermi mimari neslinde NVIDIA, GPU tasarımında bir sıçrama yaptı ve özellikleri büyük ölçüde iyileştirildi.Sadece oyun performansına değil, aynı zamanda hesaplama performansına da dikkat ediyor.Bu nedenle, daha fazla çift hassasiyetli hesaplama birimi ekleniyor. Aynı zamanda birçok sorunu da beraberinde getirdi: GTX 480 devrilme kazası, NVIDIA'ya pek çok ders getirdi ve bu da sonraki GPU mimari tasarımını az çok etkiledi.

2012 NVIDIA Kepler mimarisi: Oyun ve bilgi işlem GPU'sunun ayrılması, NVIDIA ertelendi

GTX 580 grafik kartının piyasaya sürülmesinden bir buçuk yıl sonra NVIDIA, 22 Mart 2012'de GTX 680 grafik kartını piyasaya sürdü ve 28nm işlem Kepler mimarisi ilk kez sahneye çıktı. Şu anda, AMDnin yeni GCN mimarisine dayalı HD 7970 grafik kartı yaklaşık 3 ay süreyle piyasaya sürüldü (Aralık 2011in sonunda denizaşırı pazarlarda ve bir sonraki yılın Ocak ayının başında piyasaya sürüldü). İkincisi o zamanlar mükemmeldi ve GCN mimarisi de bilgi işlem ve oyunları entegre etti. Avantajlar, performans önceki VLIW mimarili grafik kartına ve ilk TSMC 28nm işlemine, PCIe 3.0 ve benzerlerine kıyasla önemli ölçüde geliştirildi.

GTX 680, Mart 2012 sonunda piyasaya sürüldü

GTX 680 grafik kartı, Kepler ailesinde GK104 çekirdeğini kullanır, ancak GK104 tarafından yansıtılan mimari tasarım fikirleri, SM birimlerinin sayısını azaltmak için GF100'den GF104'e ve GF114 mimarilerine yansıtılmıştır (NVIDA neslinin resmi adı SMX'tir) Birim) her SM birimi grubundaki CUDA çekirdek sayısını artırmak için. GF100 döneminde, her SM birimi grubu hala 32 CUDA çekirdeğine sahiptir. GF104 / GF114, SM birimi grubu başına 48 CUDA çekirdeğine sahiptir. Kepler döneminde, her SM birimi grubu, CUDA çekirdek sayısı tek seferde 192'ye, doku birimi de 16 gruba, ön uç render birimi de dört gruba çıktı.Aynı zamanda SFU ve LD / ST birimleri de 32 gruba yükseldi ve doku birimi tekrar ikiye katlandı. SMX grubu toplam 1536 akış işlemcisine, 128 doku birimine ve 32 ROP birimine sahiptir.

GF110 SM ünitesi (sol), GF114 SM ünitesi (orta) ve GK104 SMX ünitesi (sağ) karşılaştırması

NVIDIA, SM ünitesindeki büyük değişikliklere ek olarak, Kepler mimarisinde de önemli bir değişiklik yaptı.Kepler'den başlayarak, NVIDIA'nın geçmişte uyguladığı Çekirdek: Shader = 1: 2 frekans bölme modu gitti.Bu yöntem daha önce kullanıldı. Bunun nedeni çekirdek frekansın önemli ölçüde artırılamamasıdır.Performansı iyileştirmek için CUDA'nın çekirdek frekansı iki katına çıkarılmalıdır, ancak bu aynı zamanda daha yüksek enerji tüketimi anlamına gelir.

GK104 mimarisinin önemli bir özelliği, CUDA ölçeğindeki önemli artıştır

GTX 680'de NVIDIA, SMX birimindeki CUDA çekirdek sayısını orijinalin üç katına çıkardı ve çekirdek frekansı 1GHz'in üzerine çıktı. Shader asenkronuna artık gerek yok. İkisi aynı frekansta çalışacak ve bu da grafik kartının güç tüketimini azaltmaya yardımcı olacak. GTX 680, CUDA sayısını artırırken daha az güç tüketiyor ve watt başına performans iki katına çıktı.

GTX 680 grafik kartı özellikleri

Kepler döneminde, NVIDIA ayrıca gizli bir kuralı değiştirdi - GPU sürümleri, Fermi döneminde GF100'den GF104 / GF106'ya kadar geçmişte ilk büyük çekirdeklerdi; GK104, Kepler dönemindeki ilk sürümdü ve daha büyük çekirdek GK110 daha sonra piyasaya sürüldü. Ancak, bu değişiklik yalnızca Kepler döneminde ortaya çıktı.Pascal, Volta ve Turing'de bunların çoğu büyük çekirdek ilkler (ilk önce GTC konferansında, önce Tesla hesaplama kartı), GX104 / 106 çekirdekleri daha sonra takip edecek .

GTX 680 grafik kartının piyasaya sürülmesi NVIDIAnın acil ihtiyacını çözdü. Oyun performansı AMDnin HD 7970inin biraz ilerisinde, bir raundu geri getiriyor, ancak bilgi işlem performansı ikincisi kadar iyi değil. Sonuçta, GK104 bilgisayar için tasarlanmış bir mimari değil. NVIDIA için Kepler, oyunların ve bilgi işlem kartlarının tamamen ayrılmasını gerçekten uygulayan bir üründür.Daha iyi bilgi işlem performansı mı istiyorsunuz? O zaman büyük çekirdekli GK110 çekirdeğini arayın.

2012 GTC konferansında NVIDIA, GK110 çekirdeğinin gücünü gösterdi. Yıl sonunda yapılan SC Süper Hesaplama Konferansında GK110 tabanlı Tesla K20X ve Tesla K20 hızlandırıcı kartları resmi olarak piyasaya sürüldü. GK110 çekirdeğinin tam sürümü 15 SMX ünitesi ve toplam 2880 CUDA içerir. Çekirdek 7.1 milyar transistörü entegre ediyor ve çekirdek alan 551 mm ^ 2'ye ulaştı.

GK110 çekirdeğinin SMX biriminde halen 192 CUDA çekirdeği bulunmaktadır, ancak DP çift duyarlıklı birim sayısı GK104'te 8'den 64 gruba çıkarılmıştır.Sonuç olarak, ücrete henüz ulaşılmamış olsa da çift duyarlık oranı 1: 3 olmuştur. Mi çağında 1: 2'lik bir abartıdır, ancak GK104'ün 1: 24'ünden çok daha yüksektir. Genel performans iyileştirmesiyle birleştiğinde, GK110 çekirdeğinin bilgi işlem performansı genel olarak iyileştirilir.

Ek olarak, GK110 yalnızca bilgi işlem ölçeğinde bir artış değil, aynı zamanda NVIDIA tarafından geliştirilen Grid Management Unit, GPUDirect, Hyper-Q ve Dynamic Parallelism gibi bazı yeni bilgi işlem özelliğine sahip teknolojilerdir.

İlk nesil Titan grafik kartı

Tüketici grafik kartları arasında, GK110 ilk olarak Mart 2013'te piyasaya sürülen GTX Titan grafik kartlarında kullanıldı. O zamandan beri NVIDIA, o zamanki üst düzey grafik kartlarından daha fazla olan 999 $ 'dan başlayan yeni bir ürün serisi olan Titan grafik kartlarını da açtı. Zamanlar.

Ek olarak, Titan grafik kartının genel sürüm tasarımı da önceki grafik kartlarından çok farklı ve sonraki GTX XX80 / 80 Ti serisi genel sürüm grafik kartlarının tasarımını etkiliyor.

Titan grafik kartları sıradan insanlar için uygun değildir. Kasım 2013'te NVIDIA, GK110 çekirdeğini temel alan GTX 780 serisi grafik kartlarını piyasaya sürdü.GTX 780 Ti, önceki GK110'dan farklı olan yeni GK110-425-B1 çekirdeğini kullanıyor. Çekirdek alan daha küçüktür ve SMX ünitesinin tam sürümü etkinleştirilmiştir, bunun sonucunda özelliklerinin Titan grafik kartından daha iyi olması ve performansın daha güçlü olması nedeniyle NVIDIA daha sonra GK110 çekirdek Titan Black grafik kartının tam sürümünü piyasaya sürdü.

Kpler mimarisinin sonunda NVIDIA, Kepler 2.0 olarak da bilinen GK110 çekirdeğinin geliştirilmiş bir sürümü olduğu söylenebilecek GK210 çekirdeğini de tanıttı.CUDA hesaplama gücü GK1043.0 ve GK1103.5'ten CUDA 3.7'ye yükseltildi.

Ayrıca NVIDIA, CUDA çekirdek sayısını veya CUDA mimarisini değiştirmedi. Geliştirdikleri şey, SMX birimleri arasındaki bellek alt sistemidir. GK110 (B) SMX biriminde 256KB kayıt dosyası ve 64KB paylaşılan önbellek vardır. GK210, boyutu iki katına çıkardı ve 512KB kayıt dosyası, 128KB paylaşımlı önbellek, böylece SMX ünitesinin veri verimini iyileştirir, verimliliği artırır ve CUDA çekirdeğinin sıklıkla daha kolay kullanılmasını sağlar.

Bununla birlikte, GK210 mimarisi esas olarak tüketici grafik kartlarında değil, bilgi işlem kartlarında kullanılır, bu nedenle DIY oyuncularının çok az etkisi vardır, ancak aynı Kpler 2.0 GK208 ve düşük kaliteli GT 740/730/720 ve mobil ürünler için diğer çekirdekler vardır. içinde.

2014'te NVIDIA Maxwell mimarisi: SMM ünitesi, enerji verimliliğine daha fazla odaklanarak yeniden düzenlendi

Kpler döneminde, NVIDIA grafik kartı AMD HD 7970 grafik kartının gölgesinden çıktı.GK104 çekirdekli GTX 680, HD 7970'i yakaladı, ancak genel bir avantajı yok.GK110 çekirdekli GTX 780 serisi performansta mutlak bir avantaja sahip. Tüketim yüksek, ancak şu anda NVIDIA inisiyatifi ele aldı Sonuçta AMD'nin daha sonra HD 7970'in halefi olan R9290X'in de güç tüketimi ve ısı ile ilgili sorunları var.

NVIDIA'nın yol haritasına göre, Kepler'i Maxwell mimarisi izliyor Şu anda, proses teknolojisi hala 28nm ve Maxwell mimarisinin odak noktası enerji verimliliğini artırmak. Bu aşamada NVIDIA beklenmedik bir hamle daha gerçekleştirdi Maxwell mimarisi ne GM200 ne de GM204 değil GM107'dir.GTX 750 Ti ve GTX 750 ekran kartlarında kullanılır.Adlandırma açısından yeni bir nesil değildir.Hala GTX kullanır. 700 serisi.

GM107 çekirdeği Maxwel nesil mimarisini kullanır. En büyük değişiklik SM biriminin (bu nesil SMM birimi olarak adlandırılır), Kpler döneminde SM birimi başına 192 CUDA çekirdeğinden grup başına 128'e, ancak her SMM'ye kadar yeniden yapılandırılmasıdır. Ünite, hassas kontrolü kolaylaştırmak için daha fazla mantık kontrol devresine sahip olacak ve bu da GM107 çekirdeğinin her bir çekirdeğinin performansını% 35 artıracak ve watt başına güç tüketimini ikiye katlayacak.

Bu yeni SM mimarisi, enerji tasarrufunu büyük ölçüde artırabilir ve sınırlı gölgelendiricilere sahip bir işyerinde her CUDA çekirdeğinin performansını% 35 artırabilir. Bu ilerlemelere ulaşmak, mimaride birçok büyük değişiklik gerektirir. NVIDIA, SM zamanlayıcı mimarisini ve algoritmasını daha akıllı hale getirmek, gereksiz duraklamaları önlemek ve her bir talimatı planlamak için gereken enerji tüketimini daha da azaltmak için yeniden yazdı.

Tabii ki, SMM biriminde de birçok iyileştirme var.Örneğin, L2 önbellek kapasitesi önceki 256KB'den 2MB'ye büyük ölçüde artırıldı, H.264 ve NVENC kodlama / kod çözme yetenekleri de iyileştirildi ve komut döngüsü performansı da iyileştirildi.

Grafik kartına yansıyan GTX 750 Ti ve GTX 750 grafik kartları mükemmel enerji verimliliği oranlarına sahip.Oyunların güç tüketimi aynı dönemde HD 7770, GTX 660 ve hatta GTX 650 Ti'den çok daha düşük, sıcaklık ve gürültü de çok düşük. Grafik kartının son yıllarda bir klasik olduğu söylenebilir.

GM107 çekirdeğinin Maxwell nesil mimarisinden sonra, NVIDIA Eylül 2014'te GTX 980/970 grafik kartını piyasaya sürdü. Maxwell 2.0 mimarisi olarak da bilinen GM204 çekirdeğini kullanıyorlar. GM204 çekirdeğinin tamamı 4 GPC birimi grubuna bölünebilir, her bir GPC grubu 4 SMM birimi içerir, her SMM birimi 128 CUDA çekirdeği, 8 doku birimi ve bir poligon motor birimi (PolyMorph Engine 3.0) içerir, toplam 2048 CUDA çekirdeği, 128 doku birimi.

Masaüstü grafik kartlarının isimlendirilmesiyle ilgili olarak, NVIDIA bu sefer GTX 800 serisini atladı (OEM ve mobil GPU'larda GTX 800 serisi var) ve doğrudan GTX 900 serisine gitti.GTX 980, 4GB GDDR5 video belleğine sahip GM204-400 çekirdeğini kullanıyor. , Ancak performansı GK110 çekirdekli GTX 780 Ti ekran kartını aştı ve TDP 250W'dan 165W'a düştü.Tüm makinenin güç tüketimi testi de güç tüketiminde önemli bir düşüş olduğunu doğruladı.Enerji verimliliği avantajının çok açık olduğu söylenebilir. Bu, AMD'nin grafik kartları veya önceki nesil grafik kartları için geçerlidir ve enerji verimliliği, ezici bir varlıktır.

GM107, GM204 ve GM206 çekirdeklerinden sonra NVIDIA, Titan X grafik kartında GM200 çekirdeğini kullandı ve GM200-400 çekirdeğinin tam sürümüdür. Kart 18 Mart 2015 tarihinde piyasaya sürüldü. Kullandığı GM200 çekirdeği 6 gruba sahip GPC birimleri, 24 SMM birimi grubu, her SMM birimi grubu 128 CUDA çekirdeği, toplam 3072 CUDA çekirdeği ve video bellek denetleyicisi de önceki 464 bit GDDR5 grubundan bit genişliği 384 bit olan 6 gruba değiştirildi.

Bununla birlikte, 1 Haziran'da NVIDIA, GM200 çekirdeğini de kullanan GTX 980 Ti grafik kartını piyasaya sürdü, ancak GM200-310 çekirdeğinin hadım edilmiş versiyonu olan CUDA çekirdek sayısı 2816'dır. GTX 980 Ti grafik kartının ayrıntılı özellikleri aşağıdaki gibidir:

2016'da NVIDIA Pascal mimarisi: 16nm işlem bonusu, bilgi işlem oyun çekirdeği ve ardından ayrılmış

Kısa bir süre sonra 2016'ya geldi. Nisan ayı başındaki GTC konferansında NVIDIA, pascal mimarisinin çekirdeği olan GP100 çekirdeğini kullanan Tesla P100 hızlandırıcı kartını piyasaya sürdü. İşlem teknolojisi, yüksek performanslı bir süreç olan 16nm'ye yükseltildi. Bu nedenle, Pascal grafik kartlarının GPU frekansı büyük ölçüde artırılarak başlangıçta 1.6GHz'e ulaşmıştır ve hızlanma frekansının 2GHz'e ulaşması yaygındır.

Pascal grafik kartlarında en büyük özellik, ileri teknolojinin getirdiği işlem bonusudur.Ancak şu anda, GPU mimarisi bir kez daha oyun ve bilgi işlem ayrımına sahiptir.İki ana çekirdek vardır, GP100 ve GP102 ve kullanılan mimari ve bellek her ikisi de Aradaki fark, GP100'ün saf bir bilgi işlem çekirdeği olmasıdır, yalnızca 3584 tek duyarlıklı CUDA çekirdeği değil, aynı zamanda 1: 2 oranına geri dönen 1792 çift duyarlıklı çekirdeğe sahiptir.

Ek olarak, bilgi işlem için kullanılan GP100 çekirdeği, eşdeğer bit genişliği 4096bit ve bant genişliği 720GB / s olan HBM 2 video belleği kullanır.HBM2 video belleğinin 1TB / sn tam hızlı bant genişliği elde edilemese de, bant genişliği o zamanlar GDDR5 belleğe göre büyük ölçüde iyileştirilmiştir. Sadece HBM2 belleği 2016'yı bırakın çok pahalı, 2019'da bugüne kadar popüler olmaktan çok uzak.

Temmuz 2016'da NVIDIA, Titan X Pascal grafik kartını piyasaya sürdü.Ayrıca 16nm Pascal mimarisini kullanıyor, ancak çekirdek GP102'dir. Tam özellikli GP102 çekirdeği gerçekten de şu anda en güçlü mikro mimari olarak adlandırılabilir: 12 milyar transistör, 3584 akış işleme 12 GB GDDR5X video belleği, 384 Bit genişlik, Tesla P10un HBM 2 video belleği ve NVLink ile karşılaştırıldığında bir uzlaşmadır, bu nedenle video bellek bant genişliği 480 GB / sn'dir, 8 + 6Pin güç kaynağı ve ekran arabirimi Ekran Bağlantı Noktası 1.4, HDMI 2.0b ve Çift zincirli DVI, maksimum destek 7680 * 4320 @ 60Hz çıkış, 11TFLOPS'a kadar performans.

Titan X Pascal'a ek olarak, masaüstü GTX 1080 Ti grafik kartı aynı zamanda GP102 çekirdeğidir. Bellek kapasitesi ve bit genişliğindeki değişikliklere ek olarak, GP102 çekirdeğinin SM birim mimarisi de GP100 çekirdeğinden farklıdır.İkincisi, daha yüksek hesaplama performansı arayışı içindedir. Her SM ünitesindeki CUDA çekirdek sayısı 64'e düşürüldü, ancak 56 gruba kadar daha fazla SM ünitesi entegre edildi ve GP102 çekirdeği toplam 3584 CUDA çekirdeğine sahip olmasına rağmen, sadece 28 grup var ve her gruptaki SM ünitesi sayısı geri döndü. 128 Maxwell vardır, bu nedenle bu nesil oyunlar ve bilgi işlem yeniden ayrılmıştır.Özellikle, GP100 gerçek Pascal çekirdeğidir, GP102 çekirdeği ise 16nm geliştirilmiş Maxwell mimarisidir.

Maxwell (sol) mimarisi ve GP104 çekirdek SM birimi mimarisi

GTX 1080'in GP104'ünden GTX 1080 Ti'nin GP102 çekirdeğine kadar, SM birim mimarisi aynıdır, ancak CUDA çekirdek sayısındaki fark.

Ek olarak, GTX 1080 serisi grafik kartları, daha yüksek frekanslı GDDR5X bellek ve daha gelişmiş bellek sıkıştırma algoritmaları kullanarak, GTX 980 serisinden teknik olarak geliştirildi, eşzamansız bilgi işlem ve VR için destek geliştirildi.

2017 NVIDIA Volta: Bilgi işlem için gerçekten doğmuş olan GPU, AI hızlandırmayı destekler

NVIDIA'nın yol haritasında Maxwell'i orijinal olarak Volta izledi. İkincisi daha fazla teknolojiye sahip. Ancak, çeşitli nedenlerden dolayı Volta grafik kartının ilerlemesi beklendiği gibi değil, bu nedenle ortada ek bir Pascal grafik kartı var ve bu da GP102 / 104 çekirdeğinin nedenini açıklayabilir Mimari aslında Maxwell'den niteliksel bir değişiklik değil.

Ancak Volta farklıdır. Bu, gerçekten bilgi işlem için tasarlanmış başka bir grafik kartı mimarisidir. Pascal ile karşılaştırıldığında, GV100 çekirdeğinin CUDA çekirdek sayısı, 12nm FFN işleminin 16nm değiştirilmiş sürümünü kullanmasına rağmen aniden 5120'ye yükselmiştir. , Ancak tüm yönleriyle özellikleri şaşırtıcı - 815 mm2 çekirdek alanı, 21.1 milyar transistör, 5120 CUDA çekirdeği, 15TFLOPS kayan nokta performansı vb.

GV100 çekirdeğinde, her bir GPC birimi grubu 14 SM birimidir, toplam 84 grup SM birimi olmalıdır, ancak şimdi Tesla V100, Tesla P100 gibi tamamen entegre değildir, ilki 56 SM birimine sahiptir ve ikincisi 80 birimine sahiptir. Grup SM birimleri, toplam 80x64 = 5120 CUDA çekirdeği.

Ayrıca FP64 birimleri vardır.GV100 halen GP100'de FP32: FP64 = 2: 1 oranını devam ettirmektedir.Her SM biriminde 32 FP64 birimi vardır, teorik olarak 2688 FP64 birimi vardır ve 2560 fiilen kullanılmaktadır. .

Daha da önemlisi, geleneksel tek ve çift hassasiyetli hesaplamalara ek olarak, Volta mimarisi ayrıca derin öğrenme ve AI işlemleri için özel bir Tensor Core tensör ünitesi ekler.GV100 çekirdeğinde, her grupta 8 SM ünitesi vardır. FP32: FP64: Tensor = 64: 32: 8 oranının tüm SM biriminde mevcut olması için bir Tensör birimi. GV100 ayrıca Tensor hesaplama güç endeksine de sahiptir. Tesla P100'ün Tensör hesaplama gücü 120TFLOPS kadar yüksektir. NVIDIA Tensörünü iddia ediyor Performans, Pascal mimarisinin 12 katıdır.

Volta mimarisi o kadar özel ki NVIDIA, TITAN V grafik kartı dışında ilgili tüketici ürünlerini piyasaya sürmedi.TITAN V, Tesla V100ün 4096-bit ve 16GBden 3072-bit ve 12GB HBM2 video belleğine düşürüldü. 850MHz, eşdeğer veri frekansı 1700MHz, bant genişliği 652.8GB / s'ye kadar ve TITAN V'nin L2 önbelleği 4.5MB'ye düşürüldü, bu da derin öğrenme hesaplama performansını Tesla V100'den (112TFLOPS) biraz daha düşük yapıyor. Grafik kartı güç kaynağı arayüzü 6 + 8pin, Grafik kartı TDP 250W, ekran arayüzü 3 DP + 1 HDMI'dır.

2018 NVIDIA Turing mimarisi: On iki yıldır ışık peşinde koşan yeni RTX markası doğdu

Volta neslinde ana akım oyun kartları yok, ancak bu NVIDIA'nın grafik kartlarının düzenini etkilemedi.GTX 10 serisi grafik kartları çağı, madencilik kartı pazarının yenilenen popülaritesiyle aynı zamana denk geldi ve sonuçta GTX 1060 ve diğer ekran kartları satışlar için endişelenmiyor. 2017'den 2018'in ilk yarısına O zamanlar NVIDIA ve AMD, piyasada birbirlerini soymaktan endişe etmiyorlardı.Sadece madencilik kartları satarak çok para kazandılar.Bu nedenle, GTX 10 serisi Pascal grafik kartı yükseltme döngüsü 2 yıldan fazla sürdü. 2 yıllık piyasaya sürüldükten sonra, sadece listeden kaldırmadılar, aynı zamanda Grafik kartı pazarında hiçbir fiyat indirimi sadece bir mucizedir.

Ancak 2018'in ikinci yarısında madencilik kartı çöktü.NVIDIA ve grafik kartı üreticileri madencilik kartı envanter sorunları yaşasalar bile yeni bir mimari zorlamak zorunda kalıyorlar.Ağustos sonunda Almanya'da düzenlenen Köln Game Show'da NVIDIA, Turing mimarisini resmen yayınladı. Quadro RTX 8000/6000 serisi iş istasyonları için profesyonel kart, yarışma gösterisinden önce SIGRAPH konferansında piyasaya sürüldü.

Turing grafik kartlarına zaten aşinayız.Bu nesil grafik kartlarındaki en büyük değişiklik, GTX'ten RTX'e yeni marka adıdır ve RTX, gerçek zamanlı ışın izleme teknolojisinin kısaltmasıdır, çünkü bu, en gelişmiş Turing grafik kartı teknolojisidir. Yerel olarak, NVIDIA CEO'su Huang Renxun basın toplantısında coşkuyla Turing'in 12 yıldır GPU mimarisindeki en büyük değişiklik olduğunu belirtti. Nedeni RTX. Özel RT Core çekirdeği aracılığıyla NVIDIA, oyunlarda bulunan gerçek zamanlı ışın izleme görüntülemeyi gerçekleştirdi.

RTX'e ek olarak, Turing grafik kartları, AI hızlandırma için kullanılabilen Volta'nın Tensor Core'u da destekler.NVIDIA daha önce, DLSS kenar yumuşatma teknolojisi gibi grafik kartları için mevcut olan çeşitli AI oyunlarını sağladı, ancak RTX optik izleme teknolojisi, AI hızlandırma ile karşılaştırıldığında Oyunda çok az uygulama var, yeterince çekici değil.

SM birim mimarisinde Turing nesli farklıdır.Pascal mimarisindeki GP102 / GP104 çekirdeklerinden farklıdır ve daha çok Volta mimarisinin GV100 çekirdeğine benzer, çünkü her SM birimi grubu 64 CUDA çekirdeği olur. Bunlar arasında, RTX 2080 Ti tarafından kullanılan TU102 çekirdeği 6 grup GPC birimine bölünmüştür, her GPC birimi grubu 12 SM birimine, toplam 72 SM birimine sahiptir, ancak RTX 2080 Ti yalnızca 68 tanesini kullanır. Aşağı 68 × 64 = 4352 CUDA akış işlemcisi.

RTX 2080 grafik kartı tarafından kullanılan TU104 çekirdeğine gelince, TU104 çekirdeğinin tam sürümü 6 grup GPC birimidir, ancak her bir GPC grubu 8 SM birimine değiştirilir, toplam 6 × 8 = 48, RTX 2080'in GPU çekirdeği TU104- 400, sadece 46 grup kullanılıyor ve ayrılmış 2 grup var, 46 × 64 = 2944, ölçek RTX 2080 Ti'den çok daha küçük.

RTX optik kovalamacının desteklenmesi, Turing grafik kartlarının bir özelliğidir.Ancak, oyun sayısına ek olarak, performans gereksinimleri hala çok yüksek olduğu için RTX optik kovalamada başka bir sorun daha vardır.Bu nedenle, NVIDIA'nın Turing grafik kartı neslindeki pazar stratejisi Ayrıca farklıdır.RTX teknolojisini destekleyen grafik kartları esas olarak RTX Titan, RTX 2080 Ti, RTX 2080, RTX 2070 ve RTX 2060 iken, RTX'i desteklemeyenler GTX 1660 Ti, GTX 1660 dahil olmak üzere GTX 16 serisi olur ve yeni piyasaya sürülür. GTX 1650 grafik kartı.

RTX 20 serisi grafik kartı özellikleri

GTX 16 serisi grafik kartı özellikleri

sonuç olarak: Beşinci nesil GPU performansı, daha yüksek enerji verimliliği ile büyük ölçüde iyileştirildi, ancak daha yüksek bir fiyata

2012'deki Kepler grafik kartından bugüne, NVIDIA'nın grafik kartı beş nesil mimariyi piyasaya sürdü.Her nesil için çekirdek ve oyun çekirdeklerini sayarsanız, o zaman en az 10 model vardır.Bu grafik kartlarının işlem teknolojisi de 28nm'den 28nm'ye yükseltilmiştir. 16 nm, 12 nm. Oyun performansı açısından, Chaoneng.com'un grafik kartı sıralama listesine göre, bugünün RTX 2080 Ti grafik kartının performansı, GTX 480 grafik kartlarının yaklaşık 7 katı ve GPU transistörlerinin sayısı da temelde performans artışına paralel olarak 3 milyardan 21 milyara yükseldi. .

Performans ve güç tüketimini göz önüne alırsanız, NVIDIA grafik kartlarının enerji verimliliği yıllar içinde önemli ölçüde arttı Sonuçta büyük çekirdeğin TDP güç tüketimi uzun yıllar 250-300W arasında tutuldu, ancak performans 6-7 kat arttı.

Ayrıca önceki nesil ekran kartlarının fiyatından detaylı olarak bahsetmedik ama bu eğilim de ortada.GTX 400'den GTX 700'e high-end ekran kartlarının fiyatı 3999 yuan ama fiyatı son yıllarda yükseldi. Titan grafik kartlarının fiyatı 7.999 RMB'den 20.000 RMB'ye yükseldi ve ana piyasadaki amiral gemisi grafik kartlarının fiyatı da 6.000 RMB'nin üzerine çıktı. RTX 20'nin fiyatı daha da arttı ve RTX 2080 Ti'nin fiyatı düzeldi. 9999 yuan, bu önceki Titan grafik kartının seviyesidir.

SON

Makale, açıklamadan yeniden üretilmiştir. Telif hakkıyla ilgili herhangi bir sorunuz varsa, lütfen zamanında bizimle iletişime geçin. Telif hakkı açıklaması orijinal oluşturucuya aittir. Bu makale TechSugar yazı işleri departmanı tarafından önerilmektedir!

Yapay zekaya yeni başlayanlar gittikçe azalıyor, ancak para giderek daha fazla yatırım yapıyor Veri casusu
önceki
190423 Lin Yuner, Taipei'deki marka onayları için basın toplantısına katıldı.
Sonraki
190423 Tek bir gerçek var! Li Yifeng aslında Conan Bennan mı?
[Yetenekler] Olağanüstü programcılar nasıl doğar?
BMW 6 Serisi GT | Büyük kafa sizi seyahate götürür
Yarı iletken yatırımı hakkında bu şeyler hakkında konuşmak
İmparatorun kavun yeme rehberi: "sarı cüppe" ekleyerek gövde, "takip eden taraf" kılıç mühür, üç salon
[Analiz] Tesla FSD otopilot çipinin çok açılı analizi
Konumlandırma X6'dan daha düşük | BMW X4 iyi mekanik seviyeye sahip
190423 Ayrıntılar daha özenli. Qianyou popüler bilim "Freaks" 3D baskı sürecini anlatıyor
[Pazar] Cobos ve Stone Century Karşılaştırması
"BLACKPINK" "Paylaş" 190423 BLACKPINK-ROSE'un son güzel fotoğrafları yayınlandı Egzotik güzellik patlak verdi!
Satışlar yine 10.000'i kırdı | Buick Hideo'nun avantajı nerede?
"KAZANAN" "Haberler" 190423 Hawaii'nin UV ışınları ile savaş hattı Seul'e çekildi, WINNER yolculuğunu sonlandırdı ve dün gece Kore'ye döndü
To Top