Tesla FSD otopilot çipinin çok açılı analizi

Lei Feng net basın: Bu makale StarryHeavensAbove genel hesabından aktarılmıştır, yazar Tang Shan

Kısa süre önce tamamlanan Tesla Otonomi etkinliğinde Tesla, Tam Otomatik Sürüş (FSD) Bilgisayarının birçok detayını sistemden çipe kadar cömertçe tanıttı. Çip açısından bakıldığında, "şeffaflığı" Google'ın birinci nesil TPU'su dışında AI ile ilgili tüm yongaları aşıyor. Aslında, Goolge TPU'nun durumuna benzer şekilde, Tesla da bu sürümden önce belirli bir patent düzeni yaptı, bu da Tesla'nın FSD yongasını farklı açılardan daha derinlemesine anlamamızı sağlıyor.

zaman çizelgesi

Tesla'nın otopilot çipi başkanı Pete Bannon, ilk olarak çip geliştirme sürecini tanıttı:

Şubat 2016: İlk ekip üyesi katıldı;

Ağustos 2017: İlk baskı (18 ay sonra);

Aralık 2017: Çip geri dönüyor ve yanıyor;

Nisan 2018: Üretime BO Sürümü;

Temmuz 2018: Üretim başlangıcı;

Aralık 2018: Çalışan güçlendirme çalışmaları başlıyor;

Mart 2019: Model S ve X üretimi başlıyor;

Nisan 2019: Model 3 üretim başlangıcı

Pete'in deyimiyle, Tesla'ya katılmanızdan gerçek ürünlerde çip ve sistemlerin konuşlandırılmasına kadar geçen süre yaklaşık 3 yıl sürdü, bu yaptığı projelerde en kısa süre olabilir. Bunu Tesla'nın güçlü dikey entegrasyon ve paralel çalışma yeteneklerine bağladı.Ayrıca Tesla'nın güçlü Güç kaynağı tasarımı, Sinyal bütünlüğü tasarımı, Paket tasarımı, Sistem yazılımı, Kart tasarımı, Aygıt yazılımı ve Sistem doğrulama ekiplerinden de özellikle bahsetti. Tesla burada bize bir referans, yani bir SoC yongasını tasarlamak, üretmek ve başarılı bir şekilde dağıtmak için gereken çaba ve zamanı veriyor.

Sistem ve çip tasarımı

Sistemi ve yonga tasarımını özel olarak tanıtmadan önce Pete Bannon, projenin öncülünü, yonga gereksinimlerinin karmaşıklığını büyük ölçüde azaltan "Yalnızca bir müşteri Tesla var" dedi. Özetlemek gerekirse, FSD yongaları için gereksinimler aşağıdaki noktalara düşüyor, ardından güç tüketimi, bilgi işlem gücü, Barch boyutu (gecikme) ve güvenlik geliyor. Takip eden QA'da Pete, Model 3'ün güç tüketimi hedefinin mil başına 250 W olduğundan bahsetti (Elon Musk bunu ekledi ve gerçek güç tüketiminin yol ortamıyla belirli bir ilişkisi var).

kaynak: Tesla

İlk birkaç gereksinim esas olarak yonga tasarımına yansıtılır ve güvenlik, çok sayıda yedekli tasarım gibi sistem düzeyinde pek çok hususa sahiptir. Aynı kart üzerindeki iki yonganın güç kaynağı ve veri kanalları bağımsızdır ve karşılıklı yedektir. Ve çok ilginç bir fikir, her iki yonganın da aynı verileri aynı anda analiz etmesi, ardından analiz sonuçlarını karşılaştırması (veya birbirini doğrulaması) ve ardından nihai sonucu çıkarmasıdır.

kaynak: Tesla

Bu yerde Elon Musk da şahsen müdahale etti ve tahtanın herhangi bir parçası arızalanırsa, aracın temel sürüşünü etkilemeyeceğini söyledi (bu noktayı daha sonra QA bağlantısına ekledi).

Bundan sonra Pete Bannon çipi çok detaylı bir şekilde açıklamaya başladı. Birincisi çipin görünümü, silikon ve bazı genel bilgiler. Sonraki QA oturumunda çipin Samsung'un 14nm sürecini kullandığı ortaya çıktı.

kaynak: Tesla

Ardından, SoC yongasının, CPU'nun (12 çekirdekli A72), GPU'nun, çeşitli arabirimlerin ve yonga üzerinde ağın temel bileşenleri vardır. Bu parçalar, üçüncü taraf standart IP kullanır.

kaynak: Tesla

Ek olarak, nihai kontrole sahip bağımsız bir CPU olan bir GÜVENLİK SİSTEMİ (aşağıdaki şekilde gösterildiği gibi) özellikle vurgulanmaktadır.

kaynak: Tesla

Elbette kendi geliştirdiği çipin en önemli parçası, aynı zamanda sürümün odak noktası olan Sinir Ağı İşlemcisi. İlki genel bilgidir.Her bir yonganın iki NNP'si vardır, her bir NNP'nin matrisi 96x96 MAC, 32MB SRAM'dir ve 2GHz'de çalışır. Dolayısıyla, bir NNP'nin işleme kapasitesi 96x96x2 (OPs) x2 (GHz) = 36.864TOPS, tek çip 72TOPS, kart 144TOPS'dir.

kaynak: Tesla

Çip üzerindeki SRAM miktarı burada belirtilmeye değer. Google'ın orijinal TPU'yu (256 x 256MAC, 24MiB SRAM) karşılaştırırsak, yonga üzerinde depolama miktarı oldukça yüksektir. NNP'deki belleğin toplam alanın 3 / 4'ünden fazlasını oluşturduğu aşağıdaki şekilde de görülebilir. Pete Bannonun açıklaması, güç tüketimini azaltmaktır. Tasarım hedefleri, Tüm modeller çipte saklanabilir. Kesinlik seçimi, çarpma için 8 bit ve toplama için 32 bittir. Bundan sonra, Pete Bannon çipin çalışma şeklini tanıttı.Çok yeni şeyler yok. 256B etkinleştirme ve 128B ağırlık okuma, deforme etme ve arabelleğe alma, 96x96 çarpma ve toplama işlemlerini birleştirin ve ardından MAC matrisinde işlemleri gerçekleştirin; nihai sonuç, özel ReLU ve Havuz donanım modüllerine kaydırılır ve ardından döngü başına 128B bant genişliği ile depolanır Hafızaya geri dön. MAC matrisi 96 x 96 olduğundan, MAC matrisine veri girilmeden önce, veri formatının dönüştürülmesi gerekir. Bu eylem dizisini tamamlamak için toplam bant genişliği gereksinimi 1TB / Sn'dir. Tüm verilerin yonga üstü SRAM'de olduğu düşünüldüğünde, bu bant genişliğinin karşılanması nispeten kolaydır.

kaynak: Tesla

Pete Bannon, kontrol mantığının güç tüketiminden de bahsetti, ICache, Register File ve Control mantığının tükettiği enerjinin operasyonlar tarafından tüketilen enerjiden çok daha fazla olduğuna inandığından, NNP'nin tasarımı kontrol mantığını olabildiğince basitleştiriyor ve sadece işlemleri gerçekleştiriyor. Buna karşılık olarak, komut seti sadece 8 talimatla nispeten basittir: DMA Okuma, DMA Yazma, Evrişim, Ters Evrişim, İç-ürün, Ölçek, Eltwidth, Durdur. Programlama modeli (kontrol akışı) da çok basittir ve bir işlemi tamamlamak için sadece 4 parça bilgi gerekir. Aynı zamanda temelde ortak bir işlev olan derleme aracını da tanıtır.

kaynak: Tesla

Son olarak, Pete Bannon çipin gerçek performans göstergelerini, saniyede 2300 kare, 72W verdi. Elbette bunun hangi ağın sonucu olduğunu bilmiyoruz. Derste verilen aşağıdaki örnek ağ ise, her çerçeve 35 GOPS gerektirir ve her saniye 35x2300 = 80TOPS olup, yaklaşık% 55'lik bir kullanım oranına ulaşabilir.

kaynak: Tesla

Şimdiye kadar FSD yongasının bazı detaylarını gördük, ancak mimari tasarımını tam olarak anlamak yeterli değil. Aslında, bu yayından önce Tesla, NNP için bir dizi patent başvurusunda bulundu ve daha detaylı şeyler görebiliriz.

Patent düzeni

Teslanın mevcut patentlerine ilişkin genel fikir, Google'ın önceki TPU patentlerine (Google'ın sinir ağı işlemci patentleri) benzer. İlk olarak, genel çerçeve ve yöntemler için patentlere başvurun, ardından özel hesaplamalar, veri formatı hazırlığı ve Vektör işleme. Aşağıdakiler dahil.

Accelerated Mathematical Engine (Eylül 2017)

Değişken gecikmeli bellek erişimine sahip Hesaplamalı Dizi Mikroişlemci sistemi (Mart 2018)

Ardışık olmayan veri biçimlendirme kullanan hesaplamalı dizi mikroişlemci sistemi (Mart 2018)

Vertor Computational Unit (Mart 2018)

Önce açıklamama izin ver, Patent ve gerçek uygulama çok farklı olabilir. Patent okumamız esas olarak karşılaştırma ve referans içindir. Aşağıda esas olarak ilk patente, genel yapı ve yöntem için patente bakıyoruz. Buradaki isim "HIZLANDIRILMIŞ MATEMATİKSEL MOTOR" olsa da, iddiadaki iddia, "Bir sinir ağında evrişimleri hızlandırmak için bir matris işlemcisi" nin temelde bir CNN hızlandırıcısı olduğudur.

Temel donanım mimarisi esas olarak büyük bir matris işlemciye (MATRIX PROCESSOR) odaklanmıştır (aşağıda gösterildiği gibi).

kaynak: Tesla patenti "HIZLANDIRILMIŞ MATEMATİKSEL MOTOR"

Veri ve Ağırlık, sırasıyla bir FORMATTER aracılığıyla format dönüşümüne tabi tutulur, BUFFER'da depolanır ve ardından bir donanım devresi tarafından okunur ve matris işlemciye verilir. Patent, FORMATTER'ın yazılım veya donanım olarak uygulanabileceğini ve gerçek yongasının donanımda uygulanması gerektiğini belirtmektedir. Bu boyuttaki (96x96) MAC matrisinin etkin kullanılması gerektiğinden, giriş verilerinin düzenlenmesi gerekir.Bu formatlayıcı büyük rol oynamıştır. Bu nedenle, bunun için bir patent başvurusunda da bulundular (Google da benzer bir durumda) ve ilgilenen öğrenciler de göz atabilirler.

Matris çarpma ve toplama işlemi tamamlandıktan sonra, sonuç, biriktirme, ReLU ve Havuzlama dahil olmak üzere sonraki işlemler için matris işlemcisinden çıkarılacaktır (patentteki açıklamaya göre, yukarıdan aşağıya adım adım hareket ettirilmelidir). Vector Engine ve Post-Processing Unit tarafından tamamlandı. Bu bölümün de özel bir patenti var (başvuru süresi daha sonra) ve ifade ana yapı patentiyle biraz tutarsız görünüyor. Diğeri, olabildiğince basit bir tasarım olan kontrol mantığı kısmıdır.

Aritmetik birimin tasarımını görmek için matris işlemcisine (MAC Array) geçelim.

kaynak: Tesla patenti "HIZLANDIRILMIŞ MATEMATİKSEL MOTOR"

Google'ın patentindeki hesaplama birimini karşılaştırın,

kaynak: Google patenti "NEURAL NETWORK PROCESSOR"

Ana farkın Tesla'nın ek bir akümülatör ShiftAcc'ye sahip olması ve desteklenen veri akışının da daha esnek olabileceği görülebilir. Genel olarak Tesla tarafından açıklanan mimari, Google TPU patentinde açıklanan NNP'ye ("Sinir ağı işlemcisi") benzer, ancak tasarım ve sunumda daha eksiksiz görünmektedir. Spesifik uygulama açısından, bir temel fark, FSD yongasının, yonga dışı DRAM gerektiren Google TPU'nun aksine, çalışmak için çoğunlukla yonga üzerinde SRAM kullanmasıdır. Elbette, yine, patentler belirli bir gerçekleşme anlamına gelmez ve Google'ın patentleri çok daha eskidir. Bu sadece referans içindir.

Bu patentlerde hala bazı ilginç detaylar var ve bunları dikkatlice okuyacak zamanım olmadı. İlgileniyorsanız, kendiniz okuyabilir ve ilginç bilgileri paylaşmak için bir mesaj bırakabilirsiniz. Bu dört patenti sıraladım İndirme bağlantısını almak için arka planda "teslapat" a cevap verebilirsiniz. Google patentine bağlantı almak için "googlepat" yazarak yanıtlayın.

QA'da Öne Çıkanlar

Tesla'nın faaliyetlerine geri dönersek, QA da çip piyasaya sürüldükten sonra yapıldı.Bu kısım aslında çok ilginç. Her şeyden önce, Elon Musk şu paragrafta (sonuçta), "Bugün bu kadar detaylı bilgi vermemizin nedeni, başlangıçta Tesla gibi hiç çip yapmamış bir şirket için bir dünya geliştirmek zorunda olmasıdır. En gelişmiş çip imkansız görünüyor. Hedefimiz bu ve amacımız sadece biraz liderlik etmek değil, aynı zamanda büyük bir farkla liderlik etmektir. Bu pasajdan Teslanın kendi geliştirdiği çiplerin olması gerektiğini görebiliriz. Gereklilik ve yetenek sorgulanır. Sistem ve uygulama satıcıları için bu tür şüpheler de normaldir. Gereklilikten bahsetmek daha kolay Soru cevap bölümünde belirtildiği gibi, eğer Telsa her yıl milyonlarca araba satıyorsa ve kendi geliştirdiği çipler tüm arabanın maliyetini düşürebiliyorsa, tabi ki yapmaya değer. Çip araştırma ve geliştirme yeteneği sorusuna gelince, bu sürüm bir cevap olarak kabul edilebilir. Bu nedenle, bu çip şu anda dünya lideri olmasa da (göstergeler açısından Nvidia ile karşılaştırma çok bilimsel değil, bu Nvidia cevap verdi), Musk mermiyi ısırmak zorunda. Başka bir perspektiften, bu çip en azından kendi kendine araştırmanın uygulanabilirliğini kanıtlayabilir. Ayrıca Musk, bu sistemin avantajının, donanımının ve yazılımının Tesla'nın otonom sürüşü için özelleştirilmesi olduğunu da ciddi bir şekilde vurguladı. Nvidia ile karşılaştırıldığında, "Nvidia harika bir şirket, ancak birçok müşterileri var, kaynaklarını kullandıkça genelleştirilmiş bir çözüm yapmaları gerekiyor. Biz çok özel bir şeyi önemsiyoruz. Bunu aşamalı olarak yapmak için tasarlandı. iyi ve yazılım da bu donanım üzerinde giderek daha iyi çalışacak şekilde tasarlandı. Donanım ve yazılım kombinasyonu bence rakipsiz. "Tesla bu yolda devam edecek gibi görünüyor. Süreç sorulduğunda, Elon Musk özellikle yeni nesil çiplerin geliştirildiğinden bahsetti (yarısı yapıldı).

Lidar kullanılıp kullanılmayacağı sorulduğunda Elon Musk, "lidar aptalca bir iştir, lidar'a bel bağlayan herkesin şansı mahkumdur" dedi. Yapay zeka etkileyicisi Andrej Karpathy de bu noktayı sinir ağları ve yazılımla ilgili bir sonraki konuşmasında açıkladı. Sadece temel görüntü tanıma sorununu ortadan kaldırdı ve bize teknolojik ilerleme konusunda bir hipotez verdi. Bazı hızlı demolar yapılabilse de, sonunda kesinlikle başarısız olacak. "

Ayrıca gerçek sürücü testi ve simülasyonu hakkında bir soru var. Elon Musk, "Tesla da iyi simülasyonlar yapıyor, ancak gerçek ortamda meydana gelen çeşitli durumları simüle etmek hala zor. Simülasyon ortamı gerçek durumu simüle edebiliyorsa (Burada durakladı) (Tıklayın) Simüle edilmiş bir ortamda yaşayıp yaşamadığımızı bilmiyoruz. "Görünüşe göre ciddi bir bakış attı.

sonuç olarak

Tesla'nın otopilot çipi, FSD sisteminin en önemli parçasıdır ve hedef ürünü Nvidia'nın Nvidia Xavier SoC çipi olmalıdır (bkz. Hot Chips 30 - devlerin "Muscle" bölümünün ilgili kısmı). Nesnel olarak konuşursak, Tesla'nın çipi ile NvidiaXavier SoC çipi arasında her açıdan hala bir boşluk var. Tesla'nın SoC tasarımında, kendi geliştirdiği Sinir Ağı İşlemcisi bölümü dışında, diğeri endüstri standardı IP kullanıyor ve çok fazla özelleştirme çalışması yapmadı, ancak oldukça tatmin edici olduğu söylenebilir. NNP aynı zamanda nispeten basit bir mimari ve birçok mimari ve teknik yeniliğin yapıldığını söylemek zor. Başka bir bakış açısına göre, bu çip gerçekten büyük miktarlarda kullanılıyorsa, en azından niteliklidir. Tesla'nın hedeflerinin ve uygulama stratejilerinin net ve pratik olduğu görülüyor ki bu da sistem üreticilerinin kendi geliştirdiği çiplerin en büyük avantajı. Lei Feng Ağı Lei Feng Ağı

Referans:

"Tesla Özerkliği-Bölüm 1: Donanım, Çip Tasarımı", https://youtu.be/aZK1fARxYsE

"Tesla, Autopilot Hardware 3.0'daki yeni AI çipi için bir dizi patent başvurusunda bulunuyor", https://electrek.co/

@Şehrin parti üyeleri ve önde gelen kadroları, Pekin Belediye Parti Okulu yeni bir kitap listesi hazırladı!
önceki
Hafifçe deneyim Xiaopeng G3: Uzun mesafelerde elektrikli bir araba kullanmak nasıl bir deneyimdir?
Sonraki
CEO Lu Wenyong ile röportaj: AI, eğitimcilerin dostluğunun ve sıcaklığının yerini alamaz
Doğrudan isabet | Lakala nihayet ilk A-hisse ödemesi oldu, Sun Taoran: En iyilerden biri olmalı ama aynı zamanda saygı duyulan
Tuzlu görünüyor! Changlu Tuz Bölgesi, muhteşem bir manzara olan kaynak tuzu topluyor
Qualcomm'un AI gücünü tamamen ortaya çıkarın
Üçüncü kumar kralına, kızının Dou Xiao ile olan aşk ilişkisi soruldu. Netizenler: Zengin bir eşle evlenmek gerçekten zor
Alibaba Cloud'un Asya-Pasifik payı Amazon ve Microsoft'un toplamını geçti; Didi Shunfeng gri tonlama testini başlattı; Giant Network söylentileri reddediyor ve Shi Yuzhu elinden alındı | Lei Feng Mor
Ulusal Fuar: 350'den fazla harika sergi "Wenhua Hengshui" çizildi
Coco Lee'nin son fotoğrafları çok güzel! Netizenler 44 yaşındaki vücudun çok iyi olduğunu haykırdı
HKUST iFlytek, karı değerlendirme zamanı
40 yaşındaki Guangdong Hongyuan takımının sahibi, ateşli bir vücuda ve güzel bir yüze sahip ve iyi görünüyor.
SenseTime: Yeni "akıllı kabin" deneyiminin perde arkası teknik analizi
Hükümetimize saldıran deniz lotusları yeniden geliyor
To Top