TMS320C6678 çok çekirdekli DSP'nin HyperLink uygulaması

Lu Jianzhang 1, Liu Yang 2

(1. Leihua Elektronik Teknolojisi Araştırma Enstitüsü, AVIC, Wuxi 214063, Jiangsu; 2. Jiangnan Bilgisayar Teknolojisi Enstitüsü, Wuxi 214083, Jiangsu)

: Gömülü uygulamalarda çoklu işlem sistemlerinin karşılaştığı temel sorun, çoklu işlemciler arasındaki veri iletişimidir. Key-Stone mimarisi TMS320C6678 işlemcisinin HyperLink iletişim mekanizmasını inceleyerek, işlemciler arasında yüksek hızlı veri alışverişi sağlamak için yüksek hızlı, düşük gecikmeli ve birkaç pini kullanır. Pratik uygulama açısından, HyperLink haritalama yapısı tasarlanır ve çok işlemcili iletişim için belirli bir referans değeri olan performans analiz edilir.

: TMS320C6678; HyperLink; işlemciler arası iletişim

: TN915.04 Belge tanımlama kodu: ADoi: 10.19358 / j.issn.1674-7720.2017.03.011

Alıntı biçimi : Lu Jianzhang, Liu Yang. TMS320C6678 çok çekirdekli DSP J HyperLink uygulaması. Mikrobilgisayar ve Uygulama, 2017,36 (3): 36-38,41.

0 Önsöz

Gömülü alandaki işlemci tasarımı, çok çekirdekli ve çok işlemcili olarak hızla gelişmiştir, en tipik olanı TI'nın KeyStone mimarisinin çok çekirdekli işlemcisidir. TI'nin Kasım 2010'da piyasaya sürülen KeyStone mimarisi 8 çekirdekli DSP işlemcisi TMS320C6678, her bir C66x çekirdeği 1,25 GHz'e kadar saat hızına sahip, saniyede 40 GB'a kadar MAC sabit nokta hesaplama ve 20 GB FLOP kayan nokta hesaplama yetenekleri sağlayabilir; 18 çekirdekli TMS320C6678, sabit kayan noktalı hesaplama yetenekleri ve gerçek zamanlı performans için yüksek gereksinimleri olan petrol ve gaz arama, radar sinyali işleme vb. İçin uygun, TS201S [1] 'den 50 kat daha fazla olan 160 GB FLOP'a eşdeğer kayan nokta hesaplama gücü sağlar. Ultra yüksek performanslı bilgi işlem uygulamaları.

İşlemciler arasında veri alışverişi, çok işlemcili sistemlerin karşılaştığı temel zorluktur.İletişim mekanizmasının kalitesi, sistemin işlem performansını doğrudan etkiler.Etkili bir iletişim mekanizması, çok işlemcili sistemin yüksek performansı için önemli bir garantidir. TMS320C6678, tek çipli çok çekirdekli bir yapı olan TI'nin yeni KeyStone çok çekirdekli mimarisini benimser. Yerleşik çoklu çipler arasındaki iletişim nispeten karmaşık olduğundan, farklı tasarım seçenekleri doğrudan iletişimin verimliliğini etkileyecektir. TMS320C6678, KeyStone yapısına dayalı tescilli bir çevre birimi arabirimi olan HyperLink'i benimser ve benimsenen kodlama yöntemi 8b9b'ye eşdeğerdir.Yüksek hızlı SerDes arabirimi için kullanılan geleneksel 8b10b kodlama yöntemiyle karşılaştırıldığında, kodlama fazlalığını azaltır ve veri aktarım verimliliğini artırır. Tek bir yonga, tasarım hızı 12,5 Gb / sn olan 4 SerDes kanalı sağlar, böylece HyperLink'in teorik iş hacmi 44,4 Gb / sn'ye ulaşabilir.

Yukarıdaki analize dayanarak, bu makale önce TMS320C6678 çok çekirdekli işlemci için HyperLink'in ilkesini ve mekanizmasını tanıtır, ardından çipler arasındaki HyperLink iletişiminin eşleme ilkesini analiz eder ve iletişim bağlantısının gerçekleştirme yöntemini verir ve çeşitli eşleme ilişkilerini karşılaştırır. Gömülü çok işlemcili sistemlerin tasarımı için referanslar sağlayan avantajlar ve dezavantajlar ve uygulama kapsamı elde edilir.

1HyperLink mekanizması

HyperLnik, iki KeyStone mimarisi DSP'si arasında yüksek hızlı, düşük gecikmeli ve düşük pin sayılı bir iletişim bağlantısı sağlayabilir. Bu, TI'ya özel bir çevre birimi arabirimidir. PCIE'ye benzer bir bellek eşleme mekanizması kullanır, ancak çok çekirdekli DSP için bazı daha esnek özellikler sağlayabilir.Aşağıda, HyperLink'in bileşimi ve yapılandırması bir uygulama perspektifinden analiz edilir.

1.1 Modül mimarisi

HyperLink, gömülü sistemlerdeki yongalar arasında verimli veri etkileşimi gerçekleştirmek için TI tarafından geliştirilen noktadan noktaya tam çift yönlü bir bağlantı modudur ve üç aktarım modu sağlayabilir: okuma, yazma ve kesme. HyperLink modül mimarisi Şekil 1'de gösterilmektedir. PPL, modülün saat kontrolünden sorumludur ve gerekli dahili saati makul bir frekans çarpım faktörü konfigürasyonu ile üretir, böylece bağlantı [2] üzerindeki veri iletimini yürütür.

1.2 Haritalama mekanizması

TMS320C6678'in her bir çekirdeğinin 0x40000000-0x50000000 adres alanı, HyperLink'e özeldir.İlgili çekirdek, HyperLink Şekil 1 modül mimari şemasını yapılandırdıktan sonra adres alanını yalnızca okuyabilir ve yazabilir ve ilgili yapılandırma aracılığıyla uzak depolama alanıyla eşlemeyi gerçekleştirebilir. DDR, SL2 ve LL2 dahil, çok esnek bir haritalama ilişkisine sahiptir. resim 2'de gösterildiği gibi.

Herhangi bir TMS320C6678 için, her biri DSP1'in LL2, SL2 ve DDR'si gibi farklı bir uzak adrese ve uzunluğa karşılık gelebilen toplam 64 giriş eşleme penceresi vardır. Yerel çıkış penceresi, uzak giriş penceresinin gösterdiği adres alanına eşlenebilen 1616 MB adres alanından oluşur. Şekil 2'deki eşleştirme yapılandırması aracılığıyla, DSP0, tıpkı kendi yerel depolama alanına erişir gibi, DSP1'in tüm bellek alanlarına erişebilir. Adres eşlemesini elde etmek için, aşağıdaki şekilde ayarlanmalıdır [3]:

(1) Verici adres maskesi kaydını (TXIGMASK), PrivID'yi ve güvenlik bit alanı kaydını gerçek adres eşlemesine ve adres geçerli bitlerine göre yapılandırın ve alıcıda adres bölümü seçim yazmacını (RX_SEG_VAL) ve PrivID tablosunu yapılandırın;

(2) Seri / seriyi kaldırma modülü (SerDes) referans saatini, veri aktarım döngü modunu ve bağlantı hızını ve diğer bilgileri yapılandırın;

(3) Faz kilitli döngü kaydını (CFGPLL) yazın, HyperLink'in eğitim sırasını başlatın ve fiziksel katmanın hazır durumuna dönmesini bekleyin.

Yukarıdaki yapılandırmaya göre, DSP0 yerel çıkış penceresi adresini okuduğunda ve yazdığında, HyperLink, eşlenen uzak adrese doğrudan erişmeye eşdeğer olan adresi çevirir.

1.3 Adres çevirisi

İşlemci çekirdeği 1, yerel özel adres 0x40001234 üzerinden okuma ve yazma işlemleri gerçekleştirdiğinde, HyperLink, özel adresi ve PrivID'yi (çekirdek 1) adres maskesi kaydının yapılandırma gereksinimlerine göre birleştirerek gönderenin HyperLink istek adresini oluşturur. Örneğin, gönderen yapılandırma adres maskesi kaydı (TXIGMASK) 11'dir (yani maske 0x0FFFFFFF'dir) ve PrivID bit alanı 1'dir (yani Bit31: 28), ardından çeviriden sonra istek adresi çıktısı PrivID + 0x400012340x0FFFFFFF = 0x10001234'tür. Alıcı taraf, istenen adres eşlemesinin hedef adresini segment seçim yazmacına göre analiz eder, böylece veri erişimini tamamlar. Tüm alıcının adres çeviri işlemi Şekil 3'te gösterilmektedir.

Şekil 3'teki süreci örnek olarak ele alırsak, PrivID indeks değeri 1, alınan istek adresinin 31:28 bitinden çıkarılır, karşılık gelen tablonun karşılık gelen değeri 7'dir ve adres parçası tablosu endeksi 0x10, 29:24 bitten çıkarılır ve karşılık gelen tablo karşılık gelir Adres parçasının başlangıç adres değeri 0x0C00 ve uzunluğu 23'tür (yani 16 MB) Adres dönüşümü ile son gerçek erişim adresi 0x0C001234'tür.

2HyperLink uygulama tasarımı ve performans testi

Yukarıdakiler, TMS320C6678'in HyperLink iletişim mekanizmasının ve uygulama sürecinin basit bir analizidir, ancak TMS320C6678'in güçlü çok işlemcili işlevini gerçekleştirmek için, sistemin perspektifinden iyi bir topoloji tasarlanmalıdır. İletişim maliyeti, bant genişliği ve işlevi, iletişimi değerlendirmek için önemli göstergelerdir.Aşağıda çok işlemcili bir iletişim yöntemi tanıtılır, topolojik yapıları analiz edilir ve farklı haritalama yapılandırmaları için test karşılaştırmaları yapılır.

2.1 Topoloji

Bir havadan radarın belirli bir şasisindeki birden fazla işlemci (6678) arasındaki iletişimi örnek alarak, havadan radar tasarımında HyperLink'in nasıl kullanıldığını kısaca açıklayın. Şekil 4'te gösterildiği gibi, bir radar kasasında 4 TMS320C6678 işlemci vardır.Her işlemci 8 çekirdek içerir ve bir RapidIO yönlendiriciye bağlanır.Tüm kasadaki her iki işlemci, HyperLink aracılığıyla iki gruba bağlanır. Kasadaki işlemci topolojisi oluşturulur ve her işlemci, verimli veri akışı sağlamak için HyperLink ve SRIO'yu birleştirir.

2.2 Performans testi deneyi

Bu bölüm, HyperLink'in uzak depolama alanına erişim performansını değerlendirir ve farklı işletim koşulları altında elde edilen performans testi verilerini sağlar. Testlerin çoğu, en ideal test koşullarında gerçekleştirilir, böylece değerlendirme maksimum verim elde edebilir. İşlemcinin çalışma frekansı 1 GHz olarak ayarlanmıştır, DDR 64 bit olarak yapılandırılmıştır, bit genişliği 1333 MB'dir ve kullanılan derleme ortamı TI'nın CCSv5.0'ıdır.

İletişim testi sonuçları, LL2 ile uzaktaki büyük doğrusal depolama alanı arasındaki veri iletimini test etmek için HyperLink kullanılarak elde edilen aktarım bant genişliğini açıklayan Tablo 1'de gösterilmektedir. Transfer bloğunun boyutu 64 KB'dir. Bant genişliği, iletilen toplam bayt sayısının aktarım için geçen süreye bölünmesiyle hesaplanır. Tablo 1'deki veriler, önbelleğin, DSP çekirdeğinin HyperLink üzerinden veri okumak için performansını büyük ölçüde artırabileceğini göstermektedir. Bununla birlikte, L2 önbelleği, HyperLink aracılığıyla veri yazma performansını bastırır, çünkü L2 bir yazma-ayırma önbelleğidir. L2 önbelleği etkinleştirildikten sonra yazma işlemleri için, her zaman önce depolama alanından L2 önbelleğine yazılacak 128 B veriyi okuyacak, ardından L2 önbelleğindeki verileri değiştirecek ve son olarak önbellek çakıştığı zaman orijinal belleğe geri yazacaktır. Alan veya yapay olarak orijinal depolama alanına geri yazın.

HyperLink, TMS320C6678 aracılığıyla iletim için EDMA olaylarını da ayarlayabilir İletişim testi sonuçları Tablo 2'de gösterilmektedir.

Tablo 2'deki EDMA verim oranı verileri TCO (aktarım kontrolörü 0) ve CC0 (kanal kontrolörü 0) testleri ile elde edilir Diğer TC'lerin verileri TCO'dan biraz daha düşük olacaktır. Tüm iletimin darboğazı, EDMA aktarım denetleyicisi değil, HyperLink'tir. Tablo 2'deki test sonuçları, HyperLink aracılığıyla yazma işlemlerinin performansının, HyperLink aracılığıyla okuma işlemlerinin performansından daha iyi olacağını göstermektedir.

3 sonuç

Bu makale, TMS320C6678 işlemcisini temel alan çipler arası iletişimi inceler ve HyperLink modül yapısını, eşleme mekanizmasını (kayıt yapılandırması ve özel uygulama yöntemleri dahil) ve adres çeviri sürecini derinlemesine analiz eder.Makale, örnek bir test olarak belirli bir havadan radar işlemci topolojisini kullanır HyperLink'in veri aktarım performansını iyileştirin. Birden çok DSP işlemcisinin çipler arası iletişiminin tasarımı için belirli bir yol gösterici değere sahiptir.

Referanslar

1 Texas Instruments Inc. Çok çekirdekli tasarıma genel bakış Z .2011.

2 Texas Instruments Inc. TMS320C6678 veri kılavuzu Z. 2011.

3 Texas Instruments Inc. KeyStone Mimarisi HyperLink Kullanıcı Kılavuzu Z. 2012.

Hibrit güç gerçekten saf elektrikli araçlardan sonraki en iyi şey mi?
önceki
Yılın ikinci yarısında en çok izlenen ABD dizisi gişe rekorları kıran film yarın yayınlanacak
Sonraki
"The Incredible Gensokyo TOD YENİLENMİŞTİR" Çin Çıkış Tarihi Onaylandı, PS4 / Switch'te Çıkıyor
ölüm cezası! Hefei kadın piyano öğretmeni ilk derece cezasında öldürüldü, sanık cezaya itiraz edecek
ZigBee'ye dayalı fotovoltaik güç istasyonu ortamının gerçek zamanlı izleme sistemi
Siyah teknoloji ve yüksek değerli ürün OPPO R17 Pro bugün saat 0: 00'da açık randevu
Bu Xia Ya üniformasını giyerek kırmızı kuyruklu yıldız da olabilirsiniz.
Sabah Okuma Gelecek yıldan itibaren 5.000 yuan tarife ücretsiz çevrimiçi alışveriş 2035'te üç yıllık okul öncesi eğitimi tamamen evrenselleştirin
Ekran Süresi Instagram'daki Japon sanatçıların son güncellemelerinden oluşan bir koleksiyon
Pekiştirmeli öğrenme çerçevesi, AI geliştirmede yeni beyinleri patlatacak mı?
Bir büyüteçle karşılaştırılabilir Huawei Mate 20 Pro makro yetenek deneyimi
"Makaisenki" ilk remake sürüm ayrıntıları ve sınırlı sürüm içeriği duyuruldu
Makine Öğreniminde Karar Ağaçlarının İlkeleri ve Algoritmaları | Popüler Bilim
ARM ve Android'e Dayalı Akıllı Ev Kontrol Sisteminin Tasarımı
To Top