AnandTech'ten derlenen kök
Kuantum üretimi | Genel hesap QbitAI
Bugün ARM, mobil terminaller için iki AI çip mimarisi, Nesne Algılama (OD) işlemcisi ve Makine Öğrenimi (ML) işlemcisi yayınladı.
Geçmişte ARM, yalnızca mimari hazır olduğunda duyurular yapıyordu. Alışılmadık bir şekilde bu sefer, duyuru ilk olarak stok yokken yapıldı: OD işlemcilerin ilk çeyrekte ortaklara sunulması planlanıyor; ML işlemcilerinin yıl ortasına kadar beklemesi gerekecek.
Bu da ARM'nin çok endişeli olduğunu gösteriyor.
Sonuçta, yarı iletken endüstrisinde, özellikle mobil çevrelerde, son birkaç aydır makine öğrenimi sıcaktı.
Çip mimarisi sağlayan birçok şirket, tüketici çözümlerini duyurdu ve Huawei bile kendi mimarisini geliştirmeye başladı. Sahaya çok fazla oyuncu girdi ama ARM pek bir şey yapmadı.
Sadece şimdi ARM, Armv8.2'nin yarı hassas kayan noktalı ve tamsayılı ürünlerle sinir ağları için özel talimatları basitleştiren ve hızlandıran CPU ISA uzantısına odaklandı.
CPU iyileştirmelerine ek olarak, G72'de makine öğrenimi için GPU iyileştirmeleri de gördük. Bu iyileştirmelerin her ikisi de yardımcı olsa da, maksimum performans ve verimlilik için yeterli değildir.
Kirin 970'in NPU'sunu ve Qualcomm'un DSP'sini test ederken, özel bir mimaride çıkarım çalıştırmanın verimliliğinin, bir CPU üzerinde çalışmaya göre çok daha yüksek olduğu görülebilir.
ARM'nin resmi olarak açıkladığı gibi, Armv8.2 ve GPU geliştirmeleri, bir makine öğrenimi çözümü oluşturmanın yalnızca ilk adımıdır ve özel çözümlere duyulan ihtiyaç da incelenmelidir.
ARM, kooperatif ortaklarından sektörün baskısını da hissetti ve sadece ML işlemcileri ile çıktı.
Aşağıda, bu kez piyasaya sürülen iki yeni mimariye kısa bir giriş yer almaktadır: makine öğrenimi ML işlemcisi ve OD işlemcisi.
ML işlemcileri, sinir ağı modeli çıkarımını hızlandırmak için özel olarak tasarlanmıştır. Bu mimarinin geleneksel CPU ve GPU mimarilerine göre belirgin avantajları vardır.
Bu ML işlemcisi, makine öğrenimi görevlerini gerçekleştirirken veriler için bellek yönetimini optimize eder.
İşlemci, veri girişini ve çıkışını en aza indirerek yüksek performans ve verimlilik sağlayan yüksek düzeyde veri yeniden kullanılabilirliğine sahiptir.
ML işlemci teorik olarak 1,5W güçte 4,6TOPs (8-bit tamsayı) üzerinde teorik çıktıya, 3TOPs/W'a kadar sahip olabilir.
TOPs değeri, işlemcinin performansını tam olarak yansıtmasa da, endüstri standardizasyonu için yine de yararlıdır.
Tamamen bağımsız bağımsız bir IP (devre işlevi) bloğu olarak ML işlemcinin kendi ACE-Lite arayüzü vardır ve SoC'ye veya DynamiQ'ya entegre edilebilir.
Ayrıca ARM, ML işlemcisi hakkında daha fazla mimari bilgi açıklamadı.
OD işlemci, nesne algılama görevi için optimize edilmiştir. ML işlemcileri aynı şeyi yapabilse de OD işlemciler daha hızlı olabilir. Maksimum verimlilik için tek bir görev için özel bir mimari sağlayın.
ARM ayrıca OD ve ML işlemcilerinin olası entegrasyonunu da hesaba kattı: OD işlemcisi, görüntüdeki hedef işleme alanlarını bölümlere ayırmaktan ve ardından daha ince taneli işleme için bunları ML işlemcisine geçirmekten sorumludur.
ARM ayrıca geliştiricilerin sinir ağı modellerini farklı NN çerçevelerine uygulamalarına yardımcı olacak birçok yazılım sağlar. Bugünden itibaren yazılım ARM geliştirici sitesinde ve Github'da da bulunabilir.
SoC geliştirme döngüsü göz önüne alındığında, yeni mimariye dayalı çipler muhtemelen 2019 ortasına veya sonuna kadar piyasaya sürülmeyecek. Bu sefer ARM'nin yarı iletken ve mimari tedarikçiler arasında AI trendine yanıt vermede en yavaş şirket olduğu söylenebilir.
Son olarak, derlenen kaynağı ekleyin,
https://www.anandtech.com/show/12427/arm-announces-trillium-machine-learning-ip
- Bitiş -
samimi işe alım
Qubit, Pekin, Zhongguancun'da çalışmak üzere editörler/muhabirler alıyor. Yetenekli ve hevesli öğrencilerimizin aramıza katılmasını dört gözle bekliyoruz! İlgili ayrıntılar için lütfen QbitAI diyalog arayüzündeki "işe alım" kelimesine yanıt verin.
Qubit QbitAI · Toutiao imzalı yazar
'' Yapay zeka teknolojisi ve ürünlerindeki yeni gelişmeleri takip edin