g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Yunzhisheng Kangheng: IoT AI çiplerinde beş trend! GTIC 2019

Akıllı şeyler (genel hesap: zhidxcom) metni | Yu Yang

Zhixi'nin ev sahipliğinde AWE ve Jiguo'nun ev sahipliğinde düzenlenen AI Chip Innovation Summit, 15 Mart'ta Şangay'da başarıyla gerçekleştirildi! Bu zirveye katılan seyirci yaklaşık 4.500 şirketi kapsadı ve seyirci son derece profesyoneldi, bunların arasında% 62'den fazlası yönetmen düzeyinde ve üzerindeydi ve sahnedeki gerçek katılımcı sayısı 1.800'ü geçti.

Konferans alanında yapay zeka ve AI çip endüstrisindeki 20 lider, mimari yenilik, ekolojik yapı ve sahne uygulaması açısından AI çiplerinin teknolojik beklentilerini ve endüstri eğilimlerini sistematik olarak tartışmak için bir araya geldi.

Kang Heng, Yunzhisheng'in kurucu ortağı ve başkan yardımcısı

Yapay zeka teknolojisinden yapay zeka yongalarına uzanan bir başlangıç olarak Yunzhisheng, geçen yıl Mayıs ayında IoT odaklı yongası UniOne'ı ve çözümü Swift'i piyasaya sürdü. GTIC AI çip zirvesinde, Yunzhisheng kurucu ortağı ve başkan yardımcısı Kang Heng, "Çipte Beceriler: Nesnelerin İnterneti için Yapay Zekanın İniş Yolu" üzerine bir açılış konuşması yaptı.

o düşünüyor, Nesnelerin İnterneti ve AI'nın inişiyle ve bulutu cihaz tarafına yerleştirme becerisiyle, orijinal geleneksel mimari yongalar büyük zorluklarla karşılaştı ve yeni çağ, yeni bir "SoC" -Skills On Chip gerektiriyor.

Bu amaçla, IoT yongalarının sahip olması gereken beş trend önerdi: Birincisi, genel mimariden yapay zeka mimarisine geçiş, kontrol edilebilir maliyetler öncülüğünde uç hesaplama yetenekleri sağlama ve daha iyi enerji verimliliği oranları elde etme; ikincisi, yapay zeka çipleri Tasarım, yazılım, donanım ve senaryoların organik kombinasyonuna odaklanmalıdır; üçüncü olarak, IoT yongaları yalnızca performans, güç tüketimi ve yonganın alanına değil, uygulama optimizasyonuna daha fazla dikkat etmelidir, yani odak PPA'dan APP'ye kaydırılır; dördüncü, Etkileşim, tek moddan çoklu moda dönüşme eğilimindedir; beşinci olarak, uç yongaların uç bulut etkileşimini sağlamak için bulutla etkili bir şekilde entegre edilmesi gerekir.

Bu, bir çip tasarlarken, odak noktamızın genel bir gereksinimden daha dikey ve senaryo tabanlı bir yeteneğe değiştirilmesi gerektiği anlamına gelir; ikinci olarak, çipin kendi yeteneklerinden çözümlere odaklanmaya, donanımın kendisine odaklanmadan senaryolara odaklanmaya kadar.

Önümüzdeki 2019'da ve 2020'nin başlarında Yunzhisheng, bu yılın üçüncü çeyreğindeki "Hummingbird" yongası dahil olmak üzere, daha uygun maliyetli ses yetenekleri sağlayan ve "Dolphin" yongası görüntü ve ses yeteneklerini birleştiren 3 çipe sahip olacak. "Snow Leopard", araç odaklı, araba düzeyinde etkileşimli bir çiptir.

Yunzhisheng'in kurucu ortağı ve başkan yardımcısı Kang Heng'in konuşma kaydı eklidir.

Kang Heng: Ben Pekin Yunzhisheng'den Kang Heng. Bugün Nesnelerin İnterneti'nin yapay zekası üzerine inip çip ile birleştirirken bir konsept ortaya koyuyoruz, önce bunu açıklamayacağım ve son sonucu adım adım çizeceğim.

Nesnelerin İnterneti hakkında detaya girmeyeceğim, bu sadece bir trend değil, bir gerçeklik. Daha çok endişelendiğimiz şey, Nesnelerin İnterneti ve genel eğilim bağlamında yapay zeka ile birleşmenin kaçınılmazlığı ve yasası ve ne yapmamız gerektiğidir.

Az önce Haier Başkan Chen'in dinleyiciler arasında yaptığı konuşmayı izledim. Genel bakış açısına çok katılıyorum. Özellikle Nesnelerin İnterneti ve AI birleştirildiğinde, sadece etkileşimli zeka hakkında konuşmamalı, aynı zamanda etkileşim ve kullanıcı verileriyle nasıl başarılacağından da konuşmalıyız. Veriler, kullanıcılara akıllıca ve proaktif olarak hizmet sağlar. Ancak etkileşimli zeka ve aktif zekanın çelişkili olduğunu düşünmüyorum, ancak organik bir bütün halinde birleştirilmesi gerekiyor.

Gelecekte herkesin bir AI asistanı olduğunu varsayarsak, sürekli öğrenme yoluyla, kullanım alışkanlıklarımızı anlayabilirler, tercihlerimizi bilebilirler ve aktif olarak talimat başlatmadan bize hizmet verebilirler.Bu aktif hizmet kavramıdır. Ancak aynı zamanda, bazı özel durumlar veya düzensiz olaylar olabilir Kullanıcı cihaza bir talep başlatmalıdır.Bu sırada etkileşim gerekli bir yol haline gelir.

IoT cihazları için bilgisayarlar, cep telefonları ve tabletler gibi geçmiş ürünlerden çok farklılar.Neden bugün AIoT, IoT ve yapay zekayı her şeyde zorla birleştiriyor mu? Hayır, ancak AI, Nesnelerin İnterneti için bir zorunluluk haline geldi. Birçok IoT ürününün ekranı, klavyesi, faresi ve düğmesi yoktur. Ancak, Nesnelerin İnternetinin gelişmesiyle birlikte İnternet bize ek yetenekler ve daha fazla hizmet sağlayacaktır. Kullanıcılar Cihazla etkileşime girmeniz gerekiyorsa, hizmet almak için onu çalıştırın. Bu, AI'nın anlamıdır.Bu yeni IoT cihaz biçimleri için yeni etkileşim yöntemleri sağlar.Ses, görüntüler, hareketler, vücut dili ve hatta ifadeler bile mümkündür. IoT cihazları altında yeni bir etkileşim yöntemi haline gelin.

Çiplerden bahsederken büyük bir trendden bahsetmem gerekiyor Bugünün IoT yongaları, özellikle AIoT yongaları daha çok tek bir program çalıştırıyor, yani böyle bir yonga üzerinde çalışan bir Beceri, aynı anda çok fazla düşünmeden. Birçok uygulamayı destekliyor çünkü çiplerin AIoT'ye büyük bir değişiklik yaptığına inanıyoruz, bu yüzden Skills On Chip konseptini önerdik.

Az önce söylediğim sonuca dayanarak, mimariden donanım ve yazılım kombinasyonuna, yonga tasarım standartları ve tek modlu ve çok modlu gereksinimlere ve hatta cihaz ve bulut, cihaz ve bulut kombinasyonuna kadar onu destekleyen birkaç bakış açısı var. Arasındaki karşılıklı maç. Bu noktalar, Skills On Chip'i dikkate almamızı gerektirir.

Birincisi, AI uygulandığında genel mimari hangi sorunlarla karşılaştı? AInın IoTye inişinden bahsettiğimde, daha çok uç taraftayım. Çipte uygulanması gereken birçok algoritma ve gereksinim var. Bazıları ağ bağlantısı sorunlarından, bazıları da gizlilik sorunlarından kaynaklanıyor olabilir. Kullanıcılar değil Gerçekten çok sayıda özel verinin internete yükleneceğini ve daha sonra işleneceğini umuyorum, ancak umarım veriler yerel olarak işlenir. Aslında, bunun yerel bilgi işlem gücü için ek gereksinimleri vardır, ancak genel amaçlı yongaların bu bakımdan özünde kusurları olacaktır. Arm gibi bir mimari veya diğer genel amaçlı mimariler kullanıyorsanız, bilgi işlem gücü desteklemek için yeterli değildir veya Bunu desteklemek için nispeten geniş bir alan çipine ihtiyaç var Aslında, yerel hesaplama gücünün genel mimari tarafından desteklenmesinin yetersiz kaldığı yer burasıdır.

Belki de ses işleme, çip hesaplama gücü için en zorlu interaktif yöntem değildir.Daha yeni veri boyutları dahil olmak üzere görüntü işlemeye bakabilirsiniz. Aynı zamanda yaptığımız son-yan ürünlerin maliyet açısından kullanıcıların ihtiyaçlarını karşılayıp karşılayamayacağını da göz önünde bulundurmalıyız, artık sunucu chipleri veya bulut chipleri düşünmüyoruz. Akıllı etkileşimli işlevleri gerçekleştirmek için geleneksel ev aletlerine birkaç yüz dolar eklememiz gerekirse, hiçbir kullanıcının ödemeye istekli olmadığını düşünüyorum, bu yüzden maliyet de çok önemli. Şu andaki nedenlerden yola çıkarak, uç tarafta zekanın gerçekleşmesinin yeni bir mimari ile desteklenmesi gerektiğine ve mevcut genel amaçlı mimarinin yeterli olmadığına inanıyoruz.

İkincisi, yazılım açısından bakıldığında, yongaya NPU ve GPU gibi nispeten yaygın bazı işlem birimleri ekleyebiliriz. Bununla birlikte, bir uygulamanın hala bu hesaplama birimlerinde çalıştırılması gereken birçok algoritması vardır.Şekil tipik bir ses etkileşim sürecini göstermektedir.Bunların arasında yankı iptali, konuşma sentezi, konuşma tanıma gibi bazı algoritmalar olduğunu görebilirsiniz. Doğal konuşma işleme vb. SOC'de CPU ve NPU var, peki hangi parçanın CPU üzerinde çalışması gerekiyor? NPU'da hangi parçaların çalışması gerekiyor? Ya da farklı algoritmaların hangi kısımlarının NPU üzerinde çalıştığı, bunu derinlemesine anlayamazsak, yazılıma veya iki parçanın organik kombinasyonuna değil, sadece çipin kendisine odaklanırsanız, çip tasarlanamaz. Çok iyi, bu da başka bir çelişki.

Daha iyi bir çip tasarımı elde etmek için, sadece çip tasarımına odaklanmamız değil, aynı zamanda AI algoritmalarında bir geçmişe sahip olmamız ve hatta bazı uygulama senaryolarını bilmemiz gerekiyor. Tıpkı az önce verdiğim tam sesli etkileşim örneği gibi, bu aslında uygulama senaryosunun deneyimidir.Eğer çip üzerinde ses tanıma algoritmasını bir devre oluşturacak şekilde tasarlarsanız, senaryoyu anlamazsınız ve çip az önce bahsettiğim amaca ulaşamaz. .

Üçüncüsü, PPA'dan APP'ye, bu ne anlama geliyor? PPA, birçok yonga uzmanının dikkat ettiği verilerdir. Performans, güç tüketimi ve alanı ifade eder. Tüm yongaların ilgilendiği şey budur. Alan maliyet anlamına gelir. Her dönüşte düzinelerce uygulamayı çalıştıran genel amaçlı yongaların aksine, IoT yongamızın kendisi çok fazla uygulama çalıştırmaz Çipin bu uygulama için özel olarak tasarlanması ve optimize edilmesi gerekir. Nesnelerin İnterneti'nin çip tasarımı, PPA'ya odaklanmaktan APP'ye (uygulama) daha fazla odaklanmaya doğru kaymalıdır.

Ne anlama geliyor? Bu, çipleri tasarlarken odağımızı genel gereksinimlerden yongaları daha dikey ve sahne odaklı yapmaya değiştirmemiz gerektiği anlamına gelir; ikincisi, çipin kendi yeteneklerinden çözümlere odaklanmaya, donanımın kendisine odaklanmaktan sahneye odaklanmaya.

Dördüncüsü, etkileşim açısından, tek moddan çoklu moda çok net bir eğilim belirtilmelidir. Sözde tek mod, etkileşim problemini çözmek için tek bir teknolojiyi (ses, görüntü gibi) kullanmaktır.İnsanlar arasındaki etkileşim, ses, ifade ve hareket dahil olmak üzere farklı etkileşim yöntemlerinin bir kombinasyonu olmalıdır. Bugün akıllı konuşmacılara bakarsanız, daha az uygun bir benzetme yapabilirsiniz Günümüzün akıllı konuşmacıları, yalnızca işiten ancak göremeyen işitmeyen kör insanlara eşdeğerdir. Ya da kişi konuşmacı ile konuşmasa bile, başka bir meslektaşıyla iletişim kurmak için arkasını döndüğünde, akıllı konuşmacı aniden uyandı ve sonra cevap verdi, bu çok garip bir şey, bu yüzden etkileşim sürecinde multi-modalite kullanılmalıdır. Bu aynı zamanda IoT çipinin çözmesi gereken bir sorundur ve yalnızca tek bir veri boyutunu işleyemez.

Beşincisi, bağımsızlıktan işbirliğine. Cihazlarımız sadece tek bir kontrol olmamalı, bu cihazların etkili bir şekilde bağlanması, verileri birbirleriyle paylaşması ve kullanıcılara sahne odaklı bir deneyim sunmak için birbirleriyle işbirliği yapması gerekir. Şu anda, çipin bulut ile etkin bir şekilde birleştirilmesi gerekiyor. Bu, üzerinde durduğumuz "uç bulut etkileşimi".

Yukarıdaki nedenlerden yola çıkarak, IoT'de kullanılan AI çip etkileşiminin Becerileri dikkate alması gerektiğine inanıyoruz.Çip üreticileri veya çözüm üreticileri sadece çip sağlamalı, sadece donanım sağlamamalı, çipleri tasarlarken yenilerini de dikkate almalıyız. Çip, IoT, AI ve bulutu birleşik bir şekilde ele alabilmemiz için veri boyutu ve terminal-bulut etkileşiminin dikkate alınması Bugün ifade etmek istediğimiz kavram budur - Skills On Chip.

Ayrıca Yun Zhisheng'in ilerlemesini ve Skills On Chip üzerindeki çalışmalarını tanıtıyorum. Yunzhisheng, Swift kod adlı endüstrinin ilk IoT yapay zeka çipini 2018'de piyasaya sürdü ve bu yıl dış dünyaya daha fazla çip piyasaya sürülecek. Nispeten konuşursak, teknolojide ilerlemek, konuşmadan görüntüye çok modalite yönünde daha da ileri gitmek anlamına gelir.Örneğin, kendi geliştirdiğimiz DeepNet, 1.0'dan 2.0'a hareket edecek ve hesaplama gücü daha da büyük olacak bir derin öğrenme hızlandırıcısıdır. zengin. İlk nesil yalnızca LSTM ve CNN konuşma odaklı yapıları destekler. DeepNet2.0, yeniden yapılandırılabilir hesaplama ve destekleyen algoritma işlemeyi içeren RNN, DNN, görüntüyü destekleyecektir.Kısacası, yeni mimari gelişmeye devam edecektir. Bazı yeni yenilikler de var: Örneğin, resimde gösterilen kendi geliştirdiği insan vücudu tanıma ve fiziksel tanıma FPGA simülasyonunda nispeten iyi işleyebildi.

Özellikle görüntü ve yüz tanıma gibi çok modlu işleme yaparsak, ISP işleme (görüntü ön işleme) yapmalıyız. ISP açısından, Harvard'dan BlinkAI teknik ekibi ile işbirliği yapıyoruz. Algoritmaları derinliği kullanıyor Öğrenin, ISP'yi daha iyi hızlandırabilir, daha iyi çalışabilir ve DeepNet'imizde daha iyi verimlilik ve güç tüketimi sağlayabiliriz.

Daha önce de belirtildiği gibi, DeepNet 2.0'a sahip olduğumuz için, hem hesaplama gücü, verimliliği hem de algoritmalar geliştirildi.İkincisi, ses teknolojisinde çok büyük atılımlar oldu. Bu, insan işitme sınırını tamamen aşan süper işitme sınırını gösterir. Ses seviyesi 100 desibeli aştı ve gürültü ve insan sesi aynı yönde. Bu, birçok geleneksel algoritma için son derece ciddi bir zorluk teşkil ediyor, ancak bugün Bu teknoloji, algoritma ve DeepNet2.0 mimarisi üzerinde tamamen hayata geçirilmiştir.

Skills On Chip'de de çok önemli bir nokta olan cihaz ve bulutun birleşiminden bahsedelim. Çip ve Nesnelerin İnterneti birleştirildikten sonra, bağımsız olarak çalışamamalıdırlar, bu da bilgi işlem gücü tahsisi konusunu içerecektir. Ses etkileşiminde sıklıkla karşılaşılan senaryolar ve teknik problemler cümle bölütleme problemidir, yani "Ben bir şarkı dinlemek istiyorum" dersem, akıllı konuşmacıya bu cümlenin sürekli olmadığını söylerseniz, Uzun bir duraklama var ve mevcut akıllı konuşmacı emin değil, çünkü ortada uzun bir duraklama görüyor ve sonra duruyor ve bununla ilgilenmiyor. Konuşmacı "istiyorum" kelimesini duyar ve size bir grup cevap verir. "Ben de seni özledim", ama kullanıcıların gerçekten istediği bu değil.

Kullanıcıların sorunlarını gerçekten anlamak istiyorsanız, bunun bulutta yapılması ve çip ile bulut arasındaki ilişkinin bağlantılı olması gerekir.Bu, uç bulut etkileşimi açısından da yapacak çok işimiz olduğunu söylemek için çok basit bir örnektir.

Resim Yunzhisheng'in yapay zeka çiplerindeki yol haritasını gösteriyor. 2018'de Yunzhisheng, ilk IoT odaklı yapay zeka çipi Swift'i piyasaya sürdü.Daha sonra 2019'da ve 2020'nin başlarında üç çip olacak. Hummingbird (sinek kuşu) yılın üçüncü çeyreğinde çok rekabetçi ve uygun maliyetli bir üründür. Yunus (yunuslar) görüntü ve sesin bir birleşimidir, böylece ürün sadece anlayamaz, aynı zamanda "işitme yetersizliği olan körler" durumundan da kurtulabilir. Leopard (Snow Leopard), araçlar için sadece ses etkileşimi değil, aynı zamanda bazı görüntü etkileşimleri için araba düzeyinde bir ses etkileşim çipidir.Tabii ki etkileşime daha fazla önem veriyoruz. Bunlar bugün paylaştığım konular, hepinize teşekkür ederim!

Samsung S10 + incelemesi: "Android amiral gemileri" için bir kriter

Dikkat hırsız! Hangzhou'nun gizemli devriye kuvveti hırsızları saklanacak hiçbir yerde tutmaz