Baidu'nun beyin yapay zeka teknolojisi devleri, yazılım ve donanımla entegre yapay zeka üretim platformunu açıklamanız için savaş alanında.

"Teknoloji sınırı, geniş kapsama alanı, bu tüm süreçte boşluk içermeyen bir alt forumdur"

"Teknik açıklama detaylı ve gerçek durum yeterli. Bu, 'paranın karşılığını fazlasıyla almanın' alt forumudur" ...

3 Temmuz öğleden sonra, planlandığı gibi "Baidu Create 2019" Baidu AI Geliştirici Konferansı Baidu Beyin Forumu düzenlendi. Sabah ana forumunda Baidunun Baş Teknoloji Sorumlusu Wang Haifeng, tarihteki en hızlı yükseltmeyi başaran Baidu Brain 5.0'ı resmi olarak yayınladı. Algoritma atılımlarına ve bilgi işlem mimarisi yükseltmelerine dayanarak, yapay zeka algoritmalarının, bilgi işlem mimarilerinin ve uygulama senaryolarının entegrasyonunu ve yeniliğini gerçekleştirdi. Yazılım ve donanımı entegre eden bir yapay zeka üretim platformu olmak.

(Baidu Baş Teknoloji Sorumlusu Wang Haifeng)

Göz alıcı "Robot Kolu Gaiwan Çayını tersine çevirdi", inatçı "Çince ve İngilizce Özgür Konuşma" ve akıllı ses çipi "Baidu Honghu" ... bunların hepsi izleyiciler üzerinde derin bir etki bıraktı ve AI teknolojisi ile insanlar arasındaki mesafeyi kısalttı. Bunun arkasında hangi en iyi teknolojiler gizlidir? Baidu Brain 5.0 neden yazılım ve donanımı entegre eden bir AI seri üretim platformu olarak adlandırılıyor? Öğleden sonra "teknik hayranlarla" dolu Baidu Beyin Forumu tek tek duyuruldu.

Konuşma, vizyon, dil ve bilgi için yapay zeka algoritması yeniliği hızlanıyor

Baidu Brain 5.0'ın yoğun bir şekilde yükseltilmesinden sonra, temel katmanın derin öğrenme teknolojisinden genel AI yeteneklerine, uygulama teknolojisi çözümlerine, özelleştirilmiş modellere ve son dağıtım ve entegrasyona kadar yapay zeka endüstrileştirme uygulamasının tüm sürecini açtı. AI teknolojisinin standardizasyonunu, otomasyonunu ve modülerleştirmesini gerçekleştirin.

Baidu'nun endüstrinin yeniliğine öncülük eden beyin konuşma teknolojisi, konuşma tanıma, konuşma sentezi ve uzak alan ses etkileşimi çiplerindeki başarılarını göstermiştir. Baidu'nun konuşma teknolojisi departmanının kıdemli yöneticisi Gao Liang, tanınma açısından Baidu'nun çok aşamalı kesilmiş dikkat modeli SMLTA'yı önerdiğini açıkladı.Bu, tüm cümlenin ötesinde kısmi dikkat modellemesi gerçekleştiren ilk uluslararası dikkat modelidir ve aynı zamanda ilk uluslararası farkındalıktır. Çevrimiçi konuşma, dikkat modelini büyük ölçekte kullanır. SMLTA, tanıma hızını büyük ölçüde iyileştirirken, aynı zamanda tanıma doğruluğunu da geliştirir. Giriş yönteminde etkili ürünlerin bağıl doğruluk oranı% 15, hoparlörlerdeki etkili ürünlerin bağıl doğruluk oranı% 20 artırılmıştır. Sentez açısından, bu aşamada stil aktarımı, tını simülasyonu ve duygusal kişileştirmenin üç büyük zorluğuna yanıt olarak, Baidu, tını, stil, duygu ve diğer konuşma öğelerini farklı alt alanlara eşleyebilen konuşma sentezi teknolojisi Meitron'u başlattı. Farklı öğeler isteğe bağlı olarak birleştirilebilir ve sentezlenmiş konuşma tarzı esnek bir şekilde kontrol edilebilir. Aynı zamanda dil sentezinin eşiği düşürülür ve bir kişinin özel sesi sadece 20 cümle ile üretilebilir.

(Gao Liang, Baidu Ses Teknolojisi Departmanı Kıdemli Direktörü)

İniş uygulaması uç tarafta büyük talep gösterdiğinden, Baidu Brain Voice ekibi uzak alan ses etkileşimi için Baidu Honghu çipi geliştirdi. Honghu yongasının tasarımı, geleneksel yonga tasarım yöntemini değiştirir ve "yazılım tanımlı yonga" nın yeni tasarım fikrini izler. Çip, çift çekirdekli HiFi4 mimarisi, 2.8M geniş bellek ve TSMC 40nm sürecini kullanır.Bu donanım spesifikasyonunda, yaklaşık 100 mw'lik ortalama bir çalışma gücü tüketimi, uzak alan sesli etkileşim çekirdeğinin dizi sinyal işleme ve ses uyandırma yeteneklerini destekleyebilir. Aynı zamanda, Honghu çipini araç seviyesi standartlarına uygun olarak oluşturmak, Honghu çiplerinin son derece katı gereksinimleri karşılamasını sağlayacak ve araç içi sesli etkileşim ve akıllı ev gibi senaryolara daha fazla hayal gücü getirecektir. Aynı zamanda Honghu çipi bantlanmış, seri üretim gerçekleştirilmiştir.

Baidu Vision Technology, 2019 yılında büyük uluslararası yarışmalarda on-hook modunu başlattı ve yakın zamanda sonuçlandırılan CVPR'de video anlama, yüz yaşama ve araç REID alanlarında birinciliği kazandı.Yılın ilk yarısında NTRIE2019, ICME2019, ICDAR2019'da yer aldı. , DWAN2019 ve diğer yarışmalar defalarca şampiyonluğu kazandı. Baidu'nun görsel teknoloji departmanı ve artırılmış gerçeklik teknolojisi departmanı yöneticisi Wu Zhongqin'e göre, 5G çağında giderek daha fazla fiziksel cihaz, insanların çevre ve cihazlarla etkileşim şeklini tamamen değiştirecek olan son derece güvenilir, düşük gecikmeli siber uzaya bağlanacak. Görsel anlamsal platform 2.0'ın bu yeni sürümü, görsel teknolojinin "açıkça anlaşılmasından" "etkileşimli" ye yükseltilmesini teşvik ediyor. Visual Semantic Platform 2.0, iki ana konuda çığır açmıştır: etkileşimli yükseltmeler ve yazılım ve donanım kombinasyonu.

(Wu Zhongqin, Baidu Vision Technology Departmanı ve Artırılmış Gerçeklik Teknolojisi Departmanı Direktörü)

Etkileşimli yükseltme, entegre bir insan-bilgisayar etkileşim sistemi ve geniş sahneli bir fiziksel dünya etkileşim sistemi içerir. Basitçe ifade etmek gerekirse, entegre insan-bilgisayar etkileşim sistemi, insanların, makinelerin ve sanal ortamların doğal etkileşimi ve kaynaşmasıdır.Sistem, AR özel efekt canlı yayınını, küçük videoları, özel efekt uygulamalarını ve diğer senaryoları gerçekleştirmek için uygundur ve birçok Baidu video uygulamasına uygulanmıştır. . Büyük sahneli fiziksel dünya etkileşim sistemi, geniş bir sanal bilgi yelpazesi ile fiziksel dünyanın hassas bir şekilde üst üste binmesini sağlamak için görsel konumlandırma ve AR teknolojisinin çığır açan bir kombinasyonudur ve böylece AI çağında yepyeni bir etkileşimli sistem kurar. Şu anda, yazılım ve donanım kombinasyonu, veri gizliliğini korurken, daha verimli görsel bilgi işlem ve daha düşük gecikme deneyimi ile uygulama senaryolarını tatmin edebilir. Baidu Vision'ın yazılım ve donanım kombinasyonu temel olarak model sıkıştırma platformu PaddleSlim, çok modlu FaceID geliştirme bileşeni ve yazılım ve donanımla entegre çözüm yapay zeka kamerasına odaklanıyor. FaceID, 12 milyondan fazla cihazı kapsar.

Visual Semantic Platform 2.0, birçok gelişmiş algılama teknolojisini günceller ve ayrıca robotik teknolojisinde yeni atılımlar sağlar. Baidu'nun 3D Vision'ın baş bilim adamı Yang Ruigang'a göre, bir robot bir ajandır.Algı teknolojisine ek olarak, bir ajanın çevresel algıdan aktif algıya dönüşümü gerçekleştirmek için karar verme ve eylemle ilgili teknolojiye ihtiyacı var. Şu anda, Baidu'nun akıllı gövde teknolojisi esas olarak üç yöne odaklanmıştır: otonom sürüş Apollo, inşaat makineleri ve servis robotları. Sabah, ana forumdaki dikkat çeken robot kol "Dr. Tea" sadece konuşmayı başaramadı, aynı zamanda geleneksel çay potunu uzun ağızlı, arkasındaki servis robotu çözümüne dayanarak tamamladı. Baidu'nun 3D vizyonuna dayalı olarak robot, çay fincanı konumunu algılayabilir ve takip edebilir. Robot hareket planlaması ve kontrolü sayesinde robotik kol, çalışma alanındaki çarpışmaları algılayabilir ve engellerden kaçınabilir; hareketi gerçek zamanlı olarak planladıktan sonra, çay dökme yörüngesini otomatik olarak oluşturabilir; daha sonra, su akışındaki değişiklikleri algılayabilir ve çay dökme konumunu gerçek zamanlı olarak ayarlayabilir. Konuşma-anlamsal bağlantı teknolojisinin analizi, robotun bir "insan" gibi davranmasını, anlamasını, iyi konuşmasını ve bunu doğru bir şekilde yapmasını sağlar.

(Yang Ruigang, Baidu 3D Vision'ın Baş Bilimcisi)

Dil ve bilgi teknolojisi açısından Baidu Brain ayrıca bir dizi inovasyon ve atılımı da duyurdu. Baidu'nun Yapay Zeka Teknoloji Platformu Sisteminin İcra Direktörü Wu Tianxiang, Baidu'nun sürdürülebilir öğrenme yetenekleri ve temel model yeteneklerinde sürekli iyileştirme ile bilgi ile geliştirilmiş bir anlamsal anlayış çerçevesi-ERNIE tasarladığını ve uyguladığını açıkladı. Şu anda ERNIE, 1 milyardan fazla bilgi biriktirdi, Çin NLP görevlerinin göstergelerini kapsamlı bir şekilde yeniledi ve birçok Baidu ürün uygulamasında etkisini iyileştirdi. Makine simültane tercümede son gelişmeler de var.Tercüme sürecinde konuşma tanıma sonuçlarını düzelten ortak kelime vektör kodlama teknolojisi ve çok yönlü çeviri tutarlılığı ve tutarlılığı sorununu çözebilen metin çeviri modeli, gelişmiş konuşma teknolojisi ile birlikte, Baidu Brain, yüksek doğruluklu, düşük gecikmeli makine eşzamanlı çeviri teknolojisini gerçekleştirdi.

(Wu Tian, Baidu AI Teknoloji Platformu Sisteminin İcra Direktörü)

Bilgi, AI'nın gerçek dünyayı daha derinlemesine anlamasına yardımcı olabilir. Ana forumda Wang Haifeng, Baidu'nun bilgi grafiği teknolojisi ile entegre edilmiş video anlambilimsel anlayış yeteneğini canlı bir şekilde göstermek için yakın zamanda popüler olan müzik belgeseli "Dahe Sing" i kullandı. Bu teknoloji, birden çok heterojen bilgi grafiği üzerinde ilişkilendirmeler kurmak için videoların çok modlu bilgi analizini kullanır ve hesaplamalı çıkarım yoluyla videolara ilişkin derin bir anlamsal anlayış oluşturur.

Ayrıca Wu Tian, endüstri bilgi grafiği platformunu ve akıllı oluşturma platformu 2.0'ı resmi olarak yayınladı. Endüstri bilgi grafiği platformu, çeşitli endüstrilerin zekayı teşvik etmeye yardımcı olacak bilgi grafikleri oluşturma ve uygulama ihtiyaçlarını karşılamak üzere tasarlanmıştır.Sektör bilgi grafiği platformu, önde gelen bilgi grafiği temel teknolojisine dayanır ve akıllı ve verimli bilgi üretim süreçleri, düşük maliyetli başlangıç ve sektörler arası geçiş sağlar Sektör geliştiricilerinin endüstri bilgi haritalarını özelleştirmesine ve uygulamasına yardımcı olma yeteneği. Yeni akıllı oluşturma platformu, gerçek zamanlı etkin nokta takibini ve ilişkili zengin malzemeleri entegre ediyor.Geleneksel içerik oluşturmanın karşılaştığı sorunları kolayca çözebilen ve tüm süreçte yaratıcılara yardımcı olan kapsamlı oluşturma yardımı yeteneklerine zaten sahiptir. Wu Tian ayrıca Ekim ayında bir davet testi yapılacağını da öngördü Çok modlu otomatik oluşturma işlevi. Şu anda Baidu, yalnızca temel bir teknoloji zenginliğine sahip olmakla kalmayıp aynı zamanda akıllı bir oluşturma platformu, bir UNIT platformu ve bir bilgi haritası oluşturma ve uygulama platformu içeren açık bir çeviri platformu dahil olmak üzere dört uygulama düzeyinde uygulama oluşturan Baidu beyni, dili ve bilgi teknolojisi için açık bir platform oluşturmuştur. Platform, Baidu'nun farklı alanlar için lider dilini ve bilgi teknolojisini sağlıyor.

Temel gücü birleştirin, yapay zeka hesaplamaya odaklanın, veri değerine dokunun

Baidu Brain 5.0, yalnızca algoritma düzeyinde yenilik içermekle kalmaz, aynı zamanda bilgi işlem gücünde büyük atılımlar gerçekleştirir. Son yıllarda, algoritmalar için bilgi işlem gücü talebi yaklaşık 300.000 kat artarken, yongaların hesaplama performansı yalnızca 30 kat arttı, ikisi arasında büyük bir boşluk var.

Baidu Başkan Yardımcısı Hou Zhenyu, Baidu'nun yeni nesil AI bilgi işlem mimarisini izleyicilerle paylaştı. Yapay zeka hesaplamasının zorluğuyla yüzleşirken, uçtan uca yapay zeka hesaplama yetenekleri sağlayabilmek gerekir.Bu, bilgi işlem sistemlerinin eski büyük veri işleme yetenekleri ve yüksek zirve GÇ arayışından GÇ yoğunluğunu karşılamaya dönüşmesini gerektirir. Yapay zeka muhakeme işlevleri için hesaplama yoğun, iletişim yoğun gereksinimler ve büyük iş hacmi ve düşük gecikme gereksinimleri.

(Hou Zhenyu, Baidu Başkan Yardımcısı)

Hou Zhenyu, yaklaşan AI + 5G çağında bilgi işlemin her yerde olacağına inanıyor. Gerçek bilgi işlem, cihazda (Cihaz), uçta (Edge) ve bulutta (Bulut) gerçekleşecek, bu nedenle DEC senaryosu incelenmesi gereken bir sonraki konu olacak; aynı zamanda yongalar, sistemler ve cihazlar arasında da yer alacak. Aralarındaki bağlantı, farklı senaryolardaki hesaplamaların birbirine bağlanmasına ve daha fazla hesaplama gücü üretmesine yardımcı olacaktır.

İşletim sisteminin alt katmandaki yongalar ile üst katmandaki uygulamalar arasında devralması gerekir. Wang Haifeng, derin öğrenme çerçevesinin akıllı çağın işletim sistemi olduğuna inanıyor. Baidu tarafından geliştirilen tek tam işlevsel derin öğrenme platformu "Flying Paddle", Çin'in kendi "AI işletim sistemi" dir. Ana forumda, Baidu Feida'nın Huawei'nin Kirin yongasıyla derinlemesine bağlantılı olacağı resmi olarak duyuruldu.Dünyanın önde gelen uç-taraf yapay zeka yongası ve derin öğrenme platformu ortaklaşa en güçlü bilgi işlem gücü ile uç-yan yapay zekayı sağlayacak ve en iyi derin öğrenme işlem verimliliğini yaratacak.

Birçok geliştirici uçan kürekleri çok iyi biliyor. Baidu'nun derin öğrenme teknoloji platformu bölümünün yöneticisi Ma Yanjun, uçan küreğin beş temel avantajını ayrıntılı olarak tanıttı. Temel çerçeve düzeyinde, uçan kanat, esneklik ve verimliliği hesaba katarak hem dinamik hem de statik görüntüleri destekler; uçan kanat, endüstriyel düzeyde uygulama efektleri sağlayan 70'den fazla resmi model sağlar; uçan kanat, büyük ölçekli dağıtılmış eğitimi ve Uçtan uca dağıtım; Çinli geliştiriciler için Feida, çok kapsamlı Çince desteği ile sistematik derin öğrenme teknik hizmetleri sunmaktadır. Ma Yanjun ayrıca teknik alandaki "Oscar" ın 15 yıl boyunca klasik "2019 Baidu Star" etkinliğini başarıyla düzenlediğini söyledi. Kayıt bugün başlayacak. Baidu Star'ın programlama yarışması, uçan kürek temel çerçevesinin geliştirilmesi görevi olan Baidu Star Development Maç, uçan küreklere dayalı bir hedef tespit görevidir.

(Ma Yanjun, Baidu Derin Öğrenme Teknolojisi Platformu Departmanı Direktörü)

Baidu, modelleme maliyetini düşürmek, modellemenin verimliliğini artırmak, büyük verilere olan bağımlılığı azaltmak ve manuel müdahaleyi azaltmak için AutoDL otomatik modelleme teknolojisini geliştirdi. Forumda, Baidu Büyük Veri Laboratuvarı direktörü Huan Jun, tasarım, geçiş ve uyarlamadan tamamen yükseltilen AutoDL 3.0'ı resmen yayınladı ve Flying Oar aracılığıyla resmi olarak açık kaynaklı bir dizi gerçek vakayı paylaştı.

(Huan Jun, Baidu Büyük Veri Laboratuvarı Direktörü)

Endüstri uygulamasından türetilen bir derin öğrenme platformu olan uçan kürek, aynı zamanda endüstriyi de geri besliyor. Baidu Maps Division'ın genel müdürü Li Ying, örnek olarak ulaşım alanını ele aldı ve Baidu Maps'in, uçan küreklere dayalı ETA geliştirme ve hata ayıklamanın rahatlığını ve eğitim verimliliğini artırdığını ve günlük düzeyde on milyarlarca veri eğitimini tamamladığını tanıttı; ETA dağıtımını iyileştirdi Ve gün düzeyinde on milyarlarca çağrıyı destekleyen tahmini performans. ETA, harita rota planlamasının ana özelliği ve kullanıcıların seyahat kararları vermesi için ana referans faktörüdür. Kullanıcılar için, Flying Oar tarafından desteklenen Baidu Map ETA, akıllı seyahat süresi tahminini gerçekleştirebilir, yol koşullarını önceden tahmin edebilir, sıkışıklık dönemlerinden kaçınabilir, sıkışıklık süresini anlayabilir, sıkışık rotalardan kaçınabilir ve seyahat süresini makul şekilde planlayabilir.

(Li Ying, Baidu Harita Bölümü genel müdürü)

Veri, AI çağında temel üretim aracıdır.Büyük veri endüstrisinin mevcut gelişimi iki ana sorunla karşı karşıyadır: veri varlıklarının güvenliği ve veri değeri keşfinin yüksek maliyeti. Baidu'nun büyük veri departmanının kıdemli yöneticisi Guo Xie, Baidu'nun ilk yerel büyük veri iPaaS platformu olan Dianshi büyük veri teknolojisi açık platformunun, büyük veri endüstrisinin gelişiminde güvenlik ve verimlilikle ilgili iki ana konuya odaklandığını duyurdu. Dianshi aynı zamanda, geliştiricilerin büyük verinin değerini güvenli ve verimli bir şekilde keşfetmelerine yardımcı olabilecek güvenli bir veri füzyon işleme ortamı, çok seviyeli açık özelleştirilebilir bileşenler ve işlevsel olarak entegre bir büyük veri geliştirme platformu dahil olmak üzere üç temel özelliğe sahiptir. . Baidu, Dianshi aracılığıyla büyük verilerin ekolojik gelişimini hızlandırmayı ve geliştiricilerin verilerin değerini derinlemesine keşfetmelerine ve bir servet kazanmalarına yardımcı olmayı umuyor.

(Guo Xie, Baidu Büyük Veri Departmanı Kıdemli Direktörü)

AI algoritmalarının, bilgi işlem mimarisinin ve uygulama senaryolarının ve yenilikçi Baidu Brain 5.0'ın birleşimi, yazılım ve donanımı entegre eden bir AI seri üretim platformu haline geldi. Baidu Beyin Forumu'nda öğleden sonra yapılan yaklaşık üç saatlik paylaşım, Baidu'nun beyin teknolojisinin "buzdağının görünen kısmı". En iyi teknolojiye ek olarak, Baidu Brain yetkilendirmeye devam edecek. Şu anda 210'dan fazla lider AI teknolojisi özelliği açıldı. Platform çağrılarının sayısı bir önceki yıla göre% 108 arttı. Özelleştirilmiş platform modellerinin sayısı hızla artıyor. Platformda geliştirme Katılımcı sayısı 1,3 milyona ulaştı. Wang Haifeng, "İnsanlara balık tutmayı öğretmek, insanlara balık tutmayı öğretmek kadar iyi değil" dedi. Baidu, birinci sınıf AI teknolojisini geliştiriyor ve aynı zamanda birinci sınıf AI teknolojisini açmaya kararlı. Baidu Brain 5.0, endüstriyel zekayı hızlandırmak için hayatın her alanından endüstri geliştiricilerine yardımcı olur.

Bugünün Temel Sesi | Suning bir şeyler yapmak için bu durumdan yararlanıyor mu? Çalışanın "Hongyan Su Alır" İlanı Tartışmaya Neden Oluyor
önceki
Stoudemire, kendisini taciz eden netizeni buluşmaya ve sohbet etmeye davet etti, ancak ikincisi reddetti
Sonraki
Boyutlu duvarı kırın! Tanrı'nın Sıradan Diferansiyel Denklemlerinin Yapısızlaştırılması
"Yarının Oğlu" Kristal Çağı Meng Meiqi canlı "Destek" Li Ronghao'nun kadın versiyonu "öğretiyor" Zhang Yuqi'nin çarpıcı ilk çıkışı
Xinsheng Bugün | Teknoloji şirketleri ona karşı mı? Trump: Twitter benden uzak değil
Bu bilgi güvenliği teknolojisi zaten bilgisayar korsanlarının kalbinde
190623 Cildi kazanan Yang Yang'ın bir adı olmalı, kim cilde ve sırrına hayran kalamaz ki?
Core Voice Today | Japon medyası, Huawei'nin en son cep telefonunu parçalara ayırdı ve ...
Yetkili anket: geliştiriciler için gerekli olan en verimli ve popüler on yüksek seviyeli programlama dili
İki örnek size şunu söylüyor: "Doğrusal" regresyon modeli nedir?
190623 Li Zhongshuo kişisel olarak planladı! "Druner Hotel" mürettebatına bir atıştırmalık araba teslim etti
Dünya Emoji Günü'nü kutlayan Apple, 59 yeni Emoji ifadesini piyasaya sürecek
Nanjing Üniversitesi'nden Shenyi Zhao: SCOPE algoritması ve dışbükey olmayan model
Python'un makine öğrenimi için "en iyi dil" olduğuna dair büyük kanıt
To Top