Özel Wang Haifeng, ilk olarak Baidu AI stratejik düzeni hakkında konuşuyor (PPT indirme ile)

son günlerde, 2017 Uluslararası Büyük Veri Endüstrisi Teknolojileri İnovasyon Zirvesi Forumu Tsinghua Üniversitesi'nde başarıyla yapıldı. Forum, büyük veri alanında sınır ötesi işbirliği ve uluslararası alışverişler yoluyla büyük veri alanında teknolojik bir inovasyon platformu kurmak ve geliştirmek ve yenilikçi kaynakları toplamak ve entegre etmek için hükümet, akademi ve endüstriden büyük veriyle ilgili konukları bir araya getirmeye davet etti. "Üretim, çalışma, araştırma ve uygulama" kombinasyonunu güçlendirin ve büyük veri sistemi yazılımının geliştirme durumunu ve gelecekteki yönlerini birlikte tartışın.

Bu makale Baidu'nun başkan yardımcısı, Baidu AI teknoloji platformu sistemi başkanı ve Baidu Araştırma Enstitüsü dekanı ve Hesaplamalı Dilbilim Derneği'nin (Hesaplamalı Dilbilim Derneği) eski başkanı tarafından alınmıştır. Wang Haifeng Bay'ın bu zirve forumundaki açılış konuşması "Baidu Yapay Zekası" , Konuşmanın özü THU tarafından şu şekilde derlendi:

Arka plan "0911" anahtar kelimesine yanıt verdi ve Wang Haifeng'in konuşmasının PPT'sini indirdi.

Yapay zeka, dördüncü sanayi devrimidir

18. yüzyıldan bu yana, teknolojinin gelişmesi ve talebin çekiciliği ile insanlık, yavaş yavaş teknolojik devrime veya sanayi devrimine girmeye başladı. Tarihte kabaca birinci mekanize devrim, ikinci elektrifikasyon devrimi ve üçüncü bilgi devrimi olarak özetlenebilecek üç sanayi devrimi olmuştur.Dördüncü sanayi devrimi yapay zekaya (Yapay Zeka) dayanmaktadır. , İngilizce kısaltması AI'dır) işaretlidir.

Yapay zeka tarihine dönüp baktığımızda, resmi başlangıç noktası, AI kavramının doğduğu 1956'daki Dartmouth Konferansı idi. 1956'dan önce, makine çevirisi, doğal dil işleme, bilgisayar satrancı, sinir ağları ve benzeri gibi hala çok popüler olan bazı AI yönergeleri vardı. Yapay zekanın doğuşundan bu yana geçen 60 yıl içinde, yapay zekanın gelişimindeki iniş çıkışlar aşağıdaki şekilde görülebilir.

Son 10 yılda derin öğrenmenin ortaya çıkmasıyla birlikte, daha da önemlisi, veri destekli algoritmalar ve bilgi işlem yeteneklerindeki "veri patlaması" ve atılımlar, özellikle ses ve görüntü alanlarında, yapay zeka bir kez daha gelişme için yeni fırsatlar başlattı. . Ve bu canlanma, tüm toplumda köklü değişimler meydana getirmek üzere Bu bizim öngörülebilir geleceğimiz. Bu yapay zeka patlaması büyük ölçüde internetten başladı ve internet, arama, sosyal ağ, alışveriş vb. Birçok ihtiyacı beraberinde getirdi. Bu talepler gittikçe daha fazla çevrimiçi hale geliyor ve aynı zamanda çevrimiçi verileri yönlendiriyor.

Veriler gerçekten çevrimiçi olduktan sonra, bu verileri işlemek için daha fazla algoritmayı da yönlendirir ve çevrimiçi talep ve veriler aynı zamanda tüm ekolojinin faaliyetini de yönlendirir, bu da daha güçlü bilgi işlemlere dayanarak daha fazla veriyi açık hale getirir. Bilgi işlem yeteneklerinde atılımlar elde etmek için daha iyi AI algoritmalarıyla birleştirilmiş platform. Örneğin, yaygın olarak kullanılan GPU'lar artık çok güçlü avantajlara sahip olmak için derin öğrenme ve derin sinir ağı algoritmalarını kullanıyor. Yapay zekanın canlanması için büyük veri, algoritmalar ve büyük hesaplamalar gerekli koşullar haline geldi.

Baidu yapay zekası yelken açtı

Baidu, doğal dil işlemeye dayalı kelime segmentasyonu ve kelime öbeği analizi gibi aramaya başladığından beri on yıldan fazla bir süredir yapay zeka araştırıyor ve geliştiriyor. Yapay zekanın genel düzeni, NLP, ses, makine öğrenimi, görüntüler vb. İle kademeli olarak başlayarak yaklaşık yedi veya sekiz yıl önceydi. Bugün itibariyle Baidu, temel katman, algılama katmanı, bilişsel katman, platform katmanı, ekolojik katman ve uygulama katmanı olmak üzere toplam altı katmanı içeren nispeten eksiksiz bir yapay zeka teknolojisi düzeni oluşturdu.

Veriler, algoritmalar ve bilgi işlem platformları temeldir. Algılama katmanı insan görmesi ve işitmesine karşılık gelir ve bu yetenekler doğrudan dış dünyayı algılamaktır. Bilişsel katman, insan dili yeteneği, insan özeti, anlama, iyileştirme ve bilginin uygulanması ve ayrıca insan anlayışı gibi insanları diğer canlılardan ayıran şeylere karşılık gelir. Yapay zekanın açık platformu yalnızca Baidu'nun dahili uygulamalarını değil, tüm ortakları da destekler.Şu anda 60'tan fazla yetenek açmıştır.Şirket içinde her gün yüz milyarlarca çağrı ve dışarıdan yüz milyonlarca çağrı var. . Baidu, bu temelde hayatın her kesiminden ortaklarla bir teknoloji platformu oluşturmayı, erdemli bir ekoloji çemberi oluşturmayı ve çeşitli yenilikçi uygulamalar geliştirmeyi umuyor.

Baidu, İnternet'ten C'ye (tüketiciler için) ürünler yapmaktan To B'yi (iş odaklı hizmetler) destekleyen çok sayıda uygulama yapmaya başladı. Bunların hepsi yapay zeka teknolojisi düzeninin gerçekleştirilmesine bağlıdır. Her katmanın teknik düzeninin temel teknolojileri aşağıda açıklanacaktır.

1. Temel katman: büyük veri, algoritmalar ve büyük hesaplamalar

Artık herkes kişisel davranış ve fizyolojik durumdaki değişiklikler gibi her gün çok fazla veri üretiyor.İzlemek ve kaydetmek istiyorsanız, çok büyük miktarda veri var. Dahası, herkes her gün İnternet ile uğraşıyor veya kendi web sitesini kuruyor veya İnternet'e veri katıyor ve hatta İnternet'i kullanırken çok fazla veri üretiyor. İnternet, bir dereceye kadar tüm nesnel dünyanın ayna görüntüsü haline geldi. Bu nedenle, bu İnternet verilerine hakim olmak, kullanmak ve iyi analiz etmek, büyük ölçüde aynı zamanda nesnel dünyanın çok önemli bir karakterizasyonu ve anlaşılmasıdır.

Genel olarak, büyük veri teknolojisi veri toplama, çıkarma ve uygulama gibi çeşitli yönlere ayrılmıştır. Kullanıcıları bir perakende mağazasının verilerinde modellerseniz, bir kullanıcı beyaz yakalı bir işçi ve diğeri ev hanımı olabilir Bu tür sektör verilerinin analizi, tüccarların daha iyi pazarlama davranışları gerçekleştirmesine yardımcı olabilir. Öte yandan, Baidunun temel bilgi işlem taşıyıcısı bir veri merkezidir. Yalnızca Çin'de değil, dünyanın her yerinde 20'den fazla büyük veri merkezi vardır. Ayrıca Çin'de çok güçlü bant genişliğine sahip en büyük GPU kümeleri vardır ve Aktarım kapasitesi ve konteyner gibi modüler bir bilgi işlem merkezi.

2. Algı katmanı: ses, görüntü, video, AR / VR

Konuşma teknolojisinde tanıma, sentez ve uyanma gibi birçok atılım için birçok yön vardır. Pazar uygulamalarına olan büyük talep nedeniyle şu anda değer verdiğimiz şey budur. Örneğin, konuşma tanıma% 97'nin üzerinde bir doğruluk oranına ulaştı. Artık yapay zeka uygulamalarının, ev sahnelerinde, araba sahnelerinde vb. Derinleşmesiyle birlikte, gittikçe daha fazla konuşma tanıma bir mikrofona konuşmak değil, uzak alan konuşma tanımayı içeren belirli bir mesafedir. Bu cep telefonlarındaki mikrofonlardan farklı ... Öncelikle konumlandırma ve çözülmesi gereken bir dizi yeni teknoloji olacak. Sentezleme çok iyidir, özellikle doğal ve pürüzsüzdür ve kişiselleştirilebilir, insanların duygusal değişikliklerini de dahil etmek çok zor hale gelir.

Bu sadece konuşma ve akustik sinyal işleme ile ilgili değil, aynı zamanda dili anlamayı ve insanları anlamayı da içerir, böylece duygusal ve kişiselleştirilmiş sentez yapabiliriz. Cihaza ihtiyaç duyulduğunda uyandırma çağrısı yapılır ve bir ev sahnesinde akıllı hoparlör veya akıllı TV gibi onunla konuşmak istediğinizi bilir.Bu zamanda uyandırma teknolojisine ihtiyaç vardır. Uyanma teknolojisinin zorluğu, yanlış uyandırmaları kontrol etmek zorunda olmamızdır. Örneğin, eve akıllı bir hoparlör koyarsanız, onu aramazsanız, aniden kendi kendine zıplar veya uyurken biraz dışarıdan bir gürültü olduğunda, aniden zıplar. , Deneyim zayıf olacaktır. Bu nedenle, yanlış uyandırmaları kontrol etmek önemli ve zordur.

Görüntüler açısından yüz tanıma, bilgisayarla görmenin önemli bir yönüdür. İnsan yüzleri statik ve dinamik olarak ikiye ayrılır. Resim gibi statik, içinde bir yüz olup olmadığını veya iki fotoğraf olup olmadığını algılar ve iki yerde aynı kişinin görünüp görünmediğini karşılaştırır Bu konuda doğruluk oranı zaten çok yüksek. Dinamik görüntüleri tanımak daha karmaşıktır.Örneğin, bir videonuz varsa, önce bu yüzleri bulmanız gerekir.Uzun bir video akışında bir kişiyi bulmak gibi birçok uygulama olacaktır.

Ek olarak, görüntüleri tanımlayıp eşleştirebilir ve çok ince ayrıntılarla anlamsal açıklamalar yapabiliriz.Örneğin, bir resmin tam olarak hangi kısmının bir resimde olduğunu bulabiliriz Burada çok sayıda ince taneli görüntü tanıma yapabiliriz. OCR, görüntü tanımada nispeten özel bir yöndür. Örneğin, Tsinghua'nın ayrıca OCR yönünde çok iyi iş çıkaran öğretmenleri ve araştırma grupları vardır. Artık OCR teknolojisi sadece bir kitabı taramakla kalmaz, aynı zamanda bir formu veya fatura gibi çok karmaşık bir yapıyı da tanıyabilir.Sadece içindeki metni tanımakla kalmaz, aynı zamanda bir bölgede tanınan metni yapılandırabilir ve genel olarak birçok özelleştirme yapar. Tanıma.

Görüntülerin aksine, videonun birçok yetkili veri kümesi vardır ve video veri kümesinin kendisi yeterince olgun değildir. Birçok video, başlık ve içerik gibi manuel olarak etiketlenir, ancak yine de tam olarak manuel olarak etiketlenmemiş birçok video vardır. Şu anda, bu videoyu işaretlemek için bu videonun ne tür bir video olduğu, videonun başlığı, Video nispeten uzunsa, vurguları çıkarın.

Robot görüşü, engelleri tespit etme vb. Dahil olmak üzere konumlandırma ve harita yeniden yapılandırmasının nasıl yapılacağını içerir. Önde gelen SLAM teknolojisinin birçok algoritması vardır. Yukarıda bahsedilen görüntü ve video teknolojilerinin robot görüşünde uygulamaları olacaktır. Artırılmış gerçeklik (AR / VR) bağımsız bir yöndür, ancak görsel teknolojiyle çok ilgisi vardır.Genellikle, fotoğraf çekmek artırılmış gerçekliğin etkisini tetikleyecek ve buna bağlı olarak 3B algılama, izleme, işleme ve diğer teknolojileri içerir.

3. Bilişsel katman: doğal dil işleme, bilgi grafiği ve kullanıcı portresi

Doğal dil işlemenin kapsamı geniştir, eğer alt bölümlere ayrılırsa, dil anlama ve üretme ve bunlara karşılık gelen uygulama sistemlerine bölünebilen birçok alt alan vardır. Bir yandan insan dilini anlamalıyız, diğer yandan da ifade etmeli ve dil üretebilmeliyiz. Örneğin, temel kelime segmentasyonu ve kelime öbeği analizi için temel çözüm, sözdizimsel analiz ve anlamsal anlama veya niyet anlayışı yapmaktır. Örneğin, "Bir evcil hayvan hastanesine gitmek istiyorum, hastanenin yakınında park yerleri olmalı" araması yapın. Bu, insanın doğal bir ifadesidir.Bilgisayar bunu anlayabiliyorsa, niyeti çıkarmak, çok karmaşık sözcüklerden temel niyeti analiz etmek ve ardından karşılık gelen cevabı bulmak gerekir.

Örnek: "Jiang Ying'in kızı kimdir" ve "Jiang Ying'in kızı kimdir" için arama yapmak için geleneksel bilgi erişim ve arama algoritmalarının kullanılması aynı cevabı bulacaktır, çünkü geleneksel bilgi erişimi kelime sırasını önemsemez. Şu anda, aslında farklı cevaplar aradıklarını bilerek gerçek doğal dil analizi ve anlayışı yapmalıyız. Bunun arkasında bilgi grafiğinin desteği vardır ve yapılandırılmış resimlerin ve metinlerin sonuçlarını görebilirsiniz.

Bir makale ya da kitap okuduğumuzda, sadece içindeki her cümleyi değil, aynı zamanda bölümün anlayışı olan tüm makaleyi de anlarız. Bölümü anlamak için, tüm bölümü konu etiketleri ve çeşitli varlık etiketleri ile etiketleyebilirsiniz ve bunlar bilgisayarın makaleyi anlaması içindir. Uygulamada, farklı uygulamalar için, etiketlerin, bilgi akışlarında kullanılanlar gibi farklı formları olacaktır.Bu etiketler işaretlendikten sonra, kullanıcıların ilgi alanları eşleştirilebilir ve kullanıcının ilgisini çekebilecek bir makale tavsiye edilir.

Cümleleri, metinleri ve metinleri anlamanın yanı sıra, cümle yazan, şiir yazan veya makale yazan kişilerin hepsi duygusal eğilimlidir, bu nedenle, buna bağlı olarak, kullanıcının bir cümleyi okuması da dahil olmak üzere duygusal eğilimi de analiz ederiz. Bu yazının ardından aşağıda çok sayıda yorum olacak ve biz de bu yorumlarla ilgili görüşlerimizi alacağız.

Analiz ve anlamanın yanı sıra nesil de var. Şiir ve beyit yazmaya çalıştık.Örneğin, mobil Baidu bilgi akışında gördüğümüz makalelerin çoğu insanlar tarafından yazılıyordu ama büyük bir kısmı otomatik olarak makineler tarafından yazılıyordu. Çeşitli testler yaptık ve kullanıcılar temelde bunun insanlar tarafından mı yoksa makineler tarafından mı yazıldığını bilemiyor, bu da makinelerle yazmanın hala çok iyi olduğunu gösteriyor. İkincisi, insanların akıllı donanımla etkileşime girmesi gerekiyor Diyalog süreci, "kişinin ne dediğini" anlamayı ve insanların bir sonraki cümleyi nasıl söyleyeceğini tahmin etmeyi içerir, bu hem anlama hem de üretmeye eşdeğerdir Bu, diyalog yönetimi ve etkileşimdir. Teknoloji.

Şimdiye kadar hepsi Çince olmak üzere tek bir dilde konuştuk, ancak "Baidu Çevirmen" çok dillilik sorununu çözdü. 28 dil arasında çeviri yapıyor ve çevirinin yönü yaklaşık 700. 100 milyondan fazla çeviri talebi. Aynı zamanda sesli konuşma çevirisi ve fotoğraf çevirisi gibi uygulamaları genişletmek için ses teknolojisi ile görsel teknolojiyi birleştirir.

İnsanoğlunun binlerce yıldır aktardığı bilgi, insanlığın adım adım ilerlemesinin itici gücüdür ve bu bilginin birikimi ve mirası için çok önemli taşıyıcı bilgi haritasıdır. Bilgi haritasındaki varlıklar gibi bazı temel birimler artık vardır. Bilgi grafiğinde yüz milyonlarca varlık vardır. Her varlığın birçok özelliği vardır. Ayrıca varlıklar arasında birçok ilişki vardır. Bu ilişkiler birçok gerçek oluşturur. Örneğin, A ve B öğretmen ve öğrenci arasındaki ilişki olabilir. Bu bir gerçek, yüz milyarlarca gerçeği biriktirdik.

Bilgi sadece statik erişim değildir, aynı zamanda bilgi hesaplama ve akıl yürütmeyi de içerir. Örneğin Noel'e kaç gün kala sistem bugün hangi günün hangi günün Noel olduğunu bilir ve sistem bu dinamiğe göre hesaplama yapacaktır. Başka bir örnek olarak sivil havacılığın bazı düzenlemeleri var.Bu düzenlemelere dayanarak uçakta çakmak taşıyıp taşıyamayacağınızı sorun Sistem bu sorunun cevabının bu kurallara göre evet veya hayır olduğunu belirleyecektir. İkincisi, kullanıcıların ihtiyaçlarını kendilerinin anlamamız gerekiyor, bu nedenle kullanıcı portresi de çok önemli bir yön. Şimdi Baidu, birçok alt bölüme ayrılmış etiketle çok zengin bir kullanıcı portresi biriktirdi. Örneğin, bir kişi beş boyuttan tanımlayabilir: demografik özellikler, davranış alışkanlıkları, uzun vadeli ilgi alanları, konum ve birincil kullanıcı portresi oluşturmak için kısa vadeli niyetler. Bireysel model.

Dört, platform ve ekolojik katman

Bu katman daha çok Baidu Beynine (ai.baidu.com) odaklanmıştır ve ekosistemin tamamı iki bölümden oluşur: bulut ve terminal. Baidu Cloud, yalnızca Baidu tarafından kullanılabilen değil, aynı zamanda tüm ortaklara açık olan ve Baidu'nun beyninin çeşitli yetenekleriyle temel bir destek platformu haline gelen büyük bir bilgi işlem platformudur. Doğal dil insan-bilgisayar etkileşimine dayalı yeni nesil işletim sistemi ve akıllı sürüşle ilgili Apollo gibi bazı dikey çözümler de var. Araç üreticileri ihtiyaç duydukları yetenekleri kullanabilir ve otomotiv elektroniği üreticileri de tüm platformu ve ekosistemi birlikte oluşturmak için ihtiyaç duydukları ilgili yetenekleri kullanabilir.

Beş, uygulama katmanı

Sesli arama, aramada bazı AI yetenekleri eklendikten sonra tipik bir ürün biçimidir. Bu bir "ses tanıma + basit arama" değildir, ancak istediğimiz kelimeyi doğrudan sesle girdiğimizde, örneğin polifonik bir kelime varsa Li ve Li, hatalar olacaktır, ancak kullanıcı: "Jasmine's Li" derse, ses hatası düzeltme otomatik olarak "Li" olarak değiştirilecek ve ardından kullanıcının nihayetinde istediği yanıtı bulacaktır. Dolayısıyla bu, birçok ilgili teknolojinin desteğini gerektirir. Görsel arama aynıdır, birçok görsel arama ile ilgili deneme yaptık.

Örneğin, bir soru bulmak çok zordur.Çoğu öğrenci soruyu yapar.Soruda resimler ve formüller vardır.İçeriğe girmek zordur. Bu nedenle, fotoğraf çekmek özellikle uygun bir yol haline gelir. Burada görüntüyü yapmak için OCR teknolojisini birleştireceğiz Tanıma. Akıllı soru yanıtlama, kişiselleştirilmiş öneri vb., Yanıtları veya bilgileri kullanıcılara daha sezgisel ve daha spesifik olarak sunmak için bilgi grafikleri, NLP, kullanıcı anlayışı vb. Gibi birden fazla AI özelliğini de entegre eder. İnternet uygulamalarına ek olarak, AI yeteneklerini akıllı müşteri hizmetleri ve akıllı havaalanları gibi çeşitli sektörlerle birleştirmeye çalışıyoruz.

Yapay zeka, bu çağda teknolojik değişimin temel itici gücü haline geliyor. Yapay zekanın To B alanına girmesi, hayatın her alanına devrim niteliğinde değişiklikler getirecek ve aynı zamanda insanların günlük yaşamları üzerinde büyük bir etkiye sahip olacak. Yapay zeka yaygın olarak kullanılıyor ve gerçek etkisi hiçbir şekilde internet ile sınırlı değil ... Herhangi bir sektörün elektriksiz nasıl işleyeceğini hayal etmek zor olduğu gibi yapay zeka da yeni çağın elektriği olacak.

Yapay zekanın her yerde olacağı öngörülebilir.

"0911" anahtar kelimesini yanıtlamak ve Wang Haifeng'in konuşmasının PPT'sini indirmek için Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformu sahne arkasını takip edin.

Zayıf ve çaresiz! Bu bebek tembel hayvan doğumda annesi tarafından reddedildi
önceki
Tanıdık konuma geri dönün! Sadece onlar ilk üçten bir puan uzakta 4 Premier Lig devini kazandı
Sonraki
Xinhua Haber Ajansı, Wuhan'a odaklanan bir haber bülteni yayınladı: Kırsal tarz, aile tarzı ve halk tarzı kırsalın canlanmasını hızlandırıyor
92 dakika dünya dalgası hikâyesi! Bir yumruk atıp kutlamak için dilini dışarı çıkarır, Premier Lig devleri 1 utançtan kaçınır
SoftBank'ın uydu girişimlerine yaptığı 1 milyar dolarlık yatırım, Muskın en büyük rakibi ortaya çıkıyor
1 saat 47 dakikada 100 milyar yuan'ı kırın! Double Eleven Ulusal Kıyma Listesinde Wuhan 7. sırada! Günaydın Wuhan
İkinci kira: Site seçimi hizmetlerine ek olarak, ofis binası yönetimi de sağlar.Kiralık ofis kiralama pazarına girebilir mi?
Özel Yapay zeka ve büyük veri, dikkat süremizi değiştiriyor
Resmi duyuru: Doğal bir çift bira ve Alman düğümü!
16 Süper Lig takımı arasında sadece 2019 sezonunun ilk golünü atamadılar!
Uluslararası Binicilik Engel Atlama Mücadelesi Chengdu'da başladı, Pekin binicileri şampiyonluk kazandı
Özel | Shenyang: Büyük veriye dayalı medya dönüşümü nasıl sağlanır?
Sektörün önde gelen 13 uzmanı makine öğreniminin geleceğini nasıl görüyor?
Avrupa'da elektrifikasyonun statükosu: Almanya ters etki yapıyor ve Norveç küçümsenemez
To Top