g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

IBM Suzhong: Bilgi işleme verimliliğini artırmak için derin öğrenme, gelişmiş öğrenme ve diğer yöntemler nasıl kullanılır?

Bilişsel bilgi işlem çağının ortaya çıkmasıyla birlikte, bilgisayarlarımızın bilgi işleme yeteneklerini insanların bilişsel yetenekleriyle nasıl birleştireceğimiz ve böylece bilgi işleme verimliliğimizi nasıl artıracağımız şu anda düşündüğümüz bir sorudur. Bu periyot Tsinghua Big Data "Technology · Frontier" Ders Serisi Büyük veri ve bilgi işlem araştırmaları baş veri bilimcisi IBM Araştırma Enstitüsü'nün araştırma direktörünü davet ettik Suzhong Sana unvanı getirmek için "Deep Blue'dan AlphaGo'ya, Büyük Veriden Bilişsel İşletmeye" Paylaş.

Arka planda "Suzhong" anahtar kelimesini yanıtlayın ve konuşma PPT'sini indirin.

Aşağıda, dersin Datapie tarafından düzenlenen özel bir video kaydı (videoyu izlemek için lütfen WeChat genel hesabını takip edin), metin sürümü içeriği eklenmiş olarak:

Kuru malların metin versiyonu şu şekilde düzenlenmiştir:

Su Zhong, IBM Araştırma Enstitüsü Araştırma Direktörü

Suzhong: Amerika Birleşik Devletleri'ndeki Dartmouth, 61 yıl önce yapay zeka terimini önermişti ve yapay zekanın tarihi uzun bir zaman öncesine kadar izlenebilir.Çinliler abaküsü icat ettiğinde bile, bilgisayar makinelerini zekaya dönüştürmeyi düşünüyorlardı. Bu evrimsel süreç, insanın nesnel yasaları anlama sürecine benzer. Sembolik akıl yürütme yoluyla, insanlar erken akıllı davranışı somutlaştırır ve dünyanın kurallarını tanır. Kıyaslamayı örnek alırsak, dünyayı anladığımızda, önce büyük bir önermeyi veya daha büyük bir aksiyomu belirleriz ve her şey için özel bir durum vardır ve bu aksiyomdan ve özel durumdan bir sonuç çıkarılabilir. Pek çok yapay zekanın evriminde, bu alanda teoremin kanıtı gibi büyük ilerleme kaydedildi.

Bu teknoloji, uzman sistemleri örnek alarak sektörde de uygulanmaktadır. Tıp endüstrisinde, ister daha fazla hastayı teşhis etsin, ister daha zorlu hastalıklarla karşılaşsın, iyi bir doktorun özelliklerini dikkate almalıyız? Genel olarak, bir hastalık ve iyi bir doktor birkaç kategoride özetlenebilir. Veri analizi yaptığımızda, genellikle büyük bir problemi küçük bir problem alanına böleriz ve sonra onu küçük problem alanında çözeriz.

Uzman sistemi de aynı bakış açısını benimser. Örneğin, tıp uzmanları bir hastalık tipindeki hastaları sınıflandırır, sınıflandırmayı karşılayan hastaların özellikleri nelerdir ve teşhisi doğrulamak için hangi inceleme yöntemleri kullanılır. Bu tür hastalar için genellikle birkaç tedavi yöntemi vardır, bunların her biri Tedavi yöntemleri, kendi avantaj ve dezavantajlarına karşılık gelir ve hangi durumlarda tedaviyi dikkate almak gerekir. Genel olarak konuşursak, iyi bir doktor bir hastalık türünü çözerken düzinelerce kural biriktirebilir. Daha sonra sektördeki birkaç doktor veya düzinelerce uzman, "Klinik Tıp Yönergeleri" gibi eksiksiz bir bilgi sistemi oluşturabilir. ". "Klinik Tıp Yönergeleri" nin tüm sürecine göre hastanın ne tür bir muayene yapması gerektiğini, muayene ile hangi sonuçlara varılabileceğini, sonuca varıldıktan sonra hangi tedavi yöntemlerinin mevcut olduğunu ve hastalığın tüm seyri boyunca ne tür tedavilerin yapılması gerektiğini kolayca belirleyebiliyoruz Gözlemlendi.

Böyle bir uzman sistem çok etkilidir ve tıp sektöründe çok iyi uygulamaları vardır. Ancak uzman sistem aynı zamanda büyük bir zorlukla da karşı karşıyadır, yani sağlamlaştırılmış bilgi sistemi gerçek karmaşık problemlerle baş edemez. Veri evrenselliğine dayalı bu zorluk, yapay zeka gelişimini bir darboğaz dönemine getirdi.

Yapay zekanın hızla gelişmesi büyük verinin patlamasından faydalandı.Bu patlamada makine öğrenimi veriden otomatik olarak kuralları ve kuralları bulabilir ve veriler değiştikçe kurallar da otomatik olarak değişecektir. Sonuç olarak, yapay zeka arama, öneri, ses tanıma vb. Dahil olmak üzere İnternet'e hızla uygulandı.

Satranç, bilgisayarın akıllı olup olmadığını doğrulamanın daha kolay bir yoludur, çünkü sadece insanlar satranç oynayabilir ve satrançta oyunun yargısı gibi birçok muhakeme süreci vardır. Bilgisayar öğrenme deneyimi arttıkça, zeka seviyesi de geliştirilebilir. Satrancın kendisi anlaşılması nispeten kolay bir sorundur çünkü satrancın kuralları açıktır.Satranç, Çin satrancı, dama veya Go olsun, kurallar çok açıktır.Açık bir kural sistemi altında, kazanmak veya kaybetmek yargılamak kolaydır.

Her iki tarafın satranç gücü, açık değerlendirme fonksiyonları, kural sistemleri ve verilerle birlikte satranç tahtasında gösterilebildiğinden, kolayca bir yapay zeka sistemi kurabiliriz. Örnek olarak IBMin Deep Blue sistemini ele alalım. Bir satranç yüzü sayısal bir değere dönüştürüldüğünde, makinenin arama algoritmasını yapmasına izin verebiliriz ve her satranç parçasının farklı yönlerde seçilme olasılığı vardır, böylece arama asal ağacı algoritmasını oluştururuz. Daha sonra - budama yöntemiyle hızlı bir şekilde sonuçlara varabilir. O zamanlar Deep Blue, satranç için bu şekilde iyi değerlendirme fonksiyonları yaptı.Bu değerlendirme fonksiyonlarının çoğu satranç ustalarından geldiğinden ve bilgisayar algoritması araştırması çok derin olduğundan, bilgisayarın Kasparov gibi ustaları yenmesine izin verebiliriz. .

Go problemini çözmek için bu satranç yöntemini kullanırken büyük zorluklar vardır: Birincisi, Go kurulu 19 çarpı 19'dur ve 361 uzamsal olasılık vardır ve arama alanı 2.08X10107'dir. Sonra, elementi arayın. Ağaç oldukça karmaşık olacak; ikincisi, her bir Go parçasının aynı olması ve durumunun tahtadaki parça sayısına göre değerlendirilemeyeceği; üçüncüsü, Go oyununda kötü bir hamle olacağı ve oyunun tamamının, yani Go'nun değerlendirme işlevinin kaybedileceği. Değer sürekli değildir ve belirli bir noktada bir parçacığın değişmesi tüm satranç yüzeyinin değerlendirilmesini zorlaştırabilir. Monte Carlo arama ağacı, bu sorunları çözmek için fikirler sunar: Tahtanın mevcut durumunu yargılamanın bir yolu olmamasına rağmen, sistemin rastgele satranç oynamasına izin verebilir ve kazanma oranını değerlendirme standart tahtası olarak kullanabiliriz. Rastgele sayılar, bir satranç taşının nasıl değerlendirileceği sorununu çözmek için bir anlamda değerlendirme değerini tanımlayabilir.

Bilgisayar yeterli derinliği hesapladığında, bu yöntem daha iyi sonuçlara sahip olacaktır. Ama hız alanı hala çok büyük, onu azaltmanın bir yolu var mı? Satranç oyunlarını derin öğrenme ağları aracılığıyla değerlendirmenin iyi bir yoludur. Değerlendirmeyi bir derin öğrenme görevine dönüştürmek için derin öğrenme algoritmalarını kullanabiliriz, mevcut oyunu girdi olarak kullanarak ve değeri belirli bir noktada çıkarabiliriz, bu da tahmin doğruluğunu artırabilir.

Peki, Monte Carlo arama ağacı ve CNN kombinasyonu ne tür bir kimyasal etki yaratabilir? Sinir ağı, oyundaki bir sonraki hamlede profesyonel bir oyuncunun konumunu tahmin edebiliyorsa, arama alanını küçültebiliriz.

AlphaGo bu konuyu en uç noktaya taşıdı.Sadece satrancın arama genişliğini daraltmakla kalmadı, aynı zamanda mevcut satranç oyununun siyah beyaz taraflarının kazanma olasılığını değerlendirmek için stratejik bir ağ kurdular.Ama asıl zorluk bu verilerin oyunun verilerinden daha fazlası olması. Daha azı, oyunun her adımı eğitim verisi olarak kullanılabilir, ancak bir sette yalnızca bir galibiyet veya kayıp vardır ve eğitim verileri biraz seyrektir. Bu yüzden, bu çalışmada gelişmiş bir öğrenme yöntemi, yani iyi bir dövüş etkinliği olan bir sistem veya bir oyun üretmek için birbirine karşı iki sistem kullandılar ve ardından kazanmanın veya kaybetmenin nihai sonucunu makine öğreniminin bir örneği olarak kullandılar. Sonuç, bu sistemin Li Shishi'yi mağlup etmesi oldu ki bu çok dikkate değerdi.

AlphaGo sıfır bir başka çok önemli atılımdır: Birincisi AlphaGo sıfırın tamamen sıfırdan olması, diğeri ise AlphaGo sıfırın herhangi bir şekilde değerlendirilmemesi, sadece oyunun kendi tahta bilgilerinin değerlendirilmesidir. Girdisi yalnızca Go'nun kurallarıdır ve daha sonra makine modeli onaylamak için kendisiyle satranç oynar. Derin öğrenmede, orijinal 13 katmanlı ağı 40 katmana dönüştürür ve tüm insan bilgilerini atarken orijinal CNN ağını daha karmaşık hale getirir. Fakat bu süreçte eğitimi çok hızlıydı.Üçüncü gün Li Shishi ile düelloyu kazanmayı başaran sistem, 21 gün sonra Ke Jie'yi yenen sistemi yendi. Bir anlamda, kurallar net olduğunda, durum alanı sınırlı, değerlendirilmesi kolay ve tüm bilgiler şeffaf olduğunda, satranç gibi, gelişmiş öğrenme yöntemi çözülebilir ve çözümü insanlardan daha iyi olabilir. .

Bu yöntem başka sorunları çözebilir mi? Gerçekte birçok sorun çözülemeyebilir. Pekiştirmeli öğrenme, büyük miktarda verinin bir simülasyonudur ve parametreler simülasyonun sonuçlarıyla ayarlanır. Tıbbi bir örnek vermek gerekirse, bir hastayı simüle edebilir miyiz? Ona ne olacağını görmek için ona farklı ilaçlar verin? Zor. Ayrıca verilerin kaynak bilgileri tekil değildir ve hastayı genler, diyet, yaşam alışkanlıkları, aile, hava durumu gibi çeşitli faktörler etkileyecektir. Bu faktörler basit bir ortamda hesaplanamaz. Parametrelerin eğitilmesi için daha fazla veriye ihtiyaç vardır.

Çoklu model toplama yöntemi sektöre sokulabilir mi? Örneğin, su borusu optimizasyon problemlerinin tahmini gibi. Tarihte, boru hattında pasın nerede meydana gelebileceğini ve görmek için nerede açmamız gerektiğini tahmin etmek için bazı matematiksel modeller vardır, ancak birkaç model kullanarak ve optimize etmek için farklı parametreler kullanarak, iyi sonuçlar elde edilebilir ve pek çok Ekonomik faydalar.

Başka bir örnek olarak, e-ticaret platformunda e-ticaretin ekonomik faydaları nasıl geliştirilebilir? E-ticaret sitelerinde alışveriş, arama, karşılaştırma, alışveriş sepeti ekleme ve incelemeleri okumayı gerektirir.Bu adımlar bir karar zinciridir.Her zincir arasında bir dönüşüm oranı vardır.E-ticaret satışlarını nasıl artırabiliriz? En iyi öneri algoritması nedir? Bu alanda işbirliğine dayalı filtreleme algoritmalarının kullanılması en etkili olanıdır.

İşbirliğine dayalı filtreleme yöntemlerinden biri matris ayrıştırmadır.Kullanıcıları bir kategori ve ürünleri bir kategori olarak görebiliriz Örneğin, 600 milyon kullanıcı ve 100 milyon ürün var, bu da 600 milyon çarpı 100 milyonluk bir matris. Bu matrisi M'ye K matrisine ayrıştırabiliriz.Elbette, iki matris tamamen tutarlı olmayacak ve sıkıştırma gibi bazı kayıplar olabilir. Ancak matris ayrıştırma, hesaplama miktarını azaltabilir ve ayrıca kullanıcılar ve kullanıcılar arasındaki benzerliğe ve ürünler ile ürünler arasındaki benzerliğe dayalı akıllı önerilerde bulunabilir. Yani, burada bir multi-K kullanılır ve en iyi etkiyi elde etmek için optimizasyon için birçok K seviyesi kullanılır.

Yeni dönemde, daha fazla veri boyutu nedeniyle birçok yeni sorunu çözebiliriz. Örneğin cilt kanseri teşhisinde her doktorun görebileceği vakalar sınırlıdır.İyi bir doktor günde 5 vakaya bakabilir ve zaten çok etkileyicidir. Ancak makine yüzbinlerce vakayı öğrenebilir ve sonra bir karar verebilir.Bu senaryo, cep telefonunuzun fotoğrafını çekip sisteme göndermektir.Sistem cilt kanseri veya melanom olasılığını belirlemek için bir risk değerlendirmesi yapar.

Bugünün konusuna geri dönersek, satranç oynamaktan bilgisayar gücünün artırılması ve yeni algoritmaların somutlaştırılması dahil olmak üzere daha fazla veri kullanma yeteneği de dahil olmak üzere bazı bilgisayar büyümesi gördük. Karşılaşılan sorunlar çözülebilirse, bu yetenekler gerçek hayattaki endüstrilere uygulanabilir. Ancak gerçek problemler genellikle satranç oynamak gibi problemlerimizden çok daha karmaşıktır, bu yüzden bu algoritma için gidecek daha uzun bir yolumuz var.

Birçoğumuz robotların insan işlerinin yerini alacağından endişeleniyoruz, ancak aslında robotlar yürürken çeşitli şekillerde düşüyor. Aslında, bunlar dünyanın en iyi rekabet eden robotlarıdır. Üç yıl önce bir yarışma vardı. Sahne, plan olarak Fukushima Nükleer Santrali'nin radyasyon sahnesine dayanıyordu. Robot bir araba sürebilir, merdivenlerden bir yere çıkabilir, girdikten sonra valfi bulabilir ve belirlenen valfi kapatabilirdi. Elektrikli matkaplar vb. Kullanımı dahil olmak üzere karmaşık olmayan bazı ekipmanları kullanabilir. Yılın şampiyonu Güney Kore'de bir üniversiteydi. Yaptıkları sistem görece kolaydı. Saat dörtte iniş, diz çökmeye eşdeğer. Ön dizde pist gibi bir şey var, bu yüzden yürürken tank gibi yürüyor. Düşmek kolay değil. Bir anlamda, bir sorunu çözmek için en uygun yöntemi kullanarak bir klasiği de doğrulamıştır, belki de olgun bir teknoloji veya bazı basit teknolojiler gerçekte daha etkilidir.

Yapay zeka gerçekten de büyük bir gelişme gösterecek, çünkü büyük verideki değişiklikler birçok sektörü değiştirdi ve finans sektörü, tıp sektörü ve eğitim endüstrisi için çok yardımcı oluyor. İnsanların sıklıkla bahsettiği "yapay zeka tehdit teorisi" aslında hem uygulama yönteminin kendisinden hem de sorunun kendisinden birçok sınırlamaya sahiptir. Asıl sorun, birçok parametre ile çok karmaşıktır, ancak mevcut yöntemler basitleştirilmiş yöntemlerdir. Gerçek uygulamaya döndüğümüzde, hala üstesinden gelinmesi gereken birçok temel şeyin olduğunu göreceğiz.

Görüntü tanıma alanında iyi bir iş çıkarmak için bilgisayarları kullanıyoruz, ancak yine de sınırlı bir veri kümesi. Örneğin, bir robotu 1 milyon resimle kedi ve köpekleri tanıması için eğitebilirim. İnsanlardan daha fazlasını yapabilir. Doğru olun, ancak veri kümesini çizgi roman olarak değiştirirseniz, makine bunu tanıyamaz, ancak çocuk tanıyabilir. Çocuk bunun bir elma olduğunu gerçekten anlıyor, bu bir kedi yavrusu, bu gerçek bir anlayış ve büyük verinin zekası bir anlamda gerçek bir anlayış değil. Ek olarak, zekanın kendisi insanları gerçekten anlamaktır.İnsanlarla ilgili en karmaşık şey sadece görünüş değil, aynı zamanda birçok duygudur.Bu, zekanın önünde büyük bir engeldir.

Şimdiye kadar, istihbarat kapısının açıldığını ve gerçekten ne kadar değişebileceğinin sürekli girişimler gerektirebileceğini gördük. Çünkü büyük verilerle tüm sorunlar çözülemez.

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat hesabı "THU Data Pie" sahne arkasında "Suzhong" anahtar kelimesini yanıtladı ve PPT konuşmasını indirdi.

Ordudan emekli olduktan sonra, sadece gerçek savaş seviyesini korumak için orduya eğitime döndüler.

Denizin öfkesini okuyun, işte dünyanın en uzun ve en görkemli dalgası