g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Shan Shiguang: Yapay zeka metodolojisinin güncellenmesi gerekiyor Salgından sonra yapay zeka nasıl gelişecek?

Yazar | Jia Wei

Düzeltme | Shan Shiguang

Düzenle | Kongun Sonu

Bir zamanlar yapay zeka olarak bilinen troika - algoritmalar, hesaplama gücü ve veriler, yansıma anına geldi. Özellikle, akademik sınırda derin öğrenmenin takip gelişimi zayıftır ve AI yeteneklerinin sürekli yükseltilmesini desteklemek zor olabilir.

Yeni on yıla girdikten sonra, AI şimdi bir dönüm noktasına ulaşmış olabilir.

Peki şimdi yapay zeka teknolojisi nasıl geliştirilecek ve uygulanacak? Yerli salgının sona ermesiyle, bu yavaş yavaş alandaki birçok araştırmacı ve uygulayıcının acilen cevaplaması gereken anahtar bir soru haline geldi.

9 Nisan'da Çin Bilim ve Teknoloji Derneği Akademik Bölümü, Çin Bilim Haberleri, Tencent Bilim ve Teknoloji Derneği ve Tencent Geliştirme Araştırma Ofisi, "Yapay Zeka: Teknoloji ve Ekonominin Entegrasyonu için Yeni Bir Motor" temalı çok zamanında bir çevrimiçi forum düzenledi. Birçok akademisyen ve uzman salgın sonrası yapay zeka teknolojisinin entegrasyonu ve ekonomik kalkınma ile ilgili birçok soruyu yanıtladı.

AI Technology Review, yapay zeka teknolojisine odaklanıyor ve Çin Bilimler Akademisi Bilgisayar Teknolojisi Enstitüsü'nde araştırmacı ve Çin Bilim ve Teknoloji kurucusu Shan Shiguang'ın rapor içeriğini organize etmek ve herkesle paylaşmak için seçiyor.

Araştırmacı Shan Shiguang'ın raporu iki bölüme ayrılmıştır. Birincisi, araştırma perspektifinden bakıldığında, yapay zeka metodolojisinin "veriye dayalı" dan "bilgi + veri ortak odaklı" na geçeceğine inanmaktadır; ikinci bölümde, endüstri gelişimi açısından beş ana bakış açısı ortaya koymaktadır Ve öneriler. Bu içerikler derin içgörülere sahiptir.

1 Akademik sınırlar açısından,

Derin öğrenme savaşın sonu oldu

Son on yılda, yapay zeka araştırması, yapay zeka algoritmalarını tasarlamak için kurallara ve bilgiye dayanan bir metodolojiden, verileri ana itici güç olarak kullanan bir metodolojiye kademeli olarak geçiş yaptı.

"Troyka" algoritmalarına, büyük veriye ve güçlü bilgi işlem gücüne dayanan bu metodolojinin rehberliğinde, mevcut AI yetenekleri desteklenmektedir. Algoritma temel olarak derin öğrenmeye dayalıdır ve verilerin yeterince büyük (ve denetlenen ve etiketlenmiş veriler) olduğu vurgulanır. Derin öğrenme genellikle eğitim yoluyla yüz milyonlarca parametre gerektirdiğinden, aynı zamanda güçlü hesaplama gücünün desteğine de güvenmeye yol açar.

Bu nedenle, AI görevleri aşağıdaki iki koşulu karşıladığı sürece iyi bir şekilde çözülebilir:

1) Özel AI görevleri (genel AI değil). Örneğin, tıbbi görüntülemede, pnömoniye bakan AI, yalnızca pnömoniye bakabilir, hepatite değil; BT'ye bakan AI, MRG'ye değil, yalnızca BT'ye bakabilir.

2) "İyi" veriler verimlidir (iş modelleri aracılığıyla büyük miktarda veri elde edin). Sözde iyi veriler, bir yandan daha büyük bir ölçeğe sahip olmalı, diğer yandan iyi etiketlenmelidir.

Ancak böyle bir YZ, beklediğimizden çok uzaktır.

Microsoft Araştırma Asya Dekanı Dr.Hong Xiaowen, bir keresinde aşağıdaki AI yetenek piramidini önerdi (sarı yazı tipi, Shan Shiguang tarafından eklenen içeriktir):

Bu piramit seviyesine göre, mevcut AI teknolojisi hala insan olmayan primatların seviyesine eşdeğer olan ikinci "algılama ve basit akıl yürütme" seviyesinde kalıyor.

Daha ileri gitmek ve biliş, duygu, yaratım ve hatta bilgelik nasıl elde edilir?

Shan Shiguang, en azından aşağıdaki yetenekleri geliştirmemiz gerektiğine inanıyor:

Ancak, mevcut AI metodolojisi, AI yeteneklerinin sürekli olarak yükseltilmesini desteklemek için yeterli değildir.

Her şeyden önce, algoritma, hesaplama gücü ve verilerden oluşan üç taşıyıcı biraz zayıftı. Hem bilgi işlem gücünün iyileştirilmesi hem de büyük veri toplama kaynaklara yatırım gerektirir, ancak algoritmaların çoğu tek bir görev için tek bir modeldir Şimdi birçok sorun var ancak sınırlı yöntemler var.

İkincisi, endüstride, derin öğrenme uygulamalı araştırma için hala büyük veriye ve büyük bilgi işlem gücüne dayanmaktadır. Güçlü bir teorik destek olmadığından, bazı hesaplama gücü ve veriler deneme yanılma ile boşa harcanacaktır. Bu giderek daha açık hale geldi.

Öte yandan, akademik sınırda, derin öğrenme sınırlı potansiyel göstermektedir. neden? Yüksek veri bağımlılığı sorununu tek başına aşamadığı için insanlar gibi "zayıf" ve "küçük" verilere dayanarak doğru ve sağlam bir şekilde öğrenemez! Mevcut araştırmalar ayrıca derin öğrenmeye dayalı veri bağımlılığı sorununu çözmeyi umuyor, makine öğrenimine zayıf denetimden ve küçük verilerden öğrenme yeteneği vermeyi umuyor, ancak prensipte, desteklenecek başka veri veya bilgi yoksa, Bu neredeyse imkansızdır. Tamamen yeni bir yol bulmalıyız.

Önümüzdeki 10 yılda 2 AI metodolojisi:

Bilgi + veri ortak sürücüsü

AI yeteneklerinin yükseltilmesi, AI metodolojisinin yükseltilmesine dayanmalıdır ve bu, algoritma yeniliğinin özüne iner.

Araştırmacı Shan Shiguang, acil olarak geliştirilmeye ihtiyaç duyan aşağıdaki AI algoritmalarını önerdi:

Örneğin, algoritma veri miktarını% 10'a veya hatta% 1'e düşürebilir mi? Mevcut algoritmada (tamamen veriye dayalı), bilgi ve verilerin ortak yönlendirilmesini sağlamak için bilgi veya diğer mevcut veri veya modelleri ekleyebilir miyiz? ... Aslında, birçok araştırma birimi bunu zaten yapıyor ve aynı zamanda AI algoritmalarındaki araştırma yönlerini keşfetmeye en değer olanlardan biri.

Shan Shiguang, yukarıdaki içeriğe yanıt olarak "veri bağımlılığı" açısından ayrıntılı bir açıklama yaptı. Daha önce bahsedildiği gibi, mevcut yapay zeka yöntemleri büyük ölçüde (güçlü bir şekilde denetlenen, büyük ölçekli) verilere bağlıdır. Ancak insan zekasının böyle olmadığını biliyoruz, sadece insan yeteneklerine birkaç örnek verelim:

Tümevarımsal ve tümdengelimli akıl yürütme: bireyden genele ve sonra genelden bireye;
Analoji yoluyla analiz edin: tümdengelimli transfer öğrenmeye benzer;
Bir hendek yiyin ve bilgelik geliştirin: birkaç hatadan ders alın (modeli değiştirin);
Tahmin testi: hataları her zaman tahmin edin ve düzeltin; kendi kendini düzeltme öğrenme;
Meta-yöntem: Dao bir, bir hayat iki, iki üç, üç ise her şeyi üretir;
Entegrasyon: çok modlu ve çok disiplinli bilgi doğrulama ve entegrasyon;
Hayal gücü ve yaratıcılık: sıfırdan, enterpolasyon yapmak yerine tahmin edin.

Bu yeteneklerden, insan zekasının esasen bilgi + zayıf (zayıf denetim, küçük örneklem) veri odaklı bir yöntem olduğunu görebiliriz. Bu özellik referansımıza değer.

Araştırmacı Shan Shiguang, insanların küçük verileri öğrenmesinin sebebinin bilgi birikimi olduğuna inanıyor. Bu nedenle, bilginin makineye nasıl entegre edileceği AI algoritmaları için çok önemlidir. Buradaki bilgi, insanlar tarafından özetlenen bilgi veya YZ tarafından öğrenilen bilgi olabilir. O ikinci bilgiyi "makine bilgisi" olarak adlandırdı.

"İnsan bilgisinden" farklı olan sözde "makine bilgisi", muhtemelen insan tarafından okunabilir veya hatta insan tarafından anlaşılabilir değildir. Araştırmacı Shan Shiguang'ın dediği gibi, algoritmalarla N adet görevi (insan yüzlerini, maymun yüzlerini, at yüzlerini, köpek yüzlerini, inek yüzlerini tanımak gibi) çözdüğümüzde, makinenin bu görevlerden bazı genel görevleri özetlemesi mümkündür. Kurallar, "meta" model olarak.

"Makine bilgisi" ile, küçük veriler / verisiz görevler bile iyi performans sağlayabilir. Örneğin, koala yüzlerini, balık yüzlerini, panda yüzlerini vb. Tanımak için kullanılabilecek insanlardan / maymunlardan, atlardan, köpeklerden, ineklerden vb. Öğrenilen yüz tanıma modeli yardımıyla yüzün bir "meta" modeli elde edilebilir.

(Şu andaki yöntem, genellikle bir hayvanı tanımlamak için, hayvanın çok sayıda yüz fotoğrafını toplamak ve hayvanı değiştirmek için tekrar toplamanız ve öğrenmeniz gerektiğidir. Ne verimli, ne zarif, hatta beceriksiz ve biraz saçma.)

Aslında, bu tür bir araştırma aslında bir çok görevli koordinasyon sorunudur.Bazı insanlar bunu 2018'de yapıyor. CVPR 2018'in en iyi makalesi, temsilcilerden biridir.Bu çalışma, 26 farklı görev arasındaki ilişkiyi ve nasıl Birbirini destekleyebilir, böylece etiketli verilere olan ihtiyacı azaltır.

Yukarıdaki analize dayanarak, araştırmacı Shan Shiguang, yapay zeka metodolojisinin son on yılda giderek güçlü ve büyük veriler tarafından yönlendirildiğine inanıyor, ancak önümüzdeki on yıl veya daha uzun bir süre içinde, birleşik bilgi ve veri güdüsü ana akım haline gelecektir. . Tabii ki, buradaki bilgi sadece insanların anlayabileceği bilgiye atıfta bulunmaz, aynı zamanda birçok insanın anlayamayacağı "makine bilgisi" olabilir.

3 Beş görüş

Araştırmacı Shan Shiguang, raporun ikinci yarısında Çin'de yapay zekanın mevcut gelişimine ilişkin beş önemli görüş ve öneriyi şu şekilde ortaya koydu:

1. AI uygulama araştırmasında çok az boşluk var

Çin ve Amerika Birleşik Devletleri (Avrupa) arasında uygulamalı araştırmada çok fazla fark yoktur, ancak yine de çeşitli endüstrilerdeki (yani diğer araştırma alanlarında) derinlemesine uygulamalar üzerinde çok çalışmamız gerekiyor. Örneğin, biyolojik bilgi alanındaki yapay zekanın uygulanmasının Batı'da çok fazla birikimi var ve derin öğrenme de çok işe yaradı ve Çin'in bu konuda yetişmek için çok çalışması gerekiyor.

2. Temel AI araştırmalarındaki boşluk küçümsenmemelidir

Çin ile Amerika Birleşik Devletleri (Avrupa) arasındaki uçurum küçülüyor, ancak Çin'in ivmesi yetersiz. Son on yılda en temsili yöntemler esas olarak Avrupa ve Amerikan üniversitelerinden veya şirketlerinden gelmiştir ve eşit bir temelde olması en az 5-10 yıl veya daha uzun sürebilir. Bizim sorunumuz, uzun vadeli temel araştırma anlayışından ve temel sabrımızdan yoksun oluşumuzdur! Büyük temel araştırma projelerinin değerlendirme döngüsü çok kısadır ve hatta net bir teknik rota ve iki yıl içinde sonuç gerektirir. Bununla birlikte, temel araştırma genellikle "kasıtlı olarak söğüt ve söğüt dikmek ve kasıtlı olarak çiçek açmadan çiçek dikmektir". Örnek olarak Deep Convolutional Neural Network'ü (DCNN) ele alalım: 1980'lerin bir ürünüydü ve gücünü kullanmaya başlaması yaklaşık 20 yıl sürdü.

3. AI altyapısındaki boşluk küçük değil

Bu, donanım, yazılım ve akıllı yazılım olmak üzere üç yönü içerir.

Temel donanım platformuna yapılan yurt içi yatırım büyüktür, ancak tekrarlanan bir yapı vardır ve sonuçta ortaya çıkan kuvvet oluşmamıştır ve etki tam olarak uygulanamaz.Ayrıca, derin öğrenmenin zayıf teorik temeli nedeniyle geçersiz deneme yanılma, hesaplama gücünün israfına yol açar.

Öte yandan, Çin'in temel yazılım platformlarına yaptığı yatırımın artırılması gerekiyor (Kuzey Amerika'nın en az 4-8 yıl gerisinde) Derin öğrenmenin temelini oluşturan temel çerçeveler (TensorFlow, Pytorch, MxNet) esas olarak Kuzey Amerika ülkeleri tarafından oluşturuldu. 10 yıl sonra, Bu özellik bugünün "çip endüstrisi" olabilir ve bizim "gizli tehlikemiz" haline gelebilir; son zamanlarda Çin'deki birçok işletme (Baidu, Huawei, Megvii, Tsinghua, Pengcheng Lab ...) açık kaynak yayınladı veya yayınlamayı planladı Çerçeve, bir sinerji oluşturmayı umuyoruz. Shan Shiguang, AI Ar-Ge platformları ve düşük eşikli araçlar için fırsatı en kısa sürede değerlendirmemiz gerektiğini öne sürdü.

Buna ek olarak, Shan Shiguang, temel akıllı yazılım sistemine yatırımı artırmamız gerektiğini önerdi (temel algoritma araştırması dahil). Temel akıllı yazılım sistemi araştırmasının güçlendirilmesi önerilmektedir: geçmişte mevcut bilgi işlem merkezi ve veri merkezinden başlayarak, bir algoritma merkezinin nasıl kurulacağı, bilgi Merkez, vb., İnsan bilgi merkezi (genel bilgi + alan bilgisi) ve makine bilgisi (olgun yapay zeka algoritması ve modeli) merkezi de dahil olmak üzere mümkün olan en kısa sürede ulusal bir "bilgi merkezi" kurulması tavsiye edilir, böylece uygulanan AI algoritması su, elektrik gibi olabilir, Kömürle aynı, böylece çok fazla iş tekrarını önlemek için.

4. AI yetenek eğitiminin eğim yoğunluğu yeterli değil

Son zamanlarda herkes yapay zeka yeteneklerinde büyük bir boşluk olduğunu söylese de, aslında yapay zeka ile ilgili ana dallarda lisansüstü öğrenci sayısı hala yetersiz. Bu eksiklik, artık yapay zeka olmayan diğer öğrencilerin aktif veya pasif yapay zekası ile hafifletiliyor. Bu uzun vadeli bir çözüm değil. Ülke gerçekten yapay zekanın stratejik bir yön olduğuna inanıyorsa, daha fazla lisansüstü öğrenciyi AI ana dallarına tahsis etmek gibi AI yeteneklerini geliştirmeye daha meyilli olmalıdır.

5. Endüstrinin, üniversitenin ve araştırmanın ilgili konumlandırmasının hala optimize edilmesi gerekiyor

Son yıllarda, işletmelerin üniversiteleşmesi ve üniversitelerin ve kurumların teşebbüsleşmesi olan bir olguyu fark edeceğiz. Tipik performans, şirketlerin makaleler yayınlaması, üniversite araştırma kurumlarının ise kısa vadeli teknoloji yapmasıdır. Uzun vadeli temel araştırmanın nasıl değerlendirileceği de dahil olmak üzere birçok neden vardır ve şapka kültürü de birçok fast-food bilimsel araştırma sonucunu doğurmuştur. Son zamanlarda, ülke defalarca "dört benzersiz" i kırmayı önerdi, ancak "herkese uyan tek boyut" bilimsel araştırma değerlendirme modelinin benimsenmemesi daha da önerilmektedir.Farklı alanlara ve farklı yetenek türlerine göre farklı değerlendirme yöntemleri benimsenmelidir. Ayrıca, kurumsal teknolojik inovasyona yönelik destek oryantasyonu da tartışmalıdır.İşletmelerin ne tür inovasyon olması gerektiği ve üniversitelerin ve bilimsel araştırma kurumlarının ne tür inovasyon yapması gerektiği daha doğru bir sınıflandırmayı gerektirebilir.

ICLR 2020 | Reformer, verimli bir Transformatör

Today Paper | DeepCap; metin sınıflandırması; frekans etki alanı grafik dikkat ağı; 3D insan poz tahmini vb.

: Canlı | Yang Qiang, WeBank Yapay Zeka Başkanı: Neden federal öğrenmeye ihtiyacımız var?

: Süpüren robotun "gözlerinin" evrimsel tarihi

: Canlı | Microsoft Super Mahjong AI Suphx Ar-Ge ekibi teknik ayrıntıları derinlemesine açıklıyor

: Today Paper | ScrabbleGAN; UnrealText; izleme modeli; G2L-Net, vb.

: Today Paper | Güçlendirmeli Öğrenme; Yeniden Yapılandırılabilir GAN'lar; BachGAN; Zaman Serisi Sınıflandırması, vb.

: Today Paper | COVID-19; Derin İlgi Ağı; COVIDX-NET; Sahne Metni Geçişi, vb.

: NLP'nin en iyi konferansları birbiri ardına ertelendi, COLING bunu Mart ayında ertelemeyi tercih etti ve ayrıca çevrimdışı konferanslar düzenledi

: Evde kalırken egzersiz yapmak istersen ne yapmalı? Neden bu koşu bandını denemiyorsunuz | Titanium Geek

: Bankacılık sektörü 2019'da 1.531 bilet çıkardı ve dönüşümün acısı devam ediyor

: Hebei'den eşim Liu Yanli: Karavan kullanma ve ülke çapında canlı yayın yapma hayali

: Redmi Lu Weibing: 5G cep telefonu K30 Pro 2999 yuan'da başlıyor. 2020'de Honor Titanium Express'i tamamen aşacak

: Hiçbir şey olmadığında oyun oynayın, yabancı "şişko ev" oyun yapımcılarını hazırlıksız yakaladı

g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Shan Shiguang: Yapay zeka metodolojisinin güncellenmesi gerekiyor Salgından sonra yapay zeka nasıl gelişecek?

Yazar | Jia Wei

Düzenle | Kongun Sonu

İlgili bilgi

Muhabir, New Oriental, Learning Overlord, Birlikte Çalışmak ve "Eksik Öğretmen Bilgileri" gibi ihlalleri ölçtü.

DeepMind Nature'ı yeniden yayınlıyor, grafik sinir ağı fiziksel sorunları çözüyor

Bengio ekibinin başyapıtı: GNN karşılaştırma karşılaştırması ortaya çıktı, grafik sinir ağının "ImageNet" i burada

İlk ciddi "BERT çalışması" araştırması, 40+ tez karşılaştırması, BERT çalışma prensibinin yorumlanması

ICLR 2020 | Grafik sinir ağına dayalı geleneksel, endüktif matris tamamlamanın ötesinde

Canlı CVPR Oral: Örnek Segmentasyon Yeni Fikirler

Gözetimsiz makine çevirisi yapmak için bir araç olarak vizyonu kullanan DeepMind'ın büyük hareketi, etkisi mükemmel

LSTM neden bu kadar etkilidir? Bilmen gereken bu beş sır

güncel! Tsinghua ve birkaç yetkili kuruluş, tüm ağdaki en yeni koroner pnömoni veri kaynağını yayınladı

CVPR 2020 Oral | İkili Şube Ağı BBN: Uzun Kuyruk Dağıtımı ile Gerçek Dünya Görevlerinin Üstesinden Gelmek