g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

SenseTime Technology Xu Li: AI, 10 yıl içinde Hindistan ve Çin'in toplam çıktı değerini yaratacak

Xinzhiyuan Raporu

Yazar: Qin Xiao

Xin Zhiyuan Rehberi 22 Mart'ta, Tsinghua Üniversitesi'nin "Yapay Zeka Sınırları ve Endüstriyel Eğilimler" kurslarının ikinci dersi başladı. Bu ders, mevcut AI alanındaki en popüler ve en başarılı bilgisayar vizyonu uygulamasına odaklanıyor. SenseTime CEO'su Xu Li tarafından ders verildi. Dr. Xu Li, yapay zekanın geliştirme aşamalarını gözden geçirmek için bilgisayarla görü ve yüz tanımanın belirli uygulamalarını birleştirdi ve bilgisayar görmesi ve endüstri ihtiyaçlarının teknolojik atılımları hakkında derinlemesine bir tartışma yaptı. Özel bir kooperatif medyası olarak Xinzhiyuan, kuru malları organize etmek için getiriyor.

ana öğretim üyesi

Gök gürültüsü

Melek yatırımcı

Baidu'nun Kurucu Yedi Kılıç Adamından Biri

Kuwo Music'in kurucusu

Tsinghua Üniversitesi Boğazlar Araştırma Enstitüsü Büyük Veri Yapay Zeka Merkezi Uzman Komitesi Üyesi

Konuk konuşmacı

Xu Li

SenseTime'ın kurucu ortağı ve CEO'su

Lisans ve Doktora sırasıyla Shanghai Jiaotong Üniversitesi ve Hong Kong Çin Üniversitesi'nden mezun oldu. On yıldan fazla bilgisayar görüşü, yapay zeka temel araştırma ve ürün geliştirme deneyimine sahiptir. Motorola Araştırma Enstitüsü, Omron Araştırma Enstitüsü, Microsoft Araştırma Enstitüsü, Lenovo Araştırma Enstitüsü gibi bilgisayarla görme temel araştırma kurumlarını art arda ziyaret etmiş ve çalışmıştır.

Xu Li, 2014 yılında ortak kurucu olarak SenseTime'ı kurdu ve CEO olarak görev yaptı.Yüz tanıma, görüntü tanıma, video analizi, sürücüsüz sürüş ve çeşitli sektörlerde yapay zekayı güçlendirmek için tıbbi görüntü tanıma gibi yapay zeka algoritmaları geliştirdi. Şu anda SenseTime, yerli AI endüstrisinde en büyük teknik ekibe ve en büyük finansman miktarına sahip tek boynuzlu at şirketi haline geldi.

22 Mart'ta, Tsinghua Üniversitesi'nin "Yapay Zeka Sınırları ve Endüstriyel Eğilimler" kurs serisinin ikinci dersi başladı. Bu ders, mevcut AI alanında bilgisayar vizyonunun en popüler ve en başarılı uygulamasına odaklanıyor. SenseTime'ın kurucu ortağı ve CEO'su Xu Li Hoparlör. Dr. Xu Linin konferansından önce Lei Ming, bilgisayarla görme teknolojisinin genel bir tanımını yaptı. Bilgisayarla görme teknolojisinin aşağıdaki orijinal sınıflandırmalarını önerdi:

Statik teknoloji:

Yüz tanıma

Nesne tanıma

segmentasyon

açıklama

Dinamik teknoloji:

Nesne izleme

Hareket algılama

Video açıklaması

Nesil teknolojisi:

Stil değişimi

Sahne üretimi

Video üretimi

Bilgisayar görüşü için halihazırda birçok uygulama senaryosu vardır ve gelecekte daha fazla uygulama herkesin hayal gücünü gerektirir. Örneğin:

Yüz tanıma kimlik doğrulaması: havaalanları, oteller; mobil bankacılık; şirket katılımı

Güvenlik: anormallik algılama; kilitle ve takip et

Tıbbi görüntüleme: tıbbi teşhis

Endüstriyel tarım: ürün kalite denetimi; domuz yüzü tanıma

Finans: Uydu Görüntüsü Analizi

Xu Li: Yapay zeka, 10 yılda Hindistan ve Çin'in toplam çıktı değerini yaratabilen bir üretkenlik aracıdır.

Dr. Xu Li'nin dersinin konusu "Yapay Zeka Endüstrisinin Gelişimi: Gelecek Geldi, Belirsiz Şekilde Görünür". Dr. Xu Li ilk olarak üç yapay zeka dalgasından bilgisayar görüşü perspektifinden bahsetti.

Bu tabloyu pek çok yerde benzer görmüş olabilirsiniz, ancak sektörün gelişimi, iniş çıkışlarını net bir şekilde açıklayabilecek basit bir tablo değil. Bilgisayarla görme, yapay zekanın bir dalıdır, ancak bilgisayar vizyonunun kendisinin birçok dalı vardır ve her dalın gelişimi farklıdır.

Resimden her doruğun nerede olduğunu açıkça görebiliriz: İlk doruk 1957'de ortaya çıktı. İlk sinir ağının icadı ; 1986 yılına kadar, BP algoritması sinir ağında bir atılım gerçekleştirdi Yapay zeka ikinci doruğa giriyor ve şimdi, Derin öğrenme Doruk noktasıdır.

Her dalın iniş ve çıkışları farklıdır. Bilgisayar görüşü 90'larda düşük bir noktadaydı, " Bulanık mantık "Popüler. Örneğin," bulanık bir asansör "var. Beşinci katta duruyorsunuz ve asansöre basıyorsunuz, ancak asansör durmadan beşinci kata çıkıyor. Yukarı çıkmaya devam ediyor. Açıklaması, asansöre basan başka bir kişinin olduğunu bulmasıdır. Hesaplamadan sonra, yolcuları yukarı alıp sonra sizi aşağı indireceği anlaşıldı ki bu daha enerji verimli, ancak bu özellikle insanlık dışı, bu nedenle bulanık mantık daha sonra çalışmayacak ve artık gerekli olmayacak.

Yani yapay zekanın zamanın her noktasında kendi gelişim yönü var ama genel olarak bir sarmal.

Peki yapay zeka nedir? Dr. Xu Li tarafından verilen tanım, Yapay zeka, insanları aşan bir üretkenlik aracıdır. Bu yapay zeka dalgasının devrim niteliğindeki doğası, birdenbire, İnsanlar teknolojinin kırmızı cizgi Çok güçlü bir üretkenlik aracı oluşturan gelişimde bir atılım . Yani aslında bir yapay emek sorunudur.

Dolayısıyla, bir verimlilik aracı olduğu için, bazı verilere bakalım:

2035 yılına kadar, yapay zekanın dünya işgücü üretkenliğini% 40'tan fazla artırması bekleniyor.

Buna yapay zekadan etkilenmeyen çoğu şirket, ülke ve bölge dahildir. Bu nedenle, en tepedeki şirketler temelde işgücünün değiştirildiği modeldir, iki kişi bir kişi tarafından öldürülür. Bu yüzden önümüzdeki on yıldaki en büyük sorunlardan birinin, İnsan-makine entegrasyonu , Bu insanlar nasıl kullanılır. Artık yapay zekanın insan emeğinin yerini aldığını ve bazı endüstrilerde çalıştığını görüyoruz, bu yüzden insanların yapması gereken, makinelerin nasıl kontrol edileceği ve daha iyi üretkenliğin nasıl elde edileceği. Makinelerin duyguları olup olmadığı ve bunların yerini hangi aşamada alabileceklerine gelince, bu bizim insan grubumuzun sorunu değil.

Başka bir veri:

Yapay zeka, 2030'a kadar küresel GSYİH'da% 14'lük bir artışı teşvik edecek ve dünya ekonomisine yeni çıktı değeri olarak 15,7 trilyon ABD doları katkıda bulunacak.

Bu, Çin ve Hindistan'ın toplam üretim değerine denktir, yani on yılda yeni bir Çin ve Hindistan yaratılabilir. Peki bu yeni çıktı değerleri nereden geldi? Hala geliyor Verimlilik makinesi . Bu nedenle, gelecekte birçok dikey endüstride, AI daha fazla insanın yerini alacak.

Yapay zeka geliştirmenin yolu: düşük becerilerden insanlara, halkın ötesine ve uzmanların ötesine

Xu Li, yapay zekanın bir verimlilik aracı olarak üç aşamaya ayrılabileceğini öne sürdü:

İlk aşama: düşük becerilerin aşaması.

Ben de 10 yıl önce bu sektörde çalıştım, 2006 yılında yüz tanıma üzerine ilk makalemi yayınladım. O zaman ben de aynı şeyi yaptım, ama neden geliştirmeye yer yoktu? On yıldan fazla bir süre önce, AI, güvenlik alanında, asansör kapılarında ve diğer senaryolarda yaygın olarak kullanılıyordu, ancak şu an olduğu kadar sıcak değil. Kilit nokta, yüz tanımanın o dönemde endüstriyel uygulamalar için şartlara sahip olmamasıdır. . O zamanlar yüz tanıma kullanan bir kapı tokası vardı ve yurtdışı ürününün doğruluk oranı% 53 idi. Bu kavram nedir? Yani sistem size kim olduğunu ve kim olmadığını söyleyebilir ancak rastgele tahmin etme olasılığı% 50, yüz tanıma teknolojisini kullanmanın doğruluğu ise% 53'tür. Bu çok utanç verici bir ürün.

Yani bu teknolojinin devrim niteliğinde bir katkısı yok değil, yok ve en önemlisi, Ancak endüstriyel kırmızı çizgiyi geçtikten sonra endüstriyel uygulama koşullarına ulaşılabilir. .

Endüstriyel kırmızı çizginin tanımı insan doğruluğudur . O zamanlar bile, insan yüzü tanıma algoritması, tekrar çalıştırdıktan sonra hala insanların bakmasına ihtiyaç duyuyor, çünkü doğruluk oranı yüksek değil. Bu, insan rehberliğinin zekasıdır. İnsanların ön bilgisi gereklidir ve manuel rehberliğin zekası genellikle insanlardan üstün değildir.

İkinci aşama: Kitlelerin ötesinde.

Başka bir deyişle, algoritma sıradan insanların doğruluğunu aşmalıdır. Bu perspektiften, Yüz tanımanın ilk uygulaması halkın yerini almaktır . Örneğin, güvenlik kameraları, insanların günde 2000 saat video izlemesini gerektirir, bu nedenle makinenin doğruluğu sıradan insanlara göre daha yüksek olduğunda, izleyecek bir makine arayabilirsiniz. Bu çok büyük bir talep.

Başka bir örnek ise parasal . Örneğin Şangay'da kuruluşundan itibaren üç ay içinde 3000 çalışanı olan bir İnternet finans şirketi var, diye sorduğumda şok oldum, çok hızlı gelişiyor dedim. Hayır dedi, çünkü çeşitli belgelerin yüklenmesi gerekiyor ve bu belgeleri doğrulamak için birçok kişiye ihtiyaç var. Ama Şimdi, temelde insanların bunları yapmasına gerek yok, tüm bu doğrulamalar makineler tarafından yapılıyor . Bunun nedeni, yüz tanımanın endüstriyel kırmızı çizgiyi aşması ve makinelerin sıradan insanlardan daha iyisini yapabilmesidir, öyleyse neden insan gücünü bunu yapmak için boşa harcayalım?

Neden vurgu halkı (sıradan insanları) aşmaktır? Çünkü Hala sözde büyük veri odaklı model . Eskiden insan güdümlü bir istihbarattı ve şimdi büyük miktarda veriyi işleyebilir ve tamamen veriye dayalı zeka haline gelebilir, bu da halkı aşma olasılığını getirir.

İnsan bilgisi bilgisayarlara veri açıklama yoluyla öğretilebilir. Peki en kolay şekilde hangi tür verilere ulaşılabilir? Bu genel bir halk meselesidir. Sıradan bilgiye sahipler ve bilgileri, veri açıklamaları aracılığıyla bilgisayara iletilebilir.Bu notların sonuçlarını aldığınız sürece, bilgisayara nasıl öğrenileceğini öğretebilirsiniz.

Üçüncü aşama: Uzmanların ötesinde.

Pek çok durumda bu aşamaya gelmedik. Çoğu durumda, uzmanların bilgilerini veri notları aracılığıyla bilgisayara öğretmek zordur. Örneğin, finansal işlemler: Birçok işlem otomatik olmasına rağmen, bazı en iyi tüccarlar özel bilgi, özel bilgi veya becerilere sahip oldukları için hala oradadır.

Ancak AlphaGo özel bir durumdur. AlphaGo, halkı aşmak için erken aşamada hala orta aşamadadır. Çünkü insan 500.000 satranç plağı kullanılarak eğitilmiştir. Daha sonra satranç rekorunu kırdı ve belirli karar verme problemlerinde ve belirli bir karar alanıyla uzmanları şimdiden geride bırakabilir.

Bunlar yapay zeka geliştirmenin üç aşamasıdır.İkinci aşama yalnızca yapay iş gücü sağlamaktır ve üçüncü aşama hizmet yükseltmelerini gerçekleştirebilir. Çoğu durumda, hala birinci ve ikinci aşamalar arasındayız.

Çin'in yapay zeka gücü dünyanın lideridir, SenseTime Çin'in ilk derin öğrenme çerçevesini oluşturur

Çin'in yapay zeka alanındaki gücünün dünya lideri olduğunu yansıtabilecek birkaç veri var.

2016 yılında Çin'deki yapay zeka patentlerinin sayısı, toplam sayı hala ABD lideri olmasına rağmen% 70 arttı. Ayrıca, AAAI'de Pan AI'nın akademik zirvesi, Çin'de yayınlanan makale sayısı% 31'i oluşturuyor Özellikle dikey görüş alanında, CVPR makalelerinin Çinli yazarları% 40'lık bir paya sahip Bu aynı zamanda bizim bilişimizle de tutarlı, vizyon yapan insanların neden hepsinin Çinli olduğunu bilmiyorum.

Son veriler Shangtang'dan alınmıştır.Kuruluşundan bu yana geçen üç yıl içinde, Shangtang CVPR'de 119 makale yayınladı. Bu, geçen yılın verileri. Şimdi çok aşıldı, çünkü bu yıl 44 CVPR'yi seçtik.

Bu nedenle Çin, bilgisayarla görmenin dikey alanında iyi bir iş çıkardı ve çok popüler.

Aşağıda, Google Arama Derin Öğrenme'nin bir ısı haritası verilmiştir. Popülerlik ne kadar yüksekse, renk o kadar koyu olur. Derin öğrenmenin Çin'de çok popüler olduğunu görebilirsiniz.

Derin öğrenmeden bahsetmişken, herkes Google'ın TensorFlow, Facebook'ta Torch ve Berkeley'de Caffe olduğunu bilir. Bu yüzden SenseTime, kendi derin öğrenme orijinal platformunu geliştirdi. Papağanlar . Bu platform ile pek çok şeyin üstesinden gelebiliyoruz O zamanlar ImageNet'te 1000'den fazla katmanla derin bir sinir ağı oluşturduk. Bu platformun mükemmel performansını sağlamak için üç ana unsurumuz var. Az önce bahsedilen ultra derin ağa ek olarak, süper büyük veri öğrenimimiz de var.Aynı anda 2 milyar yüz veri eğitimimiz var; ayrıca karmaşık ilgili uygulamalar için çok modlu veri öğrenimimiz var.

Derin öğrenmede, öğrendiğiniz şey şeylerin tanımıdır. Sıradan makine öğrenimi uzman bilgisine dayanırken, derin öğrenme başka bir olasılık sağlar ve küresel bir ifade öğrenir. Böyle bir öğrenme, şeylerin güçlü bir tanımını getirebilir.

Bilgisayar görüşü ve endüstri ihtiyaçlarında teknolojik gelişmeler: gıda, giyim, barınma ve ulaşımın tüm yönlerine nüfuz edin

Bilgisayarla görmedeki teknolojik gelişmelerden biri " oluşturmak ". Örneğin, bu PPT'de," Bu küçük kuşun beyaz bir göğsü, açık gri bir kafası ve siyah kanatları ve kuyruğu var "şeklinde bir metin açıklaması veriyoruz. Bilgisayar bu kuşu yaratabilir." Yoktan ", bu mükemmel.

Bu çok ilginç ve çok fazla hayal gücü getirebilir. Teknolojik atılım, her seferinde hayal gücünüzü aşabileceğiniz ve daha yüksek bir seviyeye ulaşabileceğiniz anlamına gelir.

Peki sektörün talebi nedir? İnsanların yaşamlarının her yönü bilgisayarla görme teknolojisinden büyük ölçüde etkilenir.

Bazı basit örnekler verin:

Giysiler: İstediğiniz kıyafetleri yazı ile üretebilirsiniz, sadece bir fotoğrafa ihtiyacınız var ve her gün istediğiniz zaman kıyafetlerinizi değiştirebilirsiniz. Bunların hepsi üretilen sonuçlardır.

Yemek: Yemek sırasında bilgisayarla görmenin kullanılabileceği çeşitli sahneler de vardır. Örneğin, yiyecekleri tanımlayabilir ve yiyeceklerin kalorilerini hesaplayabilir.

Canlı: Örneğin yüz tanıma turnikeleri, bu zaten çok yaygın. Bir diğer büyük uygulama senaryosu ise insansız bir mağaza.

OK: Otonom sürüşü düşünmek kolaydır. Bazı insanlar bunun hala öngörülebilir gelecekte olduğunu söyleyebilir, ancak belirli koşullar altında, birçok yavaş otopilot zaten uygulanabiliyor.

Görsel hesaplama: görüntüleme, algılama, tanıma, anlama

Görüntüleme, algılama, tanıma ve anlamanın tamamı vizyondur. Peki nasıl okunmalı ve anlaşılmalı? Az önce teknik kırmızı çizginin insanları aşmak olduğunu söyledik .. Bilgisayar görüşü söz konusu olduğunda, teknik kırmızı çizgi görme ve anlamada insan seviyesini aşmaktır.

Bu noktayı "açıkça görerek" makineler, birçok durumda insanları çok aştı. Örneğin yukarıdaki resim bir kartpostaldır, üzerinde şehrin adı olan bir şehirdir. Makine şunları görebilir:

Makine, tek bir fotoğraftan çok fazla bilgi alabilir ve bu çok güçlüdür.

Makineler sanatsal yaratımda da başarılı olabilir. Yukarıdaki resimde sol taraf insanlar tarafından, sağ taraf ise makineler tarafından yaratılmıştır.Makinelerle yapılan resimlerin insanlar tarafından yapılan resimlerden daha kötü olmadığı söylenebilir.

Makine ayrıca videonun stilize edilmesi gibi artistik işlemler de yapabilir.

Yüz tanıma uygulaması senaryosu durumu: bulanıklaştırma geliştirme

Çok belirsiz bir durumda nasıl fark edilir? Örneğin yukarıdaki resimde kime benzediğini düşünüyorsunuz?

Bu polis için çok önemli.

Yüz tanıma teknolojisi bu açıdan çok güçlü, soldaki bulanık resmi iyileştirebilir.

Bu sadece insanları yakalamakla ilgili değil, aynı zamanda geliştirme teknolojisinin uygulanması da çok kapsamlı. Örneğin, Japonya'da Waifu2x adında, çizgi romanları onarmak için görüntü geliştirme teknolojisini kullanabilen bir web sitesi var.

Shenzhen'de yüz tanıma teknolojisini büyük ölçekte kullandık. Uygulamada başka bir uygulama örneği vermek gerekirse: Yıllar boyunca sergi salonunda sabıka kaydı bulunan şüphelilerin fotoğraflarını kontrol hedefi veri tabanına aktardık, kontrol görevlerini kurduk ve sistem kaçak şüphelileri otomatik olarak karşılaştırarak Shenzhen Kültür Fuarı'nda başarıyla yakaladık. 25 kişi.

Diyalog bağlantısı

Tsinghua Üniversitesi Kanal Araştırma Enstitüsü Büyük Veri AI Merkezi uzman üyesi Lei Ming, Shangtang Technology'nin kurucu ortağı ve CEO'su Xu Li, Tsinghua Üniversitesi Otomasyon Bölümü profesörü Ji Xiangyang ve Softbank SAIF Yatırım Fonu'nun kıdemli ortağı Yang Dong SenseTime, teknolojinin başarılı bir şekilde uygulanması, yatırım deneyimi ve girişimcilik danışmanlığı gibi konulardan bahsetti.

Tsinghua University School Online'daki bu kurs serisinin canlı adresi:

Tsinghua Üniversitesi "Yapay Zeka Sınırları ve Endüstri Eğilimleri" kurs serisi hakkında

Bu kursun ana öğretim görevlisi, Tsinghua Boğazı Araştırma Enstitüsü Büyük Veri Yapay Zekâ Ekoloji Komitesi'nden bir uzman, Baidu'nun Yedi Silahşörlerinden biri ve Kuwo Music'in kurucusu Lei Ming'dir. Eğitmen, Tsinghua Üniversitesi Fen Fakültesi dekanı ve Gong Gong Yeryüzü Sistemi Bilimi Bölümü dekanıdır. Profesör Peng, Yer Bilimleri Bölümü'nden Doçent Bai Yuqi ve Bilgisayar Bilimi ve Teknolojisi Bölümü'nden Doçent Zhu Jun.

Kurs, Zhen Fund kurucusu Xu Xiaoping, Tencent AI Lab direktörü Zhang Tong, SenseTime Kurucu Ortağı ve CEO'su Xu Li, Alibaba Cloud Quantum Teknoloji Baş Bilimcisi Shi Yaoyun, Baidu DuMi İş Birimi Genel Müdürü Jing Kun, Uluslararası Yapay Zeka Yang Qiang federasyonunun yönetim kurulu başkanı ve BAT'ın AI işinin başkanı, tanınmış AI şirketlerinin kurucusu ve AI alanında tanınmış profesörler de dahil olmak üzere 20'den fazla büyük isim.

Her sınıf aynı zamanda, Baidunun kurucu Yedi Silahşörlerinden biri olan Bay Lei Ming'in ev sahipliğinde yapay zeka alt bölümü alanında bir yuvarlak masa tartışması yapacak ve açılış konuşmacıları, profesörler ve tanınmış VC'lerden oluşan güçlü bir kadro oluşturacak. Büyük adamların çarpışmasını izleyen forum, foruma taşınacak .

Çay sıcak, kaseyi tutma duruşunun yanlış olduğu ortaya çıktı.

En Çinli kim | Eskiyi tükür ve yeniyi kabul et