Google Çin'in 2018 okulu, yıllık 560.000 maaş, Jeff Dean, Li Feifei, Li Jia ve diğer Tsinghua seminerlerini işe alıyor

Jeff Dean, Google AI Şefi

Xinzhiyuan Raporu

Yazar: Wen Fei

Xin Zhiyuan Rehberi Tsinghua-Google AI Sempozyumu, aralarında Jeff Dean, Li Feifei ve Li Jia'nın da bulunduğu 22 uzman makine öğrenimi, pekiştirmeli öğrenim, NLP ve bilgisayarla görmedeki en son gelişmeleri tartışmak için bir araya geldi. Son zamanlarda, Google China'nın 2018 okulu işe alımının yıllık 560.000 maaşını gösteren bir resim geniş çapta dolaşıma girdi. Google'ın akademik değişimleri şüphesiz Çin yapay zekası için iyi bir şey, ancak belki de bu aynı zamanda Çin'deki yapay zeka yetenekleri için zaten şiddetli rekabeti artıracaktır.

Tsinghua Üniversitesi Yapay Zeka Araştırma Enstitüsü'nün kuruluş töreninde, Tsinghua-Google AI Sempozyumu da başladı. Bu seminer, Tsinghua Üniversitesi Yapay Zeka Enstitüsü'nün lüks bir diziye sahip yüksek kaliteli bir yapay zeka iletişim platformu oluşturmaya yönelik ilk girişimidir. İki günlük programda adı kazanan birçok büyük inek ve birçok ilginç tema var:

  • Jeff Dean: Dünya sorunlarını çözmek için derin öğrenme

  • Li Feifei: Yapay zeka destekli sağlık hizmetlerine yönelik çevresel zeka

  • Li Jia: Kurumsal AI: Gerçek Dünya Araştırmalarının Yeni Sınırı

  • Quoc Le: AutoML: Makine öğrenimini otomatikleştirmek için makine öğrenimini kullanma

  • Bill Freeman: Görerek dinlemek: Görerek konuşmayı anlamayı kolaylaştırmak

  • Oriol Vinyals: Yapay Zekanın Yeni Zorlukları

  • ...

Aslında bu seminerde makine öğrenimi, pekiştirmeli öğrenme, bilgisayarla görme, doğal dil işleme ve sektörde yapay zeka araştırması olmak üzere toplam 5 tematik bölüm bulunuyor. Böyle Tema ayarı, Google AI China Center'ın odak noktasıyla oldukça tutarlıdır .

Aralık 2017'de Li Feifei, Şanghay'daki Google Developers Konferansında Google AI Çin Merkezi'nin kurulduğunu duyurdu ve bu merkezin daha çok temel araştırmalara odaklanacağını, algoritmalara ve modellere odaklanacağını ve özellikle dört yöne odaklanacağını söyledi. Derin öğrenme, pekiştirmeli öğrenme, bilgisayarla görme Ve dil .

Li Feifei, Google AI Çin Merkezi'nin kurulmasının "Çin'in en akıllı yapay zeka araştırmacılarıyla işbirliği yapmak", Çin'de yerel akademik işbirliğini ve yetenek eğitimini teşvik etmek ve daha geniş bir öğrenci ve araştırmacı yelpazesi için yüksek kaliteli yapay zeka ve makine öğrenimi sağlamak olduğunu söyledi. Eğitim desteği.

Bu seminerin orijinal planın uygulaması olduğu söylenebilir. Google AI Çin Merkezi 6 ay önce kurulduğunda, Google akademisyenleri ve teknoloji devleri Çin üniversitelerine girmek ve Çin akademik topluluğu ile daha fazlasını yapmak için en son araştırmalarını ve sonuçlarını (Google'ın dikkatine göre) getirmek için bir araya geliyorlar. Deneyim alışverişi. Aynı zamanda Google'ın AI gücünü bir kez daha gösterdi.

Yapay zekanın gelişimi verilerden, yeteneklerden ve pazarlardan ayrılamaz.Çin bu noktalara sahiptir ve çok sayıda vardır. Çin de güçlü bir şekilde yapay zeka geliştiriyor. Devlet Konseyi "Yeni Nesil Yapay Zeka Geliştirme Planı" nı yayınladı ve Sanayi ve Bilgi Teknolojileri Bakanlığı "Yeni Nesil Yapay Zeka Endüstrisinin Gelişimini Teşvik Etmek İçin Üç Yıllık Eylem Planı (2018-2020)" yayınladı. Çinin akademisi, eğitimi ve endüstrisi sürekli olarak dış dünyaya açılma mesajını yayınlıyor ve Google şüphesiz bu noktayı doğru bir şekilde kavradı ve kavradı. .

Çin ile Amerika Birleşik Devletleri arasında devam eden ticaret savaşına ve teknolojik alışverişin önündeki artan engellere rağmen, Amerikan devi Google, adım adım Çin'e girmeye çalışıyor.

Jeff Dean: Derin öğrenmeyi düşünmediyseniz, kullanın!

Aşağıda, giriş için birkaç rapor seçiyoruz.

İlki, Google AI başkanı Jeff Dean tarafından seminerin ilk gününde yapılan açılış konuşması. Konu, "Dünyanın Başlıca Zorluklarını Çözmek İçin Derin Öğrenmeyi Kullanma". Bu aynı zamanda Jeff Dean tarafından Tsinghua Üniversitesi Bilgisayar Bilimleri Danışma Kurulu üyesi olarak işe alındıktan sonra yapılan ilk konuşma.

Jeff Dean bir açılış konuşması yaptı: Büyük zorlukları çözmek için derin öğrenmeyi kullanma

Google Brain ekibi, son 6 yıldır yapay zeka ile ilgili sorunları inceliyor, makine öğrenimi araştırmaları için büyük ölçekli bilgisayar sistemleri oluşturuyor ve araştırmalarını ve sistemlerini birçok Google ürününe uygulamak için birçok Google ekibiyle işbirliği yapıyor. Bilgisayarla görme, konuşma tanıma, dil anlama, makine çevirisi, sağlık hizmetleri ve robot kontrolü alanlarında önemli ilerlemeler kaydettiler.

Google'ın yapay zeka alanındaki nihai hedefi üç nokta: Google ürünlerini daha kullanışlı hale getirmek için yapay zeka ve makine öğrenimini kullanmak; şirketlerin ve harici geliştiricilerin yenilik yapmak için yapay zeka ve makine öğrenimini kullanmalarına yardımcı olmak (Başkalarının yenilik yapmasına yardımcı olmak); İnsanlığın karşılaştığı büyük zorlukları çözmek için araştırmacılara daha iyi araçlar sağlayın.

Konuşma, derin öğrenme patlamasının yükselişiyle başladı: 2010'dan beri, derin öğrenmenin popülaritesi istikrarlı bir şekilde arttı ve Arxiv'de yayınlanan makine öğrenimi makalelerinin büyüme eğilimi şimdi Moore Yasasını aştı. Derin öğrenme, görüntü ve konuşma tanıma ile temsil edilen bir dizi görevde gittikçe daha dikkat çekici sonuçlar elde etti Bu kavram ve teknoloji yeni değil, ancak son birkaç yılda neden büyük bir atılım gerçekleştirdi? Bütün bunlar bilgi işlem gücündeki artıştan kaynaklanıyor, Yeterli bilgi işlem gücüyle, sorunları çözmek için derin öğrenmenin doğruluğu geleneksel yöntemleri büyük ölçüde aşacaktır. .

Amerikan Mühendislik Akademisi tarafından 2008'de listelenen 21. yüzyılın 14 büyük mühendislik probleminden 5'i derin öğrenme ve makine öğrenimi ile çözülebilir, çevre sorunları, kentsel altyapı, Sağlık bakımı ve insan beyninin tersine mühendislik. Jeff Dean'in kendisi de iki madde ekledi: Dil kısıtlamaları olmadan bilgi ve iletişim elde etmenin, esnek ve evrensel bir AI sistemi kurmanın da çok önemli olduğuna inanıyor.Bu iki nokta da derin öğrenme gerektiriyor.

Ardından Jeff Dean, derin öğrenmenin etkinliğini kanıtlamak için zorlu sorunları çözmek için derin öğrenmenin nasıl kullanılacağına odaklanarak Google Brain ekibinin tamamladığı bazı araştırma ve bilgisayar sistemi çalışmalarına odaklandı:

Kentsel altyapıyı iyileştirin Waymo'nun otonom sürüşü, pratik uygulamalara gittikçe yaklaşıyor.

Sağlık bilişiminde Google, diyabetik retina görüntülerini analiz etmek için derin öğrenmeyi kullanır ve algoritmanın doğruluğu doktorlarınkini aşmıştır; yalnızca bu değil, ani kardiyovasküler hastalık riskini tahmin etmek ve insan anatomisi ile hastalık değişiklikleri arasındaki bağlantıyı elde etmek için derin öğrenme retina görüntü analizini kullanır. Bu, insan doktorlarının daha önce bilmediği bir teşhis ve tahmin yöntemidir. Sadece bilim adamlarının daha hedefli hipotezler üretmesine yardımcı olmakla kalmaz, aynı zamanda bilimsel keşif için yeni bir yönü temsil edebilir. Ayrıca Google, elektronik tıbbi kayıtları analiz etmek ve hasta prognozunu tahmin etmek için derin öğrenmeyi kullanmak için en iyi tıp okullarıyla işbirliği yaptı. İyi ön sonuçlar elde edildi.

Diller arası iletişimi ve bilgi paylaşımını teşvik edin Google'ın Nöral Makine Çevirisi (GNMT), GNMT, son on yılın ilerlemesini aşarak birden çok dilde ortalama çevirilerin kalitesini% 50 ila% 80 artırdı ve Google ayrıca TensorFlow'a dayalı kaynak kodunu açtı. Jeff Dean, Google'ın hedefinin 100'den fazla dil çifti arasında çeviri yapmak olduğunu özellikle belirtti. Bu çok karmaşık bir mühendislik problemidir.Farklı dilleri çevirmek için aynı sinir ağı tabanlı modeli kullanmak, mühendisliği büyük ölçüde basitleştirir. İş yoğunluğu.

İnsan beyninin tersine mühendislik açısından , Google ve Max Planck Enstitüsü ve diğer kurumlar, beyin sinir ağının görüntüsünü anlamak ve biyolojik sinir ağını yeniden oluşturmak için işbirliği yapıyor. Şu anda, Max Planck Enstitüsü'nün verilerini kullanarak, araştırmacılar yaklaşık 600 milyar voksel üretti. Ayrıca, ham verileri kullanabilen ve sinir iletimini otomatik olarak izlemek için önceki tahminleri kullanabilen sinir ağlarının oluşumunu simüle eden bir "Taşkın Doldurma Ağları" algoritması önerdiler.

Diğerleri, moleküler özellikleri tahmin etmek için derin öğrenmeyi kullanmayı, daha iyi ilaçlar yapmayı, karbon depolama yöntemleri geliştirmeyi ve nitrojen döngüsünü yönetmeyi içerir ... Bu problemlerin tümü daha iyi bilimsel araçların yardımıyla başarılabilir. Ve bilimsel araçların geliştirilmesine yardımcı olan bu araç, Google'ın derin öğrenme açık kaynak çerçevesi TensorFlow'dur: TensorFlow'un hedefi, herkesin kullanabileceği bir makine öğrenimi platformu olmaktır Evrensel bir platform olun, en iyi platform olun, Sektör iletişimi ve yeniliği daha iyi teşvik etmek.

TensorFlow şu anda dünyadaki en popüler derin öğrenme çerçevesidir ve aynı zamanda Çin'de güçlü bir geliştirici ekosistemine sahiptir. Daha önce, TensorFlow'un geliştirilmesinde yer alan Çinli bir geliştirici Xinzhiyuan'a Google'ın TensorFlow tanıtımının para kazanmak için değil, tamamen teknoloji için olduğuna inandığını söylemişti. "Google, 2017'den önce Çin'de çok fazla etkinlik başlatmadı. Google Çin pazarının çok büyük olduğunu bilse de, birçok işletme kurulamaz. Google'ın bulut işletme sunucusu Çin ana karasında çalışabilse bile, Alibaba gibi yerel rakipler yüzünden. Ucuz bulut bilişim ürünleri satarken bu, Google'ın kâr elde etmesini zorlaştırıyor. Ancak, tüm Çinli geliştiricilerimiz Google'ın Çin'e gelmesini ve daha fazla TensorFlow teknolojisi ve ürünü piyasaya sürmesini bekliyor. "

Google bunu kesinlikle anlıyor ve bu seminer dahil birçok kolej etkinliği, TensorFlow'un kullanıcı tabanını öğrencilere daha da genişletecek.

Son olarak, Google AI başkanı herkesi derin öğrenmeyi kullanmaya çağırdı: "Derin sinir ağlarında ve makine öğreniminde yapılan büyük atılımlar dünyadaki en önemli zorluklardan bazılarını çözüyor; Derin öğrenmeyi düşünmediyseniz, hemen yapmanız gerektiğine neredeyse eminim! "

Li Feifei: Makinelerin insan davranışını anlamasına ve tıbbi çevre bilgisi sağlamasına izin verin

Beş veya altı yıl önce, yapay zekanın şu an olduğundan çok daha az sıcak olduğu zamandan beri Li Feifei, yapay zekanın tıbbi ve sağlık yönlerini keşfetmeye başladı ve bu aynı zamanda her zaman temel araştırmalara odaklanan uygulamalarda attığı bir adım.

Sağlık bakımı insan yaşamı ve yaşam kalitesi ile ilgilidir.Çin ve Amerika Birleşik Devletleri dahil herhangi bir ülkenin hükümeti, her yıl buraya çok sayıda fon ve insan kaynağı yatırımı yapmaktadır. Günümüzde AI, elektronik vaka işleme, tıbbi görüntüler ve genomik analiz dahil olmak üzere tıp alanını etkilemeye başladı.

Li Feifei, Tsinghua-Google AI Sempozyumunda bir açılış raporu sundu

Tıbbi sağlıkta önemli bir sorun noktası, her yıl araba kazalarından daha fazla ölüme neden olan, insan ihmalinden kaynaklanan tıbbi kazalardır. Bununla birlikte, büyük ölçüde, tıbbi bakım hizmetlerinin gerçekleştiği fiziksel çevre, yani hastaneler, klinikler ve bakım evleri gibi doktorlar ve hemşireler arasındaki gerçek temas, insan kazalarının sık olduğu ve AI'nın nadiren dahil olduğu yerlerdir.

Geçmişte, karşı önlemler kısmiydi, her soruna ayrı ayrı hitap ediyordu.Örneğin, bir hasta yataktan kalkabildiğinde korkuluklar kuruldu ve enfeksiyon olasılığı varsa tıbbi personel dezenfektan kullanmaya teşvik edildi ... Ancak böyle bir program genişletilemez.

Yaklaşık 5 yıl önce, Li Feifei ve Stanford'daki öğrencileri ve meslektaşları, sürücüsüz arabalardan ilham aldılar - sürücüsüz arabaların sensörleri çeşitli veriler toplar, çevredeki ortamı algılar ve planlar yapar. Model, tıbbi tedavide kullanılıyor.YZ'yi çevreye koymak ve çevredeki herkesin eylemlerini tanımak, yapay zeka destekli tıbbi sağlık için farklı bir yol açacaktır.

Bu aynı zamanda, Li Feifei'nin "insan odaklı yapay zeka" konusundaki en son uygulaması olan "Yapay zeka destekli sağlık alanlarında ortam zekasına doğru" (Yapay zeka destekli sağlık alanlarında ortam zekasına doğru) Tsinghua-Google AI Sempozyumunda paylaştığı içeriktir.

O ve meslektaşları, bilgisayarla görü ve makine öğrenimini birleştirdi, hastanelerde ve yaşlı bakım tesislerinde veri toplamak için çok sayıda sensör kurdu ve klinik tıp personelinin karmaşık bakımı gerçekleştirmesine yardımcı olmak için gelişmiş algoritmalar ve veri iletimi ve işleme yöntemleri yardımıyla tıbbi çevre istihbaratı sağladı.

"Ortam zekası her yerdedir, ancak insanlar tıpkı odadaki ışık gibi onun varlığını zorlukla algılayabilirler."

Bu araştırmanın anahtarı, aynı zamanda bilgisayar vizyonunun da temel sorunu olan insan davranışının görsel olarak anlaşılmasıdır.

Li Feifei konuşmasında tıbbi çevre zekasını üç açıdan tanıttı: algı, insan davranışını tanıma ve tüm ekolojinin inşası . Algılama açısından Li Feifei, veri toplamak için derinlik ve kızılötesi sensörlerin yanı sıra çapraz sensör takibi ve çeşitli sensörlerden gelen verileri bir 3D alana entegre ederek AI destekli tıbbi alanlarının pilot uygulamasını tanıttı. Bazen tavana yalnızca yukarıdan aşağıya bakan bir kamera kurabilirsiniz, bu da YouTube izleme açısından çok farklıdır ve bu da işleme açısından büyük bir zorluk teşkil eder.

İnsan davranışı tanıma açısından, insan faaliyetlerinin yoğun ve ayrıntılı olarak tanınmasını sağlamak ve etkili hareket algılama gerçekleştirmek için derin öğrenme yöntemlerini kullanırlar. Li Feifei, sağlık personelinin el yıkamasını iyileştirmek için sensörlerle birlikte modern bilgisayarla görme teknolojisinin kullanımına bir örnek verdi. Hastanelerde ölüm oranının en yüksek nedenlerinden biri enfeksiyondur.Geçmişte çözüm, gerçek kişilerden doktor ve hemşirelerden ellerini yıkamak zorunda olup olmadıklarını sormaktı, bu hata yapmak kolay ve maliyetliydi. Tıp personelini ellerini yıkamaya teşvik etmek için davranış algılama ve izleme yöntemlerini kullandılar ve birden çok insan müfettişinden daha iyi sonuçlar elde ettiler.

El yıkama muayenesi: birden fazla insan müfettişi tarafından ortak denetimin etkisinin ötesinde

Araştırmacının amacı, yoğun bakım ünitesindeki tüm davranışları tespit etmek, zamansal alandaki video verilerine dikkat etmek ve sağlık personeline çalışmalarında yardımcı olmaktır.

Ayrıca Li Feifei, tıbbi bilgileri daha geniş bir klinik veri ekosistemine entegre etmenin çalışma ve gelecekteki yönlerini de tanıttı. Koşullar nedeniyle, düşme, yaralanma ve hatta ölüm görüntüleri gibi belirli tıbbi büyük verileri toplayamıyoruz. Bu nedenle, büyük verinin mevcut olmadığı varsayımı ile çalışmak gerekir. Şu anda Li Feifei ve meslektaşları, ilgili verileri oluşturmak için YouTube videolarına tıbbi bilgileri eklemek için aktarım öğrenimini kullanıyor ve iyi ön sonuçlar elde ettiler.

Li Jia: Kurumsal AI, gerçek sorunları çözmek için sınırlı veriler kullanıyor

Google Cloud AI Ar-Ge başkanı ve Google AI China Center başkanı Li Jia, kurumsal yapay zeka hakkında bir rapor verdi ve gerçek dünyadaki sorunları çözmek için yapay zeka kullanımının bazı örneklerini paylaştı.

Kurumsal AI eğitiminin arka planı, kurumsal ortamın birçok AI araştırma konusu sağlamasıdır. Genel izlenim, sektörün çok fazla veriye sahip olduğudur, ancak aslında sağlık hizmetleri, nadir hastalıklar, doğal afetler vb. Senaryolarda büyük veri araştırması yapmak için yeterli veri yoktur.

Ek olarak, gerçek dünyada çok sayıda gürültülü, etiketlenmemiş veri vardır. Aksine, akademik araştırmalarda temiz, iyi etiketlenmiş veriler sıklıkla kullanılır. Bu nedenle, akademinin sonuçları çoğu zaman gerçek dünya uygulamalarına iyi aktarılmaz. Sadece bu değil, akademinin sonuçları genellikle sadece tahminlerdir ve pratik uygulamalar, özellikle tıbbi ve hukuki konular söz konusu olduğunda, sonuçların yorumlanmasını gerektirir.

Li Jia, ağırlıklı olarak gürültülü verilerden öğrenme, yorumlanabilir makine öğrenimi ve aktarım öğrenimi dahil olmak üzere aktif araştırma alanlarını paylaştı.

Li Jia, kendisinin ve diğer Google meslektaşlarının göğüs hastalıklarını teşhis etmek ve bulmak için Syracuse Üniversitesi ve Ping An Teknolojisi ile işbirliği yaptığı bir vakaya odaklandı. İlgili makaleler CVPR 2018'de yayınlandı.

Göğüs hastalığı ciddi bir sorundur. Hastaların yaklaşık% 10'u ölecek ve radyologların tanılarının% 4'ü büyük hatalar içeriyor. Bu problem nasıl çözülür?

Bilgisayarla görmeyle ilgili araştırmalarda, radyolojik görüntülerde anormallikleri doğru bir şekilde belirlemek ve bulmak, klinik tanı ve tedavi planlamasının vazgeçilmez bir parçasıdır. Bununla birlikte, bu görevler için son derece doğru tahmin modelleri oluşturmak genellikle çok sayıda manuel etiketleme ve anormal konumlara sahip görüntüleri bulmayı gerektirir ve açıklama verilerini elde etmenin maliyeti yüksektir.

Çalışmalarının önemi, Yalnızca az miktarda konum ek açıklaması gerekir ve ayrıca radyologlara yorumlanabilir AI tanı sonuçları sağlar Böylece doktorlar bu bilgileri entegre ederek daha iyi ve daha kapsamlı teşhis ve tedavi görüşleri alabilirler.

Aynı zamanda hastalıkları tanımlamak ve bulmak için birleşik bir yöntem önerdiler. Yöntemleri, sınıflandırma ve tanımayı görüntü düzeyi yerine yama düzeyinde gerçekleştirir, sınıf bilgilerini ve sınırlı konum açıklamalarını etkili bir şekilde kullanabilir ve sınıflandırma ve yerelleştirme görevlerinde karşılaştırmalı referans taban çizgisinden önemli ölçüde daha iyidir.

Bill Freeman: Konuşmayı anlamayı desteklemek için görsel bilgileri kullanın

İkinci günün açılış konuşmacısı, Google araştırma bilimcisi ve MIT profesörü Bill Freeman oldu. Konusu "Bakışla Dinle: Vizyon Yoluyla Konuşma Anlayışını Teşvik Etmek" idi.

İnsanlar, insan konuşmasını son derece tanıyabilir ve anlayabilir.Çok sayıda insan aynı anda gürültülü bir ortamda konuşsa bile, kimin ne dediğini anlayabilirler. Bilgisayarlar için bu görev hala çok zordur.

Son zamanlarda, Profesör Freemanın ekibi Bilgisayarın "görmesine", yani hoparlörü gözlemlemesine izin vererek konuşma tanımaya yardımcı olur , Bu, bilgisayar dili tanıma performansını büyük ölçüde artırır. Aslında, bu aynı zamanda insanların konuşma tanımada sıklıkla kullandığı yöntemdir. "Kokteyl Partisinde Dinlemeye Bakmak" araştırma makaleleri SIGGRAPH 2018 tarafından kabul edildi.

Bu araştırmanın başlangıç noktası, MIT araştırmacılarının video bilgisinin aslında bir "görsel mikrofon" görevi görebileceğini keşfetmesiydi. Masanın üzerinde bir torba patates cipsi, yanında müzik çalarak ve yüksek hızlı bir kamera tarafından yakalanan patates cipsi çantasını gözlemleyerek, çantanın titrediğini ve ses bilgisinin çıkardığını görebilirsiniz.

Bu temelde, Profesör Freeman liderliğindeki Google Araştırma ekibi, videolar oluşturmak ve diğer tüm sesleri bastırırken belirli karakterlerin sesini güçlendirmek için görsel bilgileri kullanmak için hesaplamaları kullandı. Bu yöntem, tek bir ses parçasına sahip sıradan videolar için uygundur.Tüm kullanıcıların, dinlemek istedikleri videodaki kişinin yüzünü seçmeleri veya bağlama göre algoritmik olarak böyle bir kişiyi seçmeleri yeterlidir.

Aynı anda iki veya daha fazla kişinin konuştuğu bir video girişi yapan bir algoritma tasarladılar ve algoritma, seçilen kişinin sesini çok net bir şekilde verebilir.

"Kokteyl Etkisi" belgesinde önerilen sinir ağına dayalı çoklu veri akışı mimarisi

Konuşma tanıma, konferans transkripsiyonu ve video konferans gibi senaryolarda büyük uygulama potansiyeline sahip olan bu teknolojiye Looking to Listen adını veriyorlar.

Profesör Freeman'ın ekibi daha önce "görmek ve dinlemenin" yanı sıra "İşitmekten görmeye" Araştırma, yani Sesten Görmeyi Öğrenmek. Bir çalışmada, ortam sesinin görsel modelleri öğrenmek için denetleyici bir sinyal olarak kullanılabileceğini gösterdiler. Video karesiyle ilişkili sesin istatistiksel özetini tahmin etmek için evrişimli bir sinir ağını eğittiler ve ağ, bir nesne (nesne) ve sahne hakkındaki ses bilgilerinin temsilini öğrendi.

Deniz kenarı ve nehir kenarı gibi benzer ses özelliklerine sahip videoların görsel bilgiler çok farklı olmasına rağmen Network Society'nin ses sinyali alanında çok benzer oldukları ortaya çıktı.

Bu süreç sayesinde ağ, bir nesne (nesne) ve sahne hakkındaki ses bilgilerinin temsilini öğrenir. Deneysel sonuçlar, bu yöntemin performansının, diğer denetimsiz öğrenme yöntemleriyle karşılaştırılabilir olduğunu göstermektedir.

Görüntü, sese bir tamamlayıcıdır, Bir modaliteden (görüntüler gibi), başka bir modalitenin (konuşma gibi) analizinden elde edilmesi zor veya imkansız olan bazı bilgiler elde edilebilir. Tersine . Görsel ve sesli sinyalleri bu şekilde birleştirerek birbirlerini tanıtabilirler. Ek olarak, hangi görsel sinyallerin eğitim süreci sırasında belirli ses sinyallerini tespit etmeye yardımcı olabileceğini belirlemek mümkünse, konuşma tanımanın etkisini daha da artıracaktır.

Çin akademisi ve endüstrisi dış dünyaya açık, Google bu fırsatı değerlendiriyor ve aktif olarak Çin'e dönüyor

Bugün, yapay zekanın gelişimi verilerden, yeteneklerden ve pazarlardan ayrılamaz ve Çin en zengin büyük veriye, en büyük pazar talebine ve giderek olgunlaşan yapay zeka yeteneklerine sahiptir.

Google elbette bunun farkındadır. Bir AI Çin Merkezi kurmanın yanı sıra, stratejisi çoktan geçtiği için "AI First" olan bu şirket Akademik işbirliği, kurumsal yatırım ve ortak laboratuvarların kurulması gibi çeşitli araçlar , Eğri Çin pazarına geri dönüyor ve varlığı güçleniyor.

31 Mayıs'ta Google, Şanghay'daki Fudan Üniversitesi ile Fudan Üniversitesi-Google Teknoloji İnovasyon Laboratuvarı'nın kurulduğunu ve stratejik bir ortaklık kurduğunu duyuran iki yıllık bir işbirliği anlaşması imzaladı. Bu kez imzalanan sözleşmeye göre Google, Fudan Üniversitesi'nin yapay zeka, veri bilimi, mobil uygulamalar ve yenilikçi teknoloji ortak laboratuvarlarının inşası gibi gelişmekte olan teknoloji alanlarındaki kurslarını desteklemeye odaklanacak, Fudan'ın yeni mühendislik konularının inşasını ve geliştirmesini teşvik edecek ve yenilik ve girişimcilik eğitimi reformlarının uygulanmasını teşvik edecek. Birinci sınıf yenilikçi yetenekler geliştirin.

18 Haziran'da Google, JD.com'a 550 milyon ABD doları yatırım yapacağını ve ikincisinden% 0,93 hisse elde edeceğini duyurdu. İki taraf, JD'nin lojistik ve tedarik zinciri avantajlarını Google'ın teknik avantajlarıyla birleştirerek perakende altyapısını ortaklaşa geliştirmek ve sağlamak için stratejik bir işbirliğine ulaştı. Alışveriş deneyimini daha iyi kişiselleştirin ve Güneydoğu Asya dahil olmak üzere birçok pazardaki anlaşmazlığı azaltın.

Aslında JD, Google'ın (Alphabet) son üç yılda Çin'de yatırım yaptığı beşinci şirkettir. Kamuya açık bilgilere göre, diğer 4 şirket: 2015 yılında, yatırım istemek için çıktı; Aralık 2017'de, 500 milyon yuan tutarında lider canlı yayın platformu dokunaç; Ocak 2018'de, AI tıp araştırma ve geliştirme şirketi Jingtai Technology'ye yapılan yatırım; 2018 Nisan 2008'de, Alphabet'in bir fonu olan CapitalG, 900 milyon ABD Dolarından fazla sermayeli bir Çin karayolu lojistik internet platformu olan Manbang Group'a yatırım yaptı.

Bu şirketlerin hepsi hızla gelişen ve AI alanında farklı yollarda görece lider şirketler. Google, onlara stratejik yatırım yaparak, teknolojileri ve hizmetleri ihraç ederken ve kaynakları paylaşırken Çin pazarını daha iyi anlayabilir. , Çin anakarasına daha esnek bir şekilde dönüşünün önünü açıyor.

Çin, yapay zekanın geliştirilmesini şiddetle destekledi. Devlet Konseyi "Yeni Nesil Yapay Zeka Geliştirme Planı" nı yayınladı ve Sanayi ve Bilgi Teknolojileri Bakanlığı "Yeni Nesil Yapay Zeka Endüstrisinin Gelişimini Teşvik Etmek İçin Üç Yıllık Eylem Planı (2018-2020)" yayınladı. Çinin akademi, eğitimi ve endüstrisi sürekli olarak dış dünyaya açılma mesajını yayınlıyor ve Google şüphesiz bu noktayı doğru bir şekilde kavradı ve kavradı. .

Yetenek savaşını daha da yoğunlaştırın: Google Çin'in yapay zeka meslek okulu, yıllık 560.000 maaş alıyor

Çinin yapay zeka yetenekleri için, Google'ın bir dizi değişim ve etkileşim kesinlikle çok güçlü bir cazibe merkezi ve güçlü bir yardımdır, ancak aynı zamanda Çin'in yapay zeka yetenekleri için zaten şiddetli rekabeti yoğunlaşsın Çinli teknoloji şirketleri, hatta BATJ gibi devler yetenekleri çekmek için daha zor olacak.

Kolejlerin sonbaharda işe alınması vesilesiyle, 2018 İnternet okulu işe alımının yüksek maaşının bir listesi internette geniş çapta dolaşıma girdi ve bu, birçok mezun ve İnternet uygulayıcısının dikkatini çekti. Bunlar arasında, Google'ın Çin'deki yapay zeka pozisyonunun maaşı, yıllık 560.000 yuan maaşla listenin başında yer alıyor.

Zaten yükselen yapay zeka araştırmacılarının ve mühendislerinin fiyatı daha yüksek olacak mı?

Topluluğa katıl

Xinzhiyuan AI teknolojisi + endüstri topluluğunun işe alımında, AI teknolojisi + endüstrisiyle ilgilenen öğrenciler küçük bir WeChat asistanı hesabı ekleyebilirler: aiera2015_3 Gruba katılın; incelemeyi geçtikten sonra sizi gruba katılmaya davet edeceğiz. Topluluğa katıldıktan sonra, grup açıklamalarını değiştirmelisiniz (isim-şirket-pozisyon; profesyonel grup incelemesi katıdır, lütfen anlayın).

Polisi seyretmek isteyen netizenler, polis çağrısına cevap verip sarhoş arabayı kontrol edin, haykırıyor, işte tüm düzenlemeler!
önceki
Mayıs günü! Gizem ve çekicilikle dolu Hindistan, ömür boyu bir kez gitmeli!
Sonraki
TensorFlow girişi için mutlaka görülmesi gereken: Google AI stajyer deneyimi konuşması
İçinde bir şey var ve güvenlik var, 70 ila 110.000 yuan SUV seçeneği, bu araba varoluş duygusuyla dolu
"Çin 24 Saat" ekranı, vatan çok güzel!
Son 5 yılda en popüler makine öğrenimi belgeleri + hızlı kod kontrolü
Kutsanmış hayranlar! Çin Süper Ligi Karısı Grubu "güçlü destek" ekliyor, Carrasco'nun karısı Yan Varga ile dövüşüyor
Han Han tarafından filme taşındı! "Zhe" bir ilçe şehridir ve yerel halk tarafından tanıtılan eski dükkanlar halka açık yorumlarda popüler değildir
Opel tekrar mülkiyetini değiştirdi, GM onu PSA'ya mı satmak istiyor?
Şiir l Memleket yakınlarında daha çekingenim, insanlara sormaktan korkuyorum
Dalian Yifang, Çin Süper Ligi'ne meydan okuyan Çin Süper Ligi'nin yeni kutbu olmak için arka arkaya üç yıldızla anlaşma imzaladı
Dünyanın lezzetli yemeklerini yemem için birisinin bana eşlik etmesini bekleyin!
Yüksek hızlı sollama şeridinde geri gitmeye nasıl cüret edersiniz? ? ? Ders çok acı verici!
Para hazır, eski bir şoför gibi görünmek için bir araba aldığınızda ne yaparsınız? Çevrimiçi vb.
To Top