Jeff Dean tekrar yazıyor: Tümünü tek bir makalede okuyun. 2019 Google AI atılımı

Google'ın araştırma ekibi için 2019 heyecan verici bir yıl. Google Research, temel bilgisayar bilimi araştırma sonuçları ve yayınlarının yanı sıra Google'ın yeni gelişen alanlarına (sağlık hizmetleri ve robotik gibi) uygulanan bir dizi çalışma, açık kaynak yazılım katkıları ve Google ürün ekibiyle işbirliği dahil olmak üzere çeşitli şekillerde teknik araştırmayı teşvik eder. Tümü yararlı araçlar ve hizmetler sağlamayı amaçlayan yakın işbirliği. Daha sonra, 2019'da Google Research tarafından yapılan bazı çalışmalara odaklanacağız.

Google Research'ün misyonu, insanların günlük yaşamına büyük fayda ve kolaylık sağlamak için her türlü uzun süredir devam eden ve önemli sorunları çözmektir. 2019 yılında, bu hedefe ulaşmaya devam etmek için, araştırma sonuçlarını sağlık ve robotik gibi gelişmekte olan alanlara uygulamaya başlamak, büyük miktarda kod açık kaynak yapmak ve Google ürün ekibiyle işbirliğine devam etmek gibi çok çeşitli temel araştırma alanlarında bir dizi ilerleme kaydettik. Kullanıcıların duymayı seveceği çeşitli araçlar ve hizmetler oluşturmak için birlikte çalışın.

2020 yılı geldi.Geçtiğimiz yıl yapılan araştırmaları gözden geçirmemiz ve önümüzdeki birkaç yıl içinde daha da çözülmesi gereken sorunları dört gözle beklememiz gerektiğini düşünüyorum. Bu düşünce doğrultusunda, bu makaleyi, 2019'da Google araştırmacıları ve mühendisleri tarafından yapılan temel araştırma çalışmalarını sıralamak için kullanmayı umuyoruz.

AI teknolojisinin etik kullanımı

2018'de, ürün içi makine öğrenimi ve diğer teknolojileri değerlendirmek için bir dizi çerçeve oluşturmayı amaçlayan bir dizi yapay zeka ilkesi yayınladık. Haziran 2019'da, araştırma ve ürün geliştirme yaşam döngüsü boyunca bu ilkelerin nasıl uygulamaya konulacağını açıklamayı umarak bir başka önemli güncelleme yayınladık. Bu ilke, yapay zeka ve makine öğrenimi araştırma topluluğunda daha geniş bir aktif alan yelpazesini içerdiğinden (makine öğrenimi sistemlerinde önyargı, güvenlik, adalet, hesap verebilirlik, şeffaflık ve gizlilik gibi), kullanabilmeyi umuyoruz. Her alandaki en ileri teknoloji, ilgili teknolojik yeniliği önemli ölçüde teşvik etmek için araştırma sonuçlarımızla birleştirildi.

Örneğin, bu yıl boyunca:

  • Çoklu bulut AI ürünlerimiz için Model Kart sağlamaktan sorumlu şeffaflık araçlarıyla ilgili bir araştırma raporu yayınladı. Ayrıca, bulut AI görüş API'si nesne algılama için bir Model Kart örneği gösterdik.

İlgili bağlantı: https://research.google/pubs/pub48120/

  • Aktivasyon Sınıflarının sinir ağı davranışını keşfetmeye ve makine öğrenimi modellerinin yorumlanabilirliğini iyileştirmeye nasıl yardımcı olabileceğini gösterir.
  • Makine öğrenimi modeli eğitiminde farklı gizlilik koruma mekanizmalarını tanıtmak için kullanılan açık kaynak kod kitaplığı olan TensorFlow Pirvacy yayınlandı.
  • Makine öğrenimi uygulayıcılarının makine öğrenimi modellerinde haksız veya beklenmedik etki faktörlerini keşfetmelerine yardımcı olmayı umarak Adillik Göstergelerinin beta sürümünü duyurun.

What-If Aracında bu bölümün tüm ilgili veri noktalarını görüntülemek için Adalet Göstergelerinde karşılık gelen sütun bölümünü tıklayın. Yukarıdaki örnekte, "dişi" etiketli tüm veri noktaları gösterilmektedir.

  • KDD'19'da, makine öğreniminin adaletini iyileştirmek için ikili karşılaştırma ve düzenlileştirmenin büyük ölçekli bir üretim öneri sisteminde nasıl birleştirileceğine dair bir makale yayınladı.
  • Ağırlıklı olarak makine öğrenimi araştırmalarında üretim sınıflandırma sisteminin adilliğini nasıl sağlayacağımızı tartışan ve aynı zamanda kullandığımız adalet endeksini -yani, eşit fırsat önceliği altında dağıtımı vurgulayan koşulların eşitliğini açıklayan AIES'19 hakkında bir makale yayınladı. fark.
  • Metin sınıflandırmasındaki gerçeklere aykırı olan adaleti nasıl sağlayacağımızı tartışmak için AIES'19 hakkında bir makale yayınladı. Rapor şu soruyu gündeme getiriyor: "Örneklerde belirtilen hassas özellikler değişirse, tahmin sonuçları nasıl etkilenecek?" Buna dayanarak, çevrimiçi kötü içerik incelemesi için üretim sistemini iyileştirmeyi umuyoruz.
  • Sahte deepfake'lerin belirlenmesine yardımcı olmak için yeni bir veri seti yayınlandı.

Topluma fayda sağlayan yapay zeka teknolojisi

Makine öğrenimi, çeşitli önemli sosyal sorunları çözmede büyük bir potansiyele sahiptir. Ayrıca, insanların daha fazla sorunu çözmek için makine öğreniminin yaratıcılığını ve teknolojik başarılarını kullanmalarına yardımcı olmayı taahhüt ederek bu alanı araştırıyoruz. Seller, her yıl yaklaşık 250 milyon insanı etkileyen, gezegendeki en yaygın ve ölümcül doğal afetlerdir. Daha doğru sel tahminleri yapmak için makine öğrenimi, hesaplamalar ve daha kaliteli veri kaynakları kullanıyoruz ve ardından afet bölgesindeki tüm sakinlerin cep telefonlarına uygulanabilir uyarılar gönderiyoruz. Ayrıca, sel tahmini, hidroloji ve makine öğrenimi alanlarında uzman birçok araştırmacıyı, sel önleme ve yönetişimle ilgili önemli bir konuda daha fazla işbirliği olasılığını tartışmak üzere Google ile bir araya gelmeye davet eden bir seminer düzenledik.

Sel tahmin çalışmalarına ek olarak, dünyadaki çeşitli vahşi yaşamı daha iyi anlamak için teknolojiler geliştiriyoruz. Şu anda, farklı balina türlerini ve kayıtlı videoları keşfetmelerine yardımcı olmak için Ulusal Okyanus ve Atmosfer İdaresi ile işbirliği içinde, kameralar tarafından yakalanan vahşi yaşam verilerini analiz etmeye yardımcı olmak için makine öğrenimi teknolojisini kullanmak üzere yedi vahşi yaşamı koruma kuruluşuyla birlikte çalışıyoruz. Sualtı sesi. Ayrıca, makine öğrenimine dayalı daha yeni biyoçeşitlilik araştırması türlerini gerçekleştirmek için bir dizi araç oluşturduk ve yayınladık.

Gana'nın Accra kentinden Google araştırmacıları, 6. İnce Görsel Sınıflandırma Sempozyumu kapsamında, manyok hastalığı sınıflandırması hakkında ortaklaşa bir rapor hazırlamak için Makerere Üniversitesi'nin AI ve Veri Bilimi Araştırma Grubu üyeleriyle işbirliği yaptı. Kaggle rekabeti. Manyok, Afrika'daki en büyük ikinci karbonhidrat kaynağıdır, bu nedenle bu tür bitkilerin sağlığı Afrika'daki gıda güvenliği ile ilgilidir. 87 takımdan 100'den fazla yarışmacının bu yarışmaya katıldığını görmekten çok mutluyuz.

2019'da ayrıca, insanların son 35 yılda dünyanın nasıl değiştiğini daha verimli ve sezgisel olarak gözlemlemelerine olanak tanıyan Google Earth Timelapse'ı da güncelledik. Buna ek olarak, şehir planlamacılarına karbon emisyonlarını azaltmak ve çevresel verimliliği artırmak için referans bilgileri sağlamak amacıyla insan hareketliliğiyle ilgili verileri düzenlemek için yeni gizlilik koruma yöntemlerini kullanmayı umarak akademik araştırmacılarla işbirliği yapıyoruz.

Çocukların eğitimini geliştirmek için makine öğrenimini de kullanıyoruz. Birleşmiş Milletler, dünyada hala temel okuryazarlık becerilerine sahip olmayan 617 milyon çocuk olduğuna ve bu çocukların gelecekteki yaşam kalitelerini doğrudan belirleyeceğine inanıyor. Daha fazla çocuğun okumayı öğrenmesine yardımcı olmak için Bolo uygulamamız, öğrencilere gerçek zamanlı olarak rehberlik etmek için ses tanıma teknolojisini kullanır. Kullanım engelini azaltmak için, düşük kaliteli telefonlarda çevrimdışı çalışabilmesini sağlamak için uygulamayı optimize ettik. Hindistan'da Bolo, 800.000 çocuğun hikaye okumasına ve 1 milyar kelime okumasına yardımcı oldu. İlk sonuçlar cesaret vericidir: Hindistan'ın 200 köyünde üç aylık bir pilot uygulamadan sonra, okuma becerilerini geliştiren katılımcıların yüzdesi% 64'e ulaştı.

Daha büyük öğrenciler için Sokratik uygulama, lise öğrencilerinin matematik, fizik ve konu eğitimiyle ilgili 1000'den fazla karmaşık sorunu çözmelerine yardımcı olabilir. Bu uygulama, fotoğraflara ve sözlü sorulara dayalı olarak soruyla ilgili temel kavramları otomatik olarak tanımlayabilir ve en uygun çevrimiçi kaynaklara bağlanabilir. Sokratik'in eğitim modeline benzer şekilde, Sokratik uygulama sorulara doğrudan cevap vermez, ancak öğrencilere cevapları kendi başlarına keşfetmeleri için rehberlik eder. Bolo ve Sokratik gibi programlar aracılığıyla dünya çapında eğitim kalitesini teşvik edebildiğimiz için çok mutluyuz.

Ayrıca, kazanana Google.org'dan 25 milyon dolarlık hibe vermeye karar verdik. Toplumun tepkisi çok büyüktü ve 119 ülkeden 2.600'den fazla dikkatle planlanmış teklif aldık. Sonunda, 20 kuruluş, büyük sosyal ve çevresel sorunları çözme potansiyellerine dayanarak ilk alıcı grubumuz olarak ortaya çıktı. Getirdikleri mükemmel çözümleri öğrenelim:

  • Sınır Tanımayan Doktorlar Vakfı (MSF), kaynak alanındaki klinik personelinin (şu anda Ürdün'de denemeler yapıyor) antimikrobiyal görüntüleri analiz etmesine ve uygun olduğunda antibiyotik kullanımını önermesine yardımcı olmak için görüntü tanıma araçlarını kullanan ücretsiz bir akıllı telefon uygulaması geliştirmeyi umuyor. Belirli hastaların enfeksiyon probleminin çözülmesi önerilir.
  • Halihazırda 1 milyardan fazla insan halen perakende hane halkı şeklinde tarım işleriyle uğraşmaktadır. Bir haşere istilası tüm ekinleri ve hatta geçim kaynaklarını yok edecektir. Wadhwani AI, zararlıları tanımlamak için görüntü sınıflandırma modellerini kullanıyor ve ardından pestisit seçimi ve püskürtme zamanlamasıyla ilgili önerilerde bulunuyor ve sonuçta çiftçilerin mahsul verimini artırmasına yardımcı oluyor.
  • Tropikal yağmur ormanlarının derinliklerinde, yasadışı ağaç kesimi her zaman iklim değişikliğini etkileyen önemli bir faktör olmuştur. Rainforest Connection, biyolojik ses izleme için derin öğrenmeyi kullanır ve tropik yağmur ormanlarının sağlığını izlemek ve tehdit edici faaliyetleri tespit etmek için eski cep telefonlarının kullanılmasını destekler.

AI teknolojisinin diğer alanlarda uygulanması

AI teknolojisinin diğer alanlarda uygulanması da dikkatimizin odak noktasıdır. Çok taraflı işbirliği yoluyla çok sayıda makale yayınladık. 2019'daki önemli sonuçlar şunları içerir:

  • "Sinek Beyninin Etkileşimli ve Otomatik 3 Boyutlu Yeniden Yapılandırılması" makalesinde, bir dizi makine öğrenme modeli geliştirdik ve her bir nöron aracılığıyla sinek beyninin tüm yapısını haritalandırıp izledik.

Kağıt adresi: https://ai.googleblog.com/2019/08/an-interactive-automated-3d.html

  • "Kısmi Diferansiyel Denklemler (PDE) için Daha İyi Modelleme Yöntemlerini Keşfetme" bölümünde, iklim bilimi, akışkanlar mekaniği, elektromanyetik, ısı iletimi ve diğer çeşitli genel temel hesaplama problemlerine yönelik PDE hesaplamalarını hızlandırmak için makine öğreniminin nasıl kullanılacağını gösterdik. Verimlilik iyileştirmeleri getirin.

Kağıt adresi: https://ai.googleblog.com/2019/07/learning-better-simulation-methods-for.html

  • Doğadaki koku faktörlerini "Koku Öğrenme: Moleküllerin Koku Özelliklerini Tahmin Etmek İçin Derin Öğrenmeyi Kullanma" aracılığıyla araştırdık. Herhangi bir yapay kural koymadan tek bir molekülün koku tanımlayıcısını doğrudan tahmin etmek için Graph Neural Network'ün (GNN) nasıl kullanılacağını gösterdik.

Kağıt adresi: https://ai.googleblog.com/2019/10/learning-to-smell-using-deep-learning.html

  • Kimyayı takviye öğrenme teknolojisiyle birleştirebilen bir moleküler optimizasyon çerçevesi öneriyoruz.
  • Makine öğrenimi ayrıca, sanat ve yaratım alanında atılımlar yapmamıza yardımcı olabilir. Sanatçılar, yapay zeka ve artırılmış gerçekliği birleştirerek makine dansı, koreografi ve yeni melodiler oluşturmak için makine öğrenimi araçlarının kullanımı dahil olmak üzere yeni çalışma biçimleri yaratmanın yollarını keşfettiler. Günümüzde acemiler bile makine öğrenimi teknolojisini kolayca kullanabilir. J.S. Bach'ı anmak için, makine öğrenimi teknolojisiyle desteklenen, doğaçlama bir not oluşturma aracı geliştirdik: melodi yaratıldığı sürece, araç Bach'ın tarzında eşleşen bir uyum üretebilir.

Yardımcı teknoloji

Makine öğrenimi, günlük yaşamlarımız için daha kişiselleştirilmiş yardım sağlayabilir. Güzel görüntüler izlemek, en sevdiğim şarkıları dinlemek veya arkadaşlarla ve aileyle konuşmak hayatımızın önemli parçalarıdır. Bununla birlikte, milyarlarca insanı birbirine bağlamak için, bu tür sezgisel bağlantı açıkça imkansızdır. Makine öğrenimi teknolojisi bu görsel, işitsel ve sesli sinyalleri diğer sinyallere dönüştürebilir ve insanların birleşik yönetim altında çevredeki ortama erişme becerilerini geliştirebilir. Yıl içinde başlattığımız yardımcı teknolojiler şunları içerir:

  • Lookout, görme engelli veya az gören kullanıcıların çevredeki bilgileri tanımasına yardımcı olur. Google Lens'e benzer temel bir teknolojiyi kullanarak, hedef nesneleri aramak ve onlarla etkileşim kurmak için telefonu etrafına çevirmemizi sağlar.
  • Canlı Altyazı'nın sağır veya işitme güçlüğü çeken kişilere günlük iletişimde daha bağımsız ve daha rahat yardımcı olması beklenmektedir. Karşı taraf başka bir dil kullanıyor olsa bile, kullanıcı içeriği anında yazıya dökebilir ve anlaşılması kolay bir forma çevirebilir.
  • Kişiselleştirilmiş konuşmadan metne transkripsiyondan sorumlu Euphonia Projesi. ALS'den ve belirsizliğe veya yanlış telaffuza neden olabilecek diğer sorunlardan muzdarip kullanıcılar için, bu çalışmada sağlanan otomatik konuşma tanıma (ASR) modelinin gerçek etkisi, benzer çözümlerin çok ötesinde.
  • Project Euphonia'ya benzer şekilde, Parrotron, kullanıcıların iletişimi geliştirmesine yardımcı olmak için uçtan uca sinir ağlarını kullanır, ancak esas olarak otomatik konuşmadan sese dönüştürme (transkripsiyon değil) için. Parrotron, daha fazla kullanıcı tarafından daha kolay kullanım için bir ses arabirimi sağlar.
  • Şu anda İnternette altyazısız milyonlarca resim var. Google tarafından sağlanan resim açıklaması, görme engelli veya az gören kullanıcıların bu işaretlenmemiş resimleri anlamasına yardımcı olabilir. Bir ekran okuyucu eşleşen açıklaması olmayan bir resim veya grafik bulduğunda, Chrome tarayıcısı artık otomatik olarak bir açıklama oluşturabilir.
  • Okuryazar olmayan kullanıcıların metnin içeriğini daha sorunsuz anlamasına yardımcı olabilecek, görsel metni sesli formatta okumak için bir araç olan Les for Google Go'yu geliştirdik.

Telefonunuzu daha akıllı hale getirin

İşimizin çoğu, kişisel cihazların akıllıca geliştirilebilmesi için makine öğrenimi teknolojisi yoluyla cep telefonları için daha fazla yeni işlev sağlamaktır. Cep telefonlarında çalışabilen güçlü bir model geliştirerek, çeşitli geleneksel cep telefonu işlevlerinin daha güçlü yanıt verme özelliğine sahip olmasını sağlayabiliriz ve hatta normal olarak uçuş modunda veya rüzgar kesildiğinde bile kullanılabilir. Şu anda, cep telefonlarında çalışabilen doğru konuşma tanıma modelleri, görsel modeller ve el yazısı tanıma modelleri geliştirdik ve bu, gelecekte daha güçlü yeni özelliklerin ortaya çıkmasının önünü açtı. 2019'daki önemli başarılarımız şunları içerir:

  • Cep telefonlarının otomatik altyazı oluşturma işlevini gerçekleştirmek için Canlı Altyazı kullanın; bu, cihazda oynatılan tüm videolar için her zaman transkripsiyon altyazıları sağlayabilir.

  • Kullanıcıların ses bilgilerini indekslemesine ve ses içeriğini doğrudan almasına yardımcı olabilecek yeni ve güçlü bir Kaydedici transkripsiyon uygulaması geliştirdi.
  • Google Çeviri'de fotoğraf çeviri işlevini iyileştirin. Metnin anlaşılamayan belirli bir bölümünü işaret edebiliriz ve sistem bunu bağlama göre hemen çevirir.

  • ARCore'da Artırılmış Yüzler API'sini yayınlayarak daha fazla yeni gerçek zamanlı AR öz temsil aracı mümkün kılın.

  • Cihazda gerçek zamanlı el izleme işlevini göstererek kullanıcılara yeni bir hareket etkileşimi ve cihaz kontrolü yolu sağladı.

  • RNN'ye dayalı ekran üstü yumuşak klavyenin el yazısı tanıma etkisini iyileştirin.
  • Kullanıcıların mevcut konumlarını daha doğru bir şekilde bulmalarına yardımcı olmak için akıllı telefon kameralarını kullanan ve hedefe giden yolu kolayca bulmamızı sağlayan küresel bir navigasyon yöntemi yayınlayın.

Birleşik öğrenme, 2015 yılında Google araştırmacıları tarafından icat edilen güçlü bir makine öğrenimi yöntemidir. Yardımıyla, birçok müşteri (bireysel kullanıcılar veya hatta tüm işletme gibi), eğitim verilerinin dağılımını korurken modelleri işbirliği içinde eğitebilir. Bu şekilde, büyük ölçekli öğrenme sistemlerinde gizlilik özelliklerini etkili bir şekilde koruyabiliriz. Bugün, kendi ürün ve işlevlerimizde ortak öğrenmeyi giderek daha fazla kullanıyoruz ve aynı zamanda bu alandaki birçok araştırma çalışmasının geliştirilmesini teşvik etmek için çok çalışıyoruz. 2019'da Google araştırmacıları, bu teknolojinin son birkaç yıldaki ilerlemesine ve hala var olan açık araştırma sorunlarına odaklanarak ortak öğrenim üzerine bir makale yazmak için 24 akademik kurumdan bilim insanlarıyla işbirliği yaptı.

İlgili bağlantı: https://arxiv.org/abs/1912.04977

Son birkaç yılda, bilgi işlem görüntülemedeki gelişmeler, akıllı telefonların görüntü kalitesinde büyük gelişmeler sağladı ve 2019 da bir istisna değil. Yıl boyunca, profesyonel düzeyde alan derinliği görüntü işleme işlevleri sunarak özçekimleri bir sonraki düzeye taşıdık ve ayrıca Pixel Phone'daki Night Sight işlevi aracılığıyla astronomik fotoğraflar çekmeyi mümkün kıldık. Bu çalışmanın daha teknik ayrıntıları için lütfen "Çok kareli süper çözünürlük ve aşırı düşük ışık koşullarında mobil fotoğrafçılık" makalemize bakın. Çalışmamızın tek bir amacı var - herkesin güzel fotoğraflar çekmesine ve hayattaki her büyülü anı anmasına yardımcı olmak.

sağlık

2018'in sonunda, Google Health'i oluşturmak üzere Google Research Institute sağlık ekibi Deepmind Health ve Google'ın donanım departmanından (sağlıkla ilgili uygulamalara odaklanan) bir ekibi birleştirdik. 2019 yılında, bu alandaki araştırmaları ilerletmeye devam ettik, birçok tıbbi ortakla araştırma makaleleri yayınladık ve çeşitli araçlar geliştirdik. Geçtiğimiz yıl yaşanan önemli olaylara bir göz atalım:

  • Mamogramları analiz etmek için derin öğrenme modellerini kullanmanın, doktorların meme kanseri lezyonlarını bulmalarına yardımcı olabileceğini bulduk. Amerika Birleşik Devletleri'nde, sekiz kadından biri er ya da geç bu hastalıktan etkilenecek ve derin öğrenme modellerinin tanısal doğruluğu, insan uzmanlardan daha yüksek ve yanlış pozitif ve yanlış negatiflerin oranı daha düşük. İster Amerika Birleşik Devletleri'nde bir hastayı test ediyor olun, ister bir İngiliz hastanesi tarafından sağlanan duyarsızlaştırma verilerini analiz ediyor olun, bu model benzer doğruluk iyileştirmeleri getirmiştir.

İnsanların makine öğrenimi yoluyla tespit etmesi zor olan kanser vakalarını doğru bir şekilde tanımlayın.

  • Deri hastalıklarını teşhis etmek için derin öğrenme modellerini kullanmanın doğruluğunun, kıdemsiz doktorlarınkinden daha yüksek ve hatta deri patologlarına kıyasla veya biraz daha iyi olduğunu kanıtlıyoruz.
  • Google Health, DeepMind Health ve ABD Gaziler İşleri Bakanlığı'ndan (VA) uzmanların ortak işbirliği sayesinde, makine öğrenimi modellerinin akut böbrek operasyonu (AKI) hastalığının başlangıcını tahmin etmede olağanüstü olduğu kanıtlandı. Sorunu iki gün önceden bulmak, hastanın acı çekmesini etkili bir şekilde önleyebilir. Gelecekte, doktorların bu tür ciddi hastalıklarla 48 saat önceden ilgilenmesi bekleniyor.
  • Derin öğrenme teknolojisini elektronik sağlık kayıt sistemine dahil etmek için birçok ortak kuruluşla birlikte çalıştık.
  • Akciğer kanserini tahmin etmede sevindirici bir ilerleme kaydettik. Bu erken çalışmada, tek bir CT taramasının sonuçlarını kontrol etmek için bir derin öğrenme modeli kullanmaya çalıştık ve teşhis yeteneği temelde bir radyoloğunkine eşitti ve hatta bazen daha da yüksekti. Gerçekler, akciğer kanserinin erken teşhisinin hastaların hayatta kalma oranını büyük ölçüde artırabileceğini kanıtladı.

  • Verily ve Hindistan ve Tayland'daki medikal ortaklarımızla birlikte, dağıtımı genişletmeye ve göz hastalıklarını tespit etmek ve önlemek için makine öğrenimi araçlarımızı değerlendirmeye devam ediyoruz.
  • Kanseri teşhis etmek için artırılmış gerçeklik mikroskoplarının kullanımına ilişkin bir araştırma makalesi yayınladık Patologlar, slayttaki diğer önemli bilgiler hakkında gerçek zamanlı geri bildirim alırken dokuları mikroskopla inceleyebilirler.
  • Patologlar için benzer vakaları inceleyerek daha verimli teşhis koymalarına olanak tanıyan insan odaklı benzer bir görüntü arama aracı geliştirdik.

Kuantum hesaplama

2019 yılında kuantum hesaplama ekibimiz ilk kez "kuantum hegemonyasına" ulaştı, yani bir kuantum bilgisayar belirli bir görevi yerine getirdiğinde, dünyanın en güçlü klasik bilgisayarının yürütme hızının çok üzerinde bir hızda performans gösteriyor. İki sonucun karşılaştırması 10.000 yıldan 200 saniyeye kadardır.

Solda: Sanatçı tarafından tasvir edilen kriyostatta çınar işlemci. Sağ: Sycamore işlemciyle fotoğraf çekimi.

Kuantum bilgisayarlar malzeme bilimi, kuantum kimyası ve büyük ölçekli optimizasyon alanlarında önemli bir rol oynayacak, ancak hedeflerimize gerçekten ulaşmak için teknolojik gelişmeyi daha da teşvik etmeliyiz. Şu anda, odak noktamız, kuantum hesaplama sisteminin çalışma süresini daha da uzatmak olan kuantum hata düzeltmesine odaklanıyor. Kuantum algoritmalarının ifadesini basitleştirmek ve donanım kontrolünün zorluğunu artırmak için hala çok çalışıyoruz.Aynı zamanda, klasik makine öğrenimi tekniklerini (derin pekiştirmeli öğrenme gibi) kullanarak oldukça güvenilir kuantum işlemcileri oluşturmanın yollarını bulduk. 2019'daki başarılar heyecan verici ve tüm bunların kuantum hesaplamanın geniş uygulaması için sağlam bir temel oluşturacağına inanıyoruz.

Genel Algoritmalar ve Teoriler Genel algoritmalar ve teoriler açısından, algoritmanın temelleri ve uygulamaları doğrultusunda ilerlemeye devam ediyoruz ve ayrıca grafik madenciliği ve diğer yönleri de keşfettik.

Biraz belirsiz görünen VLDB 19'da "Veri Merkezi Uygulamaları için Önbelleğe Duyarlı Yük Dengeleme" başlıklı bir makale ve yaklaşılabilir başka bir başlık olan "Veri Merkezi Hizmet Kapasitesini 40'a Kadar İyileştirin" başlıklı bir makale yayınladık. %! ". Makale, Web araması arka uç hizmet sisteminde önbelleği belirtmek için grafiğin dengeli bölümünü nasıl kullandığımızı, böylece flash sürücünün sorgu verimini% 48 artırdığımızı ve son olarak genel arka uç arama verimini% 40 artırdığımızı tanıtmaktadır.

İlgili bağlantı:

Web arama hizmeti sayfalarında Flash IO isteklerinin (önbellek eksikliğinden kaynaklanan) ısı haritası. Üç hörgüç; rastgele yaprak seçimi, yük dengeleme ve önbelleğe duyarlı yük dengelemeyi (soldan sağa) temsil eder. Çizgiler 50., 90., 95. ve 99.9. Yüzdelik dilimi temsil eder. VLDB 19 kağıdı, "Veri Merkezi Uygulamaları için Önbelleğe Duyarlı Yük Dengeleme"

ICLR 2019'da yayınlanan "Yeni Şişelerde Eski Şarap: Takviye Öğrenimi Klasik Optimizasyon Algoritmalarını Keşfedin" başlıklı bir makalede, pekiştirmeli öğrenmenin birkaç klasiğe nasıl yardımcı olabileceğini gösteren algoritmalar ve makine öğrenimi arasında yeni bir bağlantı keşfettik. Çevrimiçi optimizasyon ve kombinasyon problemleri (çevrimiçi eşleştirme ve ayırma gibi) en iyi, en kötü ve birleşik algoritmaları verimli bir şekilde bulur.

İlgili bağlantı: https://openreview.net/pdf?id=rkluJ2R9KQ

Ölçeklenebilir algoritmalar üzerindeki çalışmamız, temel olarak büyük veri kümeleri için paralel, çevrimiçi ve dağıtılmış algoritmaları içerir. FOCS 19'un en son makalesinde, birbirine bağlı bileşenler için neredeyse optimal bir toplu paralel hesaplama algoritması bulduk. Diğer makale grubumuz, eşleştirme (hem teorik hem pratik) ve yoğunluk kümeleme için paralel algoritmaları geliştirdi. Üçüncü görev, kara kutu modelinde alt modül işlevlerinin uyarlanabilir optimizasyonunu gerçekleştirmektir.Bu model türünün, özellik seçimi ve kelime sıkıştırma gibi senaryolarda çoklu uygulamaları vardır. SODA 19 makalesinde, yaklaşıklık faktörü, yuvarlama karmaşıklığı ve sorgu karmaşıklığı dahil olmak üzere üç açıdan neredeyse optimal olan alt modüler bir algoritma öneriyoruz. Başka bir FOCS 2019 makalesinde, PCA ve sütun alt küme seçimi için çevrimiçi bir çarpma yaklaşımı algoritması sağlıyoruz.

İlgili bağlantı: https://arxiv.org/abs/1910.05385

Başka bir çalışmada, bilinmeyen gelecek sahnesinin öngörülebilir bir kısım ve bir çatışmacı kısım içerdiğini varsayan yarı çevrimiçi bir bilgi işlem modeli tanıttık. İkili eşleştirme (ITCS 19) ve önbelleğe alma (SODA 20) gibi klasik kombinasyon problemleri açısından, bulduğumuz yarı çevrimiçi algoritma, en iyi çevrimiçi ve çevrimdışı algoritmalar arasında sorunsuz bir şekilde enterpolasyon yapabilir.

Pazar algoritmaları alanındaki son araştırmamız, temel olarak öğrenme ve pazar arasındaki etkileşimin en son anlayışını ve deneysel tasarımdaki birçok yeniliği içermektedir. Örneğin, NeurIPS 19'da yayınlanan sözlü makale, stratejik ajanların düzenli olarak tekrarlayan iki partili oyunlarda öğrenen ajanlara göre inanılmaz rekabet avantajını gösterdi. Son zamanlarda, reklam otomasyonuna odaklanmak, otomatik teklif verme ve reklamveren yanıt davranışının analizi konusundaki yoğun ilgimizi de uyandırdı. WINE 2019'da, iki makalede, reklamverenlerin dönüşüm oranını en üst düzeye çıkarmak için en iyi stratejileri inceledik ve reklamverenlerin teklif verme sürecindeki çeşitli değişikliklere tepkisini daha ayrıntılı olarak analiz ettik. Son olarak, girişim faktörlerini koruma öncülüğünde deneysel bir tasarım çalışması yürüttük ve bir işlem grubunun başka bir grubun sonuçlarını etkileyebileceğini gördük. KDD 19 belgeleri ve NeurIPS 19 makalelerinde, etkileşimi sınırlandırmak ve deneysel yetenekleri sürdürmek için birimleri veya birim kümelerini nasıl tanımlayacağımızı gösterdik.

İlgili bağlantı:

KDD 19 makalesi "Coğrafi Kümelemeyle Randomize Deneysel Tasarım" da önerilen kümeleme algoritması, Amerika Birleşik Devletleri'ndeki kullanıcı anketleri için uygundur. Algoritma, San Francisco, Berkeley ve Palo Alto'nun Sacramento hariç olmak üzere Körfez Bölgesi tarafından kapsanan doğru tahmini dahil olmak üzere büyük kentsel kümelenmeleri otomatik olarak tanımlayabilir.

Makine öğrenimi algoritması

2019 yılında, makine öğrenmesi algoritmaları ve yöntemlerinin birçok farklı alanında araştırmalar yaptık. Ana noktalardan biri, sinir ağlarında eğitimin dinamik doğasını anlamaktır. Google araştırmacıları, "Sinir Ağlarının Veri Paralel Eğitiminin Sınırlarını Ölçme" adlı blog gönderisinde, verilerin paralel düzeyini ölçeklemenin (toplu iş boyutunu artırmanın) modelin yakınsama verimliliğini artırabileceğini gösteren bir dizi titiz deneysel sonuç sağladı (veri paralel yöntemlerini kullanarak) .

İlgili Bağlantılar: https://ai.googleblog.com/2019/03/measuring-limits-of-data-parallel.html

Test edilen tüm iş yükleri arasında, parti boyutu ve eğitim hızı arasında üç genel ilişki gözlemledik: küçük partiler mükemmel ölçeklendirmeye karşılık gelir (noktalı çizgi boyunca), parti artışı sonunda azalan getirilere yol açar (noktalı çizgi değil) ve maksimum parti boyutu veri paraleldir En yüksek derece (eğilim sabittir). Farklı iş yükleri arasında geçiş noktaları çok farklı olma eğilimindedir.

Birden çok bilgi işlem cihazında verilerin paralel dağıtılması yöntemiyle karşılaştırıldığında, model paralel genişleme etkisi daha iyidir. GPipe, model paralelleştirmenin verimliliğini önemli ölçüde artırabilen ardışık düzenlenmiş CPU işlemci yöntemini kullanan bir kitaplıktır: tüm modelin yalnızca bir kısmı bazı verileri işlerken, diğer parçalar diğer verileri işlemeye başlayabilir. Bu boru hattı yönteminden elde edilen sonuçlar, daha büyük toplu görevleri simüle etmek için yeniden birleştirilebilir.

Gerçekler, makine öğrenimi modellerinin ham girdi verilerini elde edebileceğini ve sonuçta belirli önemli nitelikleri ve kategorileri (kediler, kamyonlar, inekler, kanser dokuları ve normal dokular vb.) Ayırt etmek için kullanılabilecek ilgili üst düzey temsillerini öğrenebileceğini kanıtladı. Şu anda, makine öğrenimi algoritmalarını iyileştirmenin odak noktası, öğrenilen yetenekleri daha yeni örneklere, problemlere veya alanlara genişletmek için onları bu üst düzey temsilleri keşfetmeye teşvik etmektir. 2019'da, aşağıdaki geçmişlere dayalı olarak bunun üzerine araştırma yapacağız:

  • "Dolaşmamış Temsillerin Denetimsiz Öğrenimini Değerlendirme" başlıklı makalede, hangi faktörlerin daha iyi temsil ve öğrenme etkileri sağlayabileceğini anlamayı umarak denetimsiz öğrenmedeki temsili hangi niteliklerin etkileyeceğini tartıştık.
  • "Derin Sinir Ağlarında Genelleme Açığını Tahmin Etmek" başlıklı makalede, marjinal dağılım istatistiklerinin genelleme boşluğunu tahmin etmek için kullanılabileceğini bulduk (yani, eğitim dağıtım verilerini kullanan modelin performansı, farklı dağılımlara sahip gerçek verilerden farklıdır. Hangi modellerin daha iyi genelleme etkisine sahip olduğunu daha iyi anlamamıza yardımcı olur. Ayrıca, modelin daha önce hiç görülmemiş çeşitli verileri ne zaman kabul etmeye başladığını daha iyi anlamak umuduyla, makine öğrenimi modellerindeki dağıtım bozukluklarını tespit etme yeteneğini geliştirmek için bir dizi çalışma yaptık. En iyi modelleri genelleştirmek için hangi modellerin kullanılabileceğini daha iyi anlamayı umarak, pekiştirmeli öğrenme bağlamında stratejik olmayan sınıflandırmayı da inceledik.

  • "Seyrek ve Belirtilmemiş Ödülden Öğrenmenin İndüksiyonu" makalesinde, öğrenme sisteminin zamanın geçişi nedeniyle değil, gerçek hedeften daha doğrudan öğrenmesini sağlamayı amaçlayan pekiştirmeli öğrenmeyi başarmak için ödül işlevini belirleme yöntemini inceledik. Uzunluk, uygun olmayan eylem dizisi vb. Faktörler beklentilerle tutarlı olmayan sonuçlara neden olur.

Bu talimatı takip eden görevde, eylem yörüngeleri a1, a2 ve a3 hedefe ulaştı, ancak a2 ve a3 dizileri talimatları doğru bir şekilde takip etmedi. Bu da yetersiz ödül sorunu olduğunu gösteriyor.

AutoML

Bu yıl boyunca, makine öğreniminin genel otomasyonunu iyileştirmek için öğrenme algoritmalarının nasıl kullanılacağını keşfetmeyi ve aynı zamanda belirli türden makine öğrenimi meta kararlarının en iyi insan makine öğrenimi uzmanlarından daha iyi sonuçlara yol açmasını sağlamayı hedefleyerek AutoML'deki çalışmalarımızı ilerletmeye devam ettik. fiili sonuç. Özellikle:

  • "EfficientNet: AutoML ve Model Bloom ile Doğruluk ve Verimliliği Artırma" başlıklı makalede, bilgisayarla görme sorunlarında önemli ölçüde iyileştirilmiş sonuçlar elde etmek için sinir mimarisi arama teknolojisinin nasıl kullanılacağını gösterdik, yani ImageNet'teki sonuçlar en yüksek doğruluk oranına eşdeğerdir % 84,4 ve kullanılan parametreler, orijinal en iyi modelin yalnızca sekizde biridir.

  • Model boyutunu doğrulukla karşılaştırın. EfficientNet-B0, AutoML MNAS tarafından geliştirilen bir referans ağıdır ve Efficient-B1'den B7'ye bu referans ağından genişletilmiştir. Özellikle, EfficientNet-B7'nin ImageNet'teki performansı, en yüksek doğruluk oranının% 84,4'üne ve beşinci en yüksek doğruluk oranının% 97,1'ine eşdeğerdir, ancak parametreler yalnızca mevcut en iyi CNN'nin 1 / 8,4'üne eşittir.
  • "EfficientNet-EdgeTPU: Hızlandırıcı İçin Optimize Edilmiş Sinir Ağları Oluşturmak için AutoML Kullanmak" başlıklı makalede, mobil cihazlarda çalışabilen yüksek hassasiyetli, düşük bilgi işlem oluşturmak için, sinir mimarisi arama yönteminin belirli bir donanım hızlandırıcı için en verimli modeli nasıl bulabileceğini gösterdik. Miktar modeli.
  • "Video Mimarisi Arama" makalesinde, AutoML çalışmasının video modelleri alanına nasıl genişletileceğini, en iyi sonuçları elde edebilecek mimarinin nasıl bulunacağını ve 50x çözünürlük kullanılarak elle ayarlanmış modele benzer performansın nasıl elde edileceğini açıkladık. Ancak hesaplama açısından daha az pahalı bir mimari.

TinvVideoNet (TVN) mimarisi, hesaplama süresini gerekli sınırlar içinde tutarken tanıma performansını en üst düzeye çıkarmayı umarak sürekli gelişmektedir. Örneğin, TVN-1'in (yukarıda) CPU'da 37 milisaniye ve GPU'da 10 milisaniye çalışması gerekir. TVN-2 (aşağıda) CPU'da 65 milisaniye ve GPU'da 13 milisaniye çalışır.

  • Ayrıca, birçok şirket ve kuruluşun ilişkisel veritabanlarında yeni ve önemli veri değerini keşfetmesine yardımcı olmak için tablo şeklindeki verileri işlemek için kullanılabilecek AutoML teknolojisini geliştirdik ve bu tür verilere dayalı yeni makine öğrenimi modelleri geliştirmeyi umuyoruz. Bu işbirliğine dayalı geliştirme teknolojisini Google Cloud AutoML Tabloları adı altında yayınladık ve sistemin performansını KaggleDays tablo verileri uçtan uca AutoML çözüm yarışmasında tartıştık. (Spoiler: 74 uzman veri bilimi ekibiyle yapılan karşılaştırmanın ardından AutoML Tabloları ikinci sırada yer aldı.)
  • "Sinir Ağlarında Nötr Ağırlıkların Keşfi" makalesinde, eğitim adımları olmadan değerlendirme modelindeki ağırlıkları ayarlamak için sinir ağı mimarisinin nasıl güncelleneceğini gösterdik. Bu şekilde, mimari aramanın hesaplama verimliliği önemli ölçüde iyileştirildi.
  • "AutoML'yi Transformer Mimarisine Uygulama" adlı makale, doğal dil işleme görevleri için en iyi mimarinin nasıl bulunacağını araştırıyor.Amaç, hesaplama maliyetlerini büyük ölçüde azaltırken orijinal Transformer modelinin performansını önemli ölçüde iyileştirmektir.

  • "SpecAugment: Otomatik Konuşma Tanıma için Yeni Bir Veri Geliştirme Yöntemi" makalesinde, otomatik öğrenme veri geliştirme yönteminin konuşma tanıma modellerine kadar genişletilebileceğini kanıtlıyoruz. İnsan makine öğrenimi uzmanlarına dayanan mevcut veri geliştirme çözümleriyle karşılaştırıldığında, bu öğrenme geliştirme çözümü, doğruluk düzeyini önemli ölçüde artırabilir.
  • Ayrıca, anahtar kelime tanımayı ve konuşma dili tanımayı gerçekleştirmek için AutoML'yi kullanan ilk konuşma uygulamasını da başlattık. Deneyde, bu tür bir modelin, bir çalışma süresinden sonra verimlilik ve performans açısından yapay olarak tasarlanmış modelden daha iyi olduğunu bulduk.

Doğal dil anlayışı

Son birkaç yılda, doğal dil anlama, çeviri, doğal diyalog, konuşma tanıma ve ilgili görevler için modeller önemli ilerleme kaydetti. Bu yıl, çalışmalarımızın bir teması, daha güçlü ve daha iyi performans gösteren modelleri eğitmek için kalıpları veya görevleri birleştirerek doğal dil anlama teknolojisinin seviyesini iyileştirmektir. Birkaç örnek vermek gerekirse:

  • Büyük ölçekli, çok dilli, büyük ölçekli nöral makine çevirisini keşfetme sürecinde, eğitim için 100 ayrı model kullanmak yerine 100 dil arasında çeviri yapacak bir model eğittik, böylece çeviri kalitesi önemli ölçüde iyileştirildi.

  • Uçtan uca akış modeliyle büyük ölçekli çok dilli konuşma tanımada, konuşma tanıma ve dil modellerinin nasıl birleştirileceğini ve sistemi birden çok dilde eğiterek konuşma tanımanın doğruluğunu önemli ölçüde artırabileceğini gösterdik.

  • "Çeviri: Uçtan Uca" Konuşmadan Konuşmaya "Çeviri Modeli" başlıklı makalede, konuşma tanıma görevlerini (genellikle ayrı bir görev) gerçekleştirmek için ortak bir modelin eğitilebileceğini ve çeviri efektinin ve konuşma oluşturma etkisinin her ikisinin de iyi olduğunu gösterdik. Konuşmacının sesi üretilen çevrilmiş seste tutulduğu gibi, basit bir genel öğrenme sistemi de eğitilebilir.
  • "Anlamsal Erişim için Çok Dilli Genel Cümle Kodlayıcısı" nda, anlamsal erişimde (basit kelime eşleştirme teknolojisine kıyasla) daha iyi performans gösteren bir model üretmek için birçok farklı hedefin nasıl birleştirileceğini gösterdik. Örneğin, Google Talk to Books'ta, "Hangi tat anıları çağrıştırabilir?" Son sonuç, "Benim için yasemin kokusu ve fırın tepsisinin kokusu bana kaygısız çocukluğumu hatırlattı" oldu.
  • "Robust Neural Machine Translation" da, dil çevirisinin kalitesini ve sağlamlığını önemli ölçüde iyileştirmek için rakip eğitim programlarının nasıl kullanılacağını gösterdik.

Makine algısı

Son on yılda, hareketsiz görüntüleri daha iyi anlamak için kullanılan makine algılama modelleri önemli ilerleme kaydetti. Bu modellerin ve yöntemlerin bir sonraki görevi, dinamik dünyayı ayrıntılı olarak daha iyi anlamaktır. Bu, görüntülerin ve videoların daha derin ve daha ayrıntılı bir yorumunun yanı sıra yaşam ve çevre algısını da içerir: görsel-işitsel dünyayı etkileşim oranında ve kullanıcılarla paylaşılan mekansal temelde anlamak. Bu yıl, bu alanda aşağıdakiler dahil birçok alanda ilerleme kaydettik:

  • Lens'teki daha ince görsel anlayış, daha güçlü görsel arama sağlar.
  • Hızlı hareketler, yüz eşleştirme ve akıllı video görüşmesi çerçeveleme gibi Nest Hub Max'teki kullanışlı akıllı kamera özellikleri.
  • Lens kullanımıyla gerçek zamanlı ve mekansal algılama teknolojisi, çevremizdeki dünyayı açmamıza yardımcı olabilir.
  • Daha iyi video derinlik tahmin modeli.
  • Videoyu ayrıntılı olarak daha iyi anlamak için zaman döngüsü tutarlılığı öğrenimini kullanın.

  • İşaretlenmemiş videolarla geçici olarak tutarlı olan metin, konuşma ve video temsillerini öğrenin.

  • Geçmişi gözlemleyerek gelecekteki görsel girdiyi tahmin etme yeteneği.
  • Model, videodaki işlem sırasını daha iyi anlayabilir ve kullanıcıların Google Fotoğraflar'da "mum üfleme" veya "merdivenden aşağı kayma" gibi özel video anlarını daha iyi hatırlamasına olanak tanır. Çevremizdeki duyusal dünya algımızı sürekli geliştirebiliriz, bu yüzden heyecanlanırız.

robot

Robot kontrolünde makine öğreniminin uygulanması önemli bir araştırma alanıdır. Bunun, robotların evler veya ofisler gibi karmaşık, gerçek dünya ortamlarında etkili bir şekilde çalışmasını sağlayan hayati bir araç olduğuna inanıyoruz.:

  • PlaNet
  • TossingBot

  • Soft Actor-Critic RL Policy Policy

  • ROBEL Benchmark Benchmark

TensorFlow 2.0 TensorFlow ML TensorFlow Lite GPU Teachable Machine 2.0 MLIR AI

  • JAX NeurIPS 2019 JAX JAX TPUs JAX
  • MediaPipe XNNPACKMediaPipe ML 2019 1500 TensorFlow Research Cloud Cloud TPU Coursera TensorFlow 10 TensorFlow 11 TensorFlow World
  • TensorFlow GAN TensorFlow TensorFlow TensorFlow TensorFlow

Google :

  • Open Images V5 Open Images 350 280 900
  • Deepfake FaceForensics benchmark Deepfake
  • Google Research Football GOOOAAALLLSS
  • Google-Landmarks-v2 200 500 2
  • YouTube-8M Segments YouTube-8M 5
  • AVAAVA AVA
  • PAWS PAWS-X
  • CCPE Taskmaster-1 Oz
  • VTAB ImageNet GLUE
  • 17 18000

2019

  • CVPR 250 40+
  • ICML 200 100+
  • ICLR 200 60+
  • ACL 100 40+
  • INTERSPEECH100 30+
  • ICCV 200 40+ ICCV
  • NeurIPS 500 120

15 NISQ

50 2018 158

2019

2020 ·

TPUv1 TPUv2 TPUv3 Edge TPU

2020

  • ML

2019 2020

İki aydan fazla ertelendi! Zhangqiu Tren İstasyonu'nun iyileştirme ve yenileme projesi tamamen yeniden başlatıldı ve Temmuz ayı başlarında trafiğe açılması bekleniyor
önceki
DeFi'nin gelişimi sınırlıdır, bir sonraki aşamada oyun nasıl kırılır?
Sonraki
2020'de, bu "kullanım ömrü sonu" Microsoft ürünleri
Çapraz platform geliştirme konusunda deneyimli: küçük programların mevcut ve gelecekteki olasılıkları gözlerimde
Zhang Xiaolong, 2020 WeChat Açık Sınıfında Yok: Tamamen Açık NLP Yetenekleri
Görüyorsunuz, Jining zamanda ileri koşuyor
Dezhou Doğum ve Çocuk Sağlığı Hastanesinin tercihli fizik muayene paketi burada.
Wenyi Savunucuları Kadın kahraman kızın duyguları dolup taşıyor ve puslu buzlu yüzünü hareket ettiremiyor
28 yılın ardından Apple, CES konferansına ne getirdi?
Bu makale, mikro hizmet mimarisi altında işlem tutarlılığının nasıl sağlanacağını açıklar
7.000 dolarlık akıllı tuvalet ve evcil hayvanların ruh halini algılayan tatsız mı yoksa sadece ihtiyaç duyulan bir eser mi?
Yapay zekanın bir sonraki dönüm noktası: grafik sinir ağı, hızlı bir salgın dönemini başlatıyor
2020, kişisel gizlilik korumasında devrim yılı
2020'de izlenecek en iyi 5 Android geliştirme teknolojisi
To Top