Kuruluşunun 5. Yıldönümü: Facebook Yapay Zeka Araştırma Enstitüsü'nün önemli başarılarını bir makalede okuyun

Leifeng.com AI teknolojisi inceleme basını: Beş yıl önce Yann LeCun ve diğerleri, açık bir araştırma ortamı aracılığıyla yapay zekanın gelişimini teşvik etmeye ve ardından herkese fayda sağlamaya çalışan Facebook AI Araştırmasını (FAIR) kurdular; amaçları, bilgeliğini anlamaktır. Essence, gerçekten akıllı bir makine yaratmak için. O zamandan beri FAIR büyümeye ve sonuçlar üretmeye devam etti ve yavaş yavaş Silikon Vadisi Menlo Park, New York, Paris, Montreal, Tel Aviv, Seattle dahil olmak üzere birçok ülkedeki laboratuvarlarla uluslararası bir araştırma organizasyonuna dönüştü. , Pittsburgh ve Londra. Yapay zeka yavaş yavaş Facebook'un işinin çekirdeği haline geldiğinden, FAIR ayrıca Facebook'un devasa yapay zeka mimarisinin bir parçası haline geldi.Temel araştırmadan uygulama araştırması ve teknoloji geliştirmeye kadar, yapay zeka araştırma ve geliştirmenin tüm yönlerine kendini adamıştır.

FAIR, yabancı işbirliğinde açık bir tavrı destekler ve toplumla mümkün olduğunca yakın bir bağlantı ilişkisini sürdürür. Ekipleri genellikle en son araştırma sonuçlarını ve mümkün olduğunca açık kaynak araştırma kodlarını, veri setlerini ve araçları (PyTorch, fastText, FAISS ve Detectron gibi) yayınlar. Bu çabalar, yapay zeka araştırmalarının geliştirilmesini başarıyla destekledi. Bu yılı bir örnek olarak ele alırsak, FAIR'den araştırmacılar, ACL, EMNLP, CVPR ve ECCV'nin en iyi kağıt ödüllerinin yanı sıra ECCV, ICML ve NeurIPS'in zaman kontrolü ödülleri de dahil olmak üzere birçok ödülü başarıyla kazandı. Açık bir çalışma ortamının AI alanında hızlı gelişimi sağlayabileceğine inanıyorlar.

Gerçekten akıllı bir makine yaratmak, teknoloji ve ürün mühendisliği açısından bir zorluktur. Bu nedenle, FAIR'in araştırma enerjisinin önemli bir kısmı muhakeme, tahmin, planlama ve denetimsiz öğrenme gibi bazı temel sorunları çözmeye odaklanmıştır. Aynı zamanda, bu araştırma alanlarında başarılar elde etmek istiyorsanız, üretken modeller, nedensellik, yüksek boyutlu stokastik optimizasyon ve oyun teorisi gibi teorileri daha derinlemesine anlamanız gerekir. Gelecekte kullanımımız için yapay zeka potansiyelini en üst düzeye çıkarmak istiyorsak, bu uzun vadeli araştırma keşiflerinin kalıcı olması gerekiyor. Kuruluşunun beşinci yıldönümü vesilesiyle geçmişte tamamlanmış projelerden bazı temsili projeleri seçecekler ve bunlar aracılığıyla size FAIR'in misyonunu başarıyla gerçekleştirdiğini, yapay zeka alanına nasıl katkıda bulunduğunu ve ardından dünyaya nasıl katkıda bulunduğunu gösterecekler. Etkilendi.

Yukarıdaki zaman çizelgesi, FAIR'in son 5 yıldaki temsili projelerini göstermektedir.

Bellek ağı

FAIR araştırmacıları 2014 yılında sinir ağları ile uzun süreli bellekte önemli bir kusur keşfetti. Herkes sinir ağlarının veri setinin eğitim sürecinde öğrenebileceğini bilmesine rağmen, sistem çalıştıktan sonra, genellikle gelecekte belirli görevler için yeni bilgiler depolayamazlar. Bu nedenle, makinenin yeterli miktarda etkileşimli davranışı hatırlamasına ve diyalogdaki önceki ifadelere dayanan genel bilgi sorularını yanıtlamasına yardımcı olmak için yeni bir öğrenme modeli geliştirdiler. 2014 yılında yayınlanan ve modeli anlatan makalelerinden biri (https://arxiv.org/abs/1410.3916), "Yüzüklerin Efendisi" serisinin hikayesine ilişkin soruları bellek yeteneklerine sahip bir ağ üzerinden yanıtlamaya çalıştı. Ve temeli, sağlanan sadece kısa bir özettir. Sonuçlar, sistemin sadece bazı basit dil kalıplarını öğrenmekle kalmayıp, hikayenin sonunda "Frodo Shire'da" ve "Yüzüklerin Efendisi Kıyamet Dağı'nda" gibi doğum kelimelerinin anlamını bile doğru bir şekilde özetleyebildiğini gösteriyor.

FAIR, önümüzdeki iki yıl içinde bu yöntemi geliştirmeye devam etti ve hem araştırma hem de keşif alanında çok şey genişletti. Sıralamadan denetimsiz bir şekilde eğitilebilen gelişmiş bir RNN geliştirdiler. Push ve pop'u destekleyen StackRNN (https://research.fb.com/downloads/stack- rnn /). BAbl'de (https://research.fb.com/downloads/babi/) ekip, makinenin performansını metin anlamada değerlendirmek için soru ve cevap görevlerine dayalı bir veri seti oluşturdu. BAbI'nin artık restoran rezervasyonlarından cevaplara ve film programlarına kadar her şeyi kapsayan binlerce diyalog örneği içeren açık kaynak projesi ParlAI'nin bir parçası olduğunu belirtmekte fayda var. Ek olarak, gerçek uygulamalardaki pratikliklerini geliştirmek için bellek ağı mimarisini de yinelediler. Yinelemenin içeriği uçtan uca bellek ağını (https://arxiv.org/abs/1503.08895) ve anahtar-değer bellek ağını (https://arxiv.org/abs/1606.03126) içerir, ilki ağı daha az sürede yapabilir Gözetim altında çalışan ikincisi, ağın genellemeden sonra tamamen denetimsiz bilgi kaynakları (Wikipedia girişleri gibi) aracılığıyla eğitilmesine izin verir.

Kendi kendine denetlenen öğrenme ve üretken modeller

Yapay zeka kullanımını genişletmek için öz denetimli öğrenme (SSL) yoluyla büyük miktarda etiketlenmemiş verinin nasıl kullanılacağı, her zaman FAIR'in en öncelikli görevlerinden biri olmuştur. SSL ile makineler, etiketlenmemiş görüntüler, videolar veya sesler girerek dünyanın soyut temsillerini öğrenebilir. SSL'nin en tipik uygulama örneklerinden biri, bir sonraki resmi tahmin edebilmesi için video içeriğini bir makineye göstermek ve eğitmektir. Tahmin etme yeteneğinde ustalaştıktan sonra, makine dünyanın nasıl çalıştığı hakkında bilgi edinebilir ve daha sonra dünyanın soyut temsillerini daha iyi edinebilir. SSL, makinelerin insan ve hayvan bebekleri gibi gözlem yoluyla öğrenmesine ve böylece gerçek dünya hakkında birçok arka plan bilgisi biriktirmesine olanak tanır. İnsanların hepsi makinenin dünya ile bir "fikir birliğine" ulaşabileceğini umuyor. Dünyadaki her şeyi tahmin etme yeteneğine sahip bir model, gerçek dünyada hareket edebilen, davranışının sonuçlarını tahmin edebilen ve hareket edebilen bir yapay zeka sistemi kurmanın anahtarıdır.

2014 yılında, Montreal Üniversitesi'ndeki MILA'dan bir arkadaş (Ian Goodfellow) Generative Adversarial Networks (GANs) adı verilen yeni bir denetimsiz öğrenme yöntemi önerdi. O sırada, FAIR araştırmacıları, bu kendi kendini denetleyen öğrenme yönteminin potansiyel uygulama değerinden hemen etkilendiler. Bununla birlikte, GAN'lar bu yöntemin çok umut verici olduğunu düşünmelerine rağmen, yöntem yalnızca bazı çok basit problemlerde kanıtlanmıştır. Bu nedenle, FAIR, 2015 yılından bu yana, akademisyenleri GAN'ların gerçekten bir rol oynadığına ikna etmeye çalışan bir dizi makale yayınladı. Basitçe ifade edersek, GAN'lar belirsiz koşullar altında tahminler yapmak için makineleri eğitmek için kullanılabilir, arkasında iki rakip sinir ağı yatar. Tipik bir GAN yapısında, jeneratör ağı, bir grup rastgele sayıdan (geçmiş video karelerini de içerebilen) verileri (görüntüler veya video kareleri gibi) üretir.Aynı zamanda, ayırıcı ağ aynı zamanda gerçek verileri (gerçek Görüntü ve video çerçevesi) ve oluşturucunun "hata" çıktısı. İki ağı etkin bir şekilde optimize eden ve daha iyi tahmin sonuçları sağlayan bu antagonistik ağ işlem mantığıdır.

Son yıllarda, makaleleri temelde, derin evrişimli üretken yüzleşme ağları (DCGAN'lar, ve Laplace dahil olmak üzere GAN'ların birkaç temel varyantını ele aldı. Görüntü oluşturma. Karşıt ağlar (LAPGANs, ve video tahmin davranışına odaklanan çatışmalar Gradyan farkı kaybı tahmini (AGDL'ler, https://arxiv.org/abs/1511.05440). Bu belgelerin en önemli katkısı, herkese GAN'ların gerçekten var olmayan yatak odaları, yüzler veya köpekler gibi bazı gerçekçi görünen görüntüleri "yaratabildiğini" kanıtlamaktır.

Resim, üretici ağ tarafından oluşturulan bir dizi moda tasarım çalışmasını göstermektedir.

O zamandan beri, gittikçe daha fazla sayıda araştırmacı, FAIR'in GAN'lar üzerindeki çalışmalarına dikkat etmeye başladı ve onları şaşırtıcı yüksek çözünürlüklü görüntüler oluşturmak için kullanıyor. Bununla birlikte, GAN'ların ayarlanması ve bir araya getirilmesi oldukça zordur. Bu nedenle, FAIR, GAN'ları güvenilir kılmak için daha fazla yol keşfetmeye çalışmaktadır. Yöntemlerden biri teorik olarak rakip eğitimi anlamaya odaklanmaktır. 2017'de Wasserstein GAN (WGAN, https://arxiv.org/abs/1701.07875) yöntemini önerdiler; bu yöntem, ayırıcıyı daha "pürüzsüz" ve verimli hale getirmek için geliştirerek jeneratörün öngörücü etkisini artırıyor . Genel olarak, WGAN, yakınsama sağlamlığını garanti edebilen ve yaygın olarak kullanılan ilk GAN'dır. Bu aynı zamanda, WGAN ile, sistemi optimize ederken ayırıcı ve jeneratörün çıktısını dengeleme işini ortadan kaldırmanın mümkün olduğu ve böylece, özellikle yüksek çözünürlüklü görüntüler oluşturma görevinde, öğrenmede ağın istikrarını önemli ölçüde iyileştirmenin mümkün olduğu anlamına gelir.

O zamandan beri FAIR araştırmacıları ve Facebook mühendisleri, rakip eğitim yöntemini uzun vadeli video tahmini ( ve moda kıyafetleri dahil olmak üzere çok çeşitli uygulamalara uyguladılar Oluşturma (https://arxiv.org/abs/1804.00921). Ancak Generative Adversarial Networks'ün (GAN) gerçekten ilginç olan kısmı, onların gelecek için anlamıdır. Tamamen yeni bir teknoloji olarak (birkaç yıl önce bile yoktu), verilerin kıt olduğu alanlarda veri üretmek için bize yeni fırsatlar sunuyor. Gelecekteki keşiflerde, otonom öğrenme yeteneğine sahip makineler oluşturmak için anahtar bir araç haline gelebilir.

Büyük ölçekli metin sınıflandırması

Metin anlama tek bir görev değil, kelimeleri, cümleleri ve tüm dil veri setlerini bir makine tarafından işlenebilecek bir formatta düzenleyen genişletilmiş bir alt görev matrisidir. Ancak çok fazla çalışma yapılmadan önce metnin kendisinin sınıflandırılması gerekir. Birkaç yıl önce, kelime vektörü (word2vec) gibi doğal dil işleme modelleri, metni sınıflandırmak için çok sayıda kelime tabanlı eğitim kullandı.Aynı zamanda model, eğitim veri setindeki her kelimeye farklı bir vektör atadı. Facebook için bu metin sınıflandırma yöntemi çok yavaştır ve tamamen denetlenen verilere fazlasıyla bağlıdır. Sonunda başarmaları gereken şey, metinleri yüzlerce dilde sınıflandırmaktır ve bunların çoğu büyük ölçekli veri kümelerine sahip değildir. Sistemin, Facebook'un tüm metin tabanlı işlev ve hizmetlerinin yanı sıra FAIR'in doğal dil işleme araştırmalarına genişletilmesi gerekiyor.

Dolayısıyla 2016'da FAIR, hızlı bir şekilde fastText'i (https://code.fb.com/ml-applications/expanded-fasttext-library-now-fits-on-smaller-memory-devices/) oluşturdu. Metni sınıflandırma ve sınıflandırdığı kelimelerin daha büyük biçimini hesaba katan kelime temsilini öğrenme çerçevesi. 2017'de yayınlanan bir makalede (https://arxiv.org/pdf/1607.04606.pdf) FAIR, vektörleri "alt kelime birimlerine" (örneğin, 3 veya 4 harf) atayan bir model önermiştir. Tüm kelimelere atamak yerine), sistemin eğitim verilerinde görünmeyen kelimeler için temsiller oluşturmasına izin verir. Sonunda, modelin sınıflandırması milyarlarca kelimeye genişletilebilir ve yeni ve tanınmaz Eğitilmiş kelimelerden öğrenilir ve eğitim hızı tipik bir derin öğrenme sınıflandırıcısından çok daha hızlıdır. Bazı durumlarda, fastText, daha önce birkaç saniyede tamamlanması birkaç gün süren bir modeli eğitmek için kullanılabilir.

Daha sonraki gelişmeler, FastText'in yapay zeka temelli dil anlayışının araştırılmasına ve uygulanmasına önemli bir katkı olduğunu ve artık 157 dile uygulanabilir olduğunu gösteriyor. Orijinal makale diğer yayınlarda binlerce kez alıntılanmıştır ve fastText, kelime gömme sistemleri için hala en yaygın kullanılan temellerden biridir. Facebook'a ek olarak fastText, mesaj yanıtları önerme gibi tanıdık uygulama senaryolarından "The Great Outdoors adlı algoritma" gibi özel uygulama senaryolarına kadar çeşitli uygulamalarda da kullanılmıştır. Herkese açık İnternet yorumlarının görüntülenmesine yardımcı olmak ve gösterim sonuçlarını performans için bir komut dosyası olarak düzenlemek için fastText kullanan "Tiyatro" ürünü. Çerçeve ayrıca Facebook'ta metni 19 dilde sınıflandırmak için kullanıldı ve çeviri ve doğal dil anlayışı için DeepText ile birleştirildi.

Son teknoloji çeviri araştırması

Hızlı, doğru ve esnek çeviri, dünyanın her yerinden insanların iletişim kurmasına yardımcı olmanın önemli bir parçasıdır. Bu nedenle, FAIR'in ilk günlerinde, o zamanki en gelişmiş istatistiksel makine çevirisinden daha iyi performans gösteren yeni bir yöntem bulmaya başladılar. Hız, doğruluk ve öğrenme yeteneklerini bütünleştiren CNN tabanlı bir sinir makinesi çevirisi (NMT) mimarisi oluşturmak için üç yıl harcadılar. (Facebook Yapay Zeka Araştırma Enstitüsü, 2017'de https://arxiv.org/abs/1705.03122 çalışmasını detaylandıran bir makale yayınladı.) Deneylerinde, bu yöntem RNN'den 9 kat daha hızlı. , O zamanki en yüksek doğruluk oranını korurken.

Çoklu atlamalı CNN'leri yalnızca daha sınırlı bir veri kümesi üzerinde eğitmekle kalmaz, aynı zamanda "tmrw" yi "yarın" olarak doğru şekilde çevirmek gibi yazım hatalarını veya kısaltmaları daha iyi anlamaktır. Genel olarak, sinirsel makine çevirisi ortalama% 11 doğruluk ve çeviri hızını 2,5 kat artırdı. Kendi sistemlerini geliştirmenin yanı sıra, CNN sistemine dayalı bir sekans-sekans modelleme araç seti olan fairseq kodunu ve modelini (https://github.com/facebookresearch/fairseq) açık kaynaklı hale getirdiler.

Büyük ölçekli çeviri eğitimi veri setlerine (genellikle corpora olarak adlandırılır) olan ihtiyacı ortadan kaldırmak için, birden çok dilde eğitim sağlayabilen çok dilli yerleştirme gibi başka yeni makine çevirisi yöntemlerini de arıyorlar. Geçen yıl, çok dilli yerleştirmeyi öğrenmek için iki farklı yöntem sağlayan açık kaynaklı bir Python kitaplığı-MUSE yayınladılar: biri, yayın sürümünde bulunan 110 iki dilli sözlüğü kullanan denetimli bir yöntemdir; diğeri ise izin vermek Paralel korpus olmadan iki dil arasında yeni bir iki dilli sözlük oluşturmanın güncellenmiş, denetimsiz bir yöntemi. Daha sonra, tam cümle çevirisi için denetimsiz eğitimin sağladığı dikkate değer ilerlemeyi gösteren EMNLP ödüllü bir makale yayınladılar (https://arxiv.org/abs/1804.07755).

Fairseq ve MUSE gibi araştırma ve kaynakları paylaşarak FAIR, diğerlerini araştırma amaçlı veya üretim uygulamaları için daha hızlı, daha doğru ve daha işlevsel çeviri teknolojisinin avantajlarından yararlanmaya teşvik eder.

Herkesi ilerleten yapay zeka araçları

Yapay zekanın ilerlemesi yalnızca çığır açan fikirlere değil, aynı zamanda bunları doğrulamak ve uygulamak için güçlü bir platforma ve araçlara sahip olmaya da bağlıdır. FAIR, bu sistemlerin kurulmasında ve dünya ile paylaşılmasında başı çekti. 2015 yılında, büyük ölçeği hızlandırmak için FAIR tarafından geliştirilen Torch derin öğrenme modülünü (https://code.fb.com/developer-tools/fair-open-sources-deep-learning-modules-for-torch/) açtılar. Sinir ağlarının eğitimi. 2016'da Torchnet'i (https://code.fb.com/core-data/lighting-the-way-to-deep-machine-learning/) yayınladılar ve bu da derin öğrenme topluluğunun hızlı bir şekilde etkili bir yapı oluşturmasını kolaylaştırıyor Ve yeniden kullanılabilir öğrenme sistemi. Kısa bir süre sonra, mobil bilgi işlem için modüler bir derin öğrenme çerçevesi olan ve şu anda dünya çapında 1 milyardan fazla cep telefonunda sinir ağları çalıştıran Caffe2'yi (https://caffe2.ai) yayınladılar. Ardından, çerçeveler arasında gerektiği gibi hareket etmeyi kolaylaştıran sinir ağlarının genel bir temsili olan ONNX'i (https://onnx.ai) yayınlamak için Microsoft ve Amazon'u birleştirdiler.

Özellikle, PyTorch (https://pytorch.org) üzerindeki araştırma çalışmaları, FAIR'in hızlı yinelemeli, etkili, açık sistemler geliştirmeye ve AI topluluğu ile işbirliği kurmaya kararlı olduğunu göstermektedir. PyTorch, aslında Facebook Yapay Zeka Araştırma Enstitüsü'ndeki küçük bir grup araştırmacının küçük bir sonucuydu. Hepsini yeniden oluşturmak yerine Torch açık kaynak kitaplığında derin bir öğrenme çerçevesi oluşturmayı seçtiler ve aynı zamanda hızı en üst düzeye çıkarmak için Intel ve NVIDIA'nın hızlandırma kitaplıklarını da entegre ettiler. PyTorch'u 2017'nin başlarında piyasaya sürdüler. Bugün, iki yıldan kısa bir süre içinde, GitHub'da (https://octoverse.github.com/projects) en hızlı büyüyen ikinci açık kaynak projesi ve küresel bir AI geliştiricisi haline geldi Seçilen çerçeve. Ekim ayında, AI topluluğunun yüzlerce üyesi ilk PyTorch Geliştirici Konferansı'na katıldı ve California Institute of Technology, FAIR, fast.ai, Google, Microsoft, Nvidia, Tesla ve diğer birçok şirket ve kurumdan gelen geri bildirimleri dinledi. Konuşun. Şimdi, PyTorch 1.0 sürümü, Caffe2 ve ONNX'in modüler, üretim odaklı yeteneklerini entegre ediyor ve bulut hizmetleri ile teknoloji tedarikçilerinin derin entegrasyonu yoluyla prototip araştırmasından ürün dağıtımına kadar kesintisiz bir bağlantı yolu sağlıyor.

PyTorch, yüz milyonlarca kullanıcısı olan Facebook ürünlerine entegre edilmiştir ve aynı zamanda FAIR'in fairseq (-py) (https://github.com/pytorch/fairseq) gibi kendi araştırma projelerine de entegre edilmiştir Bu sürüm önceki sürümden daha iyidir. Çeviri hızı% 80 arttı. Takviye öğrenme Go robotu ELF OpenGo, gömülü Q&A EmbodiedQA araştırması (https://embodiedqa.org/) ve milyarlarca etiketli genel görüntü üzerinde eğitim görüntü tanıma ağlarının tümü PyTorch kullanır. Facebook'a ek olarak, New York Üniversitesi profesörü Dr. Narges Razavian, AllenNLP projesinde ve erken hastalık tespitini iyileştirmek için yapay zeka kullanan projelerde PyTorch'u kullandı. Şimdi Udacity ve FAST.AI, daha fazla insanın PyTorch'u kullanmasına yardımcı oluyor.

PyTorch, modeli araştırmadan üretime daha hızlı ve daha kolay hale getirdiği için, FAIR'in Facebook AI Benzerlik Araması (FAISS) üzerindeki çalışması da büyük ölçekli arama araştırmalarının ilerlemesini hızlandırdı. FAISS, başlangıçta kullanıcı tercihleriyle ilgili benzerlikleri belirlemek için GPU kullanan bir dahili araştırma projesiydi, ancak şimdi türünün en hızlı ve en büyüğü olan milyarlarca veri kümesini kullanabilir. FAISS, öneri motorları ve yapay zeka destek sistemleri için olanaklar açtı. FAIR bunu geçen yıl açık kaynaklı bir kitaplık olarak yayınladı ve şimdi FAISS, 5000'den fazla GitHub yıldızıyla geliştirici topluluğu tarafından yaygın bir şekilde benimseniyor ve NVIDIA'nın GPU hızlandırmalı scikit-öğrenme kitaplığı cuML'ye entegre edildi.

Yeni bir bilgisayarla görme testi karşılaştırması

Zekanın doğasını anlamaya çalışmak, çok duyusal bir araştırmadır, ancak son beş yılda, FAIR aslında yalnızca bilgisayarla görmede daha fazla ilerleme kaydetmiştir. FAIR doğmadan önce Facebook, insanlara doğru zamanda doğru fotoğrafları göstermek için görüntülerdeki insanların piksellerle nasıl temsil edildiğini daha iyi anlamaya çalışan küçük bir yapay zeka uzmanları ekibine sahipti. FAIR araştırmacıları 2017 yılına kadar en iyi hedef tespiti ve anlamsal bölümleme tekniklerini birleştirerek CVPR17 En İyi Bildiri Ödülü'nü kazanan Mask R-CNN belgesini tamamladı.

Bu belgede dediği gibi, "Değişiklik olmadan, Maske R-CNN, COCO 2016 Challenge Şampiyonası da dahil olmak üzere her görevde mevcut tüm tek modlu projelerden daha iyi performans gösterir." Bu çalışma Hızla daha fazla yapay zeka topluluklarında bilgisayarla görme araştırmalarının temeli haline geldi. Ardından teknoloji, FAIR'in açık kaynaklı Detectron sistemine entegre edilerek, dünya çapındaki araştırmacılar için algoritmanın sezgisel kullanım kolaylığını, hızını ve doğruluğunu geliştirdi.

Bu temel çalışma, çok sayıda mevcut Facebook sistemini destekler.Örneğin, otomatik metnin değiştirilmesi görme engelli kişilerin metinleri ve kötü içeriği algılamasına yardımcı olabilir. Bu aynı zamanda gelecekteki uygulamaların da temelidir: Platformlar arası AR işlevi ve Portal'daki Akıllı Kamera burada köklenmiştir. Araştırma devam ederken, FAIR'in araştırma odağı videoya kaydı ve DensePose projesi, sistemin video içeriğini ve fotoğrafları anlamasına yardımcı olabilir.

Yukarıdaki video, kişi hareket ettiğinde kişinin başının üstünde 3 boyutlu bir yüzeyin oluşturulmasını göstermektedir.

Görüntüyü anlama: daha hızlı eğitim ve daha büyük veri kümeleri

FAIR'in büyük ölçekli zorlukları çözmeye çalıştığı tek alan bilgisayar görüşü değildir. FAIR, eğitim hızı ve eğitim seti boyutunun sınırlamalarının yanı sıra denetlenen veri setlerinin eksikliğini ele almak için Facebook'un Uygulamalı Makine Öğrenimi (AML) ekibiyle birlikte çalıştı. Bu yılın başlarında yayınlanan bir makalede, AML ekibi, en büyüğü 3,5 milyar görüntü ve 17.000 karma tablo içeren karma tablolar içeren büyük bir herkese açık görüntü kümesi üzerinde bir görüntü tanıma ağını nasıl eğittiklerini tartıştı. . Geçmişte yayınlanan herhangi bir çalışmadan daha büyük emirlerdir ve sonuç, sektörde şimdiye kadar yayınlanan en iyi sonuçtur: doğruluk oranı% 85.4'tür.

FAIR'in eğitim hızı araştırması sayesinde, bu atılım mümkün hale gelir - FAIR, ImageNet'in eğitim hızını büyük ölçüde artırabilir. Eğitim süresini bir saatin altına indirdiler ve daha önce düşünülenden çok daha büyük olan küçük ölçekli SGD eğitiminin nasıl yürütüleceğini gösterdiler. Onların sözleriyle: "Bu sonucu elde etmek için, öğrenme oranını küçük bir toplu işleve ayarlamak için doğrusal ölçeklendirme kurallarını kullandık ve erken eğitimde optimizasyon problemini çözen yeni bir ön işleme şeması geliştirdik."

Eğitim hızı arttıkça, daha büyük veri setlerinde zayıf denetimli öğrenme üzerine hedefli araştırmalar yapabiliriz. Bu iki sonuç, FAIR ve AML'nin karşılıklı olarak pekiştirdiğini göstermektedir. Yapay zeka çözme bilimi pratik araştırma ve üretim uygulamaları ile desteklendiğinde, en hızlı ve en gelişmiş sonuçları göreceğiz.

FUAR'ın geleceği

LeCun ve diğerleri FAIR'i yarattıklarında, nihai hedefleri zekayı anlamak ve temel ilkelerini keşfetmek, böylece makinelerin zekasını geliştirmekti. Şimdiye kadar bu hedef değişmedi. Şimdi FAIR araştırmacıları, kendi kendini denetleyen öğrenme yoluyla gerçek dünya modelleri elde edebilen makineler geliştirmek, akıl yürütme için eğitim makineleri ve karmaşık eylemleri planlamak ve tasavvur etmek için eğitmek gibi araştırma alanlarını genişletmeye devam ediyor. FAIR'in şu anda robotik, görsel akıl yürütme ve diyalog sistemleri üzerinde çalışmasının nedenlerinden biri budur. Bu makalede, elde edilen bazı somut başarıları anlattılar.Bu projeler, büyük ilerleme kaydettiklerini kanıtladı, ancak insanların daha iyi yaşamlar yaşamalarına yardımcı olmak için makineleri daha akıllı hale getirmenin hala uzun bir yolu var. Gitmek.

Lei Feng Network AI Teknolojisi İncelemesi Lei Feng Network

"Yenilmez Kowloon" polis memuru seri olarak öldürdü "Kowloon Müfettişi" Zhang Jin, katilin peşinde
önceki
Bu hafta SARAY'ın ana öğeleri neler? Bu sürüm kılavuzunun ayrıntıları, hızlı bir şekilde başlamanıza yardımcı olacaktır!
Sonraki
Dongfeng Nissan Jinke resmi olarak yola çıktı ve 11 Temmuz'da listelenecek
"Karabuğday Çıldırıyor" İlk Yayınlanan Fragman Ma Sichun, Zhong Chuxi, Huang Jingyu Yabancı Bir Ülkede Çıldırıyor
IG şampiyonluğu kazandı, Chopstick Kardeşler! Yüze vuran oyuncuları sayın! Netizen: Akraba var mı?
İlişki öldü ve çivi yaşıyor
Audi A6 Avant veya 459.8003 Haziran'da satışta
"Köpek Gözü İnsan Kalbini Görüyor" adlı bu resim serisi, köpek sahiplerinin 7 sırrını ortaya koyuyor ...
InnoDB işlem prensibi açıklandı
SKT transfer söylentileri devam ediyor Eski takım arkadaşları, Faker'in şampiyonluğu kazanması için SKT'ye dönecek mi?
Onu kapabilir ve beni kaybettiğimi sayabilirsin! Mi Band 3 detayları sayfa pozlama: fiyat 169 yuan
Bu 5 prestijli okul isimlerinden dolayı küçümseniyor ve güçleri olağanüstü.
Arabanın camına "Bakan Dakang" koymayı bırak! Bu para cezasına çarptırılacak
İPhone 11 görüntülemeleri yayınlandı, arkadaki üç kamera / patlama daha küçük!
To Top