İçbükey tapınaktan Qian Ming
Qubit Raporu | Genel Hesap QbitAI
Alibaba, AI açık kaynak kodunun yeni hamleleri var.
Bu sefer bir insan-makine diyalog modeli ESIM Tam adı, geliştirilmiş bir dizi çıkarım modeli olan Geliştirilmiş Sıralı Çıkarım Modeli'dir.
Ali, 2017'de ilk önerildiği günden bu yana, bu araştırmanın Google ve Facebook dahil araştırmacılar tarafından 200'den fazla makaleye atıfta bulunduğunu ve bir zamanlar en iyi uluslararası diyalog sistemi değerlendirme yarışmasında (DSTC7) çift şampiyon kazandığını söyledi. İnsan-makine diyalogunun doğruluğu için dünya rekorunu% 94,1'e yükseltin.
Bu modelin ana uygulama senaryoları akıllı müşteri hizmetleri, navigasyon yazılımı, akıllı hoparlörler vb. Şimdi Alibaba tarafından sesli sipariş makinelerine, metro sesli bilet satış makinelerine ve araba etkileşim sistemlerine uygulanmaktadır.
Açık kaynak adresi:
https://github.com/alibaba/esim-response-selection
ESIM nedir?
ESIM ilk olarak 2017 yılında önerildi ve makalenin başlığında doğrudan bir giriş yapıldı:
Doğal Dil Çıkarımı için Geliştirilmiş LSTM, doğal dil çıkarımına uygulanan gelişmiş bir LSTM sürümü.
Makalede verilen model mimari diyagramından ESIM modeli üç bölümden oluşmaktadır (aşağıdaki şeklin sol kısmı ESIM modelidir ve sağ kısım sözdizimi analiz bilgilerini içeren ağı temsil etmektedir): Girdi Kodlama, yerel çıkarım modelleme (Yerel Çıkarım Modellemesi) ve Çıkarım Kompozisyonu (Çıkarım Kompozisyonu).
İlk olarak, giriş kodlama aşamasında, önermeyi (Önerme) ve hipotezi (Hipotez) girin. Bu bölümde BiLSTM, bir kelimeyi ve bağlamını nasıl temsil edeceğini öğrenir.
İkincisi, yerel çıkarım modelleme aşamasında. Öneriler ve hipotezler arasında yerel korelasyonlar elde etmek için dikkat temelli yumuşak hizalamayı kullanın.
Son olarak, öncüller ve hipotezler arasındaki genel çıkarım ilişkisini belirlemek için, gelişmiş yerel çıkarım bilgisini sentezlemek için bir kombinasyon katmanı kullanılır.
Dizi çıkarım modelinde, BiLSTM dizisi yerel çıkarım bilgisini sentezlemek için kullanılmaya devam eder ve ardından sonuç vektörü, genel çıkarım ilişkisini belirlemek için nihai sınıflandırıcıya sağlanan havuzlanmış sabit uzunluklu bir vektöre dönüştürülür.
Daha fazla ayrıntı için lütfen kağıt bağlantısını saklayın:
https://arxiv.org/abs/1609.06038
Model piyasaya sürüldükten sonra büyük ilgi gördü.Sadece DSTC 7'de şampiyonluğu kazanmakla kalmadı, aynı zamanda New York Üniversitesi'nin MultiNLI veri seti, Washington Üniversitesi'nin SWAG veri seti gibi yeni yayınlanan birçok veri seti için değerlendirme kriterlerinden biri haline geldi. .
DSTC 7 şampiyon raporu:
Noetic Uçtan Uca Yanıt Seçimi için Sıralı Dikkat Bazlı Ağ
https://arxiv.org/abs/1901.02609
90'lı yıllarda doğan bilim adamları tarafından araştırma ve geliştirme
ESIM modeli orijinal olarak Chen Qian ve diğerleri tarafından Dharma Akademisi Konuşma Laboratuvarında geliştirildi.
27 yaşındaki Chen Qian, 90'lı yıllarda doğdu ve Çin Bilim ve Teknoloji Üniversitesi'nden doktora derecesi ile mezun oldu. Alibaba'ya 2018 yılında katıldı ve 2018 sınıfının Alibaba yıldızlarından biridir.
Ali'ye girdikten sonra Tan Qing adını aldı ve aynı zamanda Dharma Akademisi'ndeki en genç bilim adamlarından biriydi.
Bu yılın en önemli uluslararası sesli konferansı ICASSP 2019'da Chen Qian bir kez daha parladı: ESIM tabanlı araştırma, Ubuntu (İngilizce) ve E-ticaret (Çince) genel standart veri kümelerinde en yüksek sonuçları elde etti.
Kağıt bağlantısı:
Noetic Uçtan Uca Yanıt Seçimi için Sıralı Dikkat Bazlı Ağ
https://arxiv.org/abs/1901.02609
Alibaba'nın açık kaynak projesi bu sefer bu kağıda odaklanıyor.
Son olarak, başka bir açık kaynak bağlantısı ekleyin:
https://github.com/alibaba/esim-response-selection
- Bitiş -
Samimi işe alım
Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzündeki "işe alma" kelimesini yanıtlayın.
Qubit QbitAI · Toutiao İmzalama Yazarı
' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri izleme