İçbükey tapınaktan kestaneleri çevirmek
Qubit Üretildi | Genel Hesap QbitAI
dün, Yann LeCun Yüce Tanrı tweetledi ve Facebook'un iki Denetimsiz çeviri modeli , Açık kaynak.
Lafta Denetimsiz , Gerek yok İki dilli Metin için, AI'nın çeviri yeteneklerini eğitmek için yalnızca tek dilli corpora (Tek dilli Corpora) kullanılır.
İki açık kaynaklı model, biri İfade tabanlı Çeviri modeli (PBSMT) ve diğeri sinir Çeviri Modeli (NMT).
Her ikisi de aşağıdaki üç adımdan geçmiştir:
1. Parametreler başlatma
2. Dil modelleme, evet Gürültü arındırma etki
3. Geri çeviri , Otomatik olarak iki dilli karşılaştırma oluştur
Böylece, olmadan bile İki dilli yapı Eğitim verileri olarak, AI hala çevirmeyi öğrenebilir.
kullanım WMT'14 İngilizce ve Fransızca ile WMT'16 Almanca-İngilizce Modelin performansını değerlendirmek için yaygın olarak kullanılan iki kıyaslama. Sonuç olarak, iki model BLEU puanı ,herşey Çok daha yüksek Daha önce en iyi performans gösteren model.
28.1, geri çevirinin girişinden sonraki puandır
Artı Geri çeviri PBSMT, öncüllerinin performansını neredeyse ikiye katladı. NMT'nin performansı da fena değil.
Gazetede, daha yüksek performansa ek olarak Facebook ekibinin modelinin de daha basit , Hiperparametre Biraz daha az.
İki gururlu yapay zeka çevirmeni kabul edildi EMNLP 2018 .
NMT ile PBSMT İki modelin kod uygulaması GitHub üzerindedir.
NMT:
NMT kod uygulaması aşağıdaki işlevleri destekler.
· Üç makine çevirisi mimarisi: seq2seq , biLSTM + dikkat , Trafo
· Farklı modeller ve farklı diller arasında, Paylaşılan parametreler
· Otomatik kodlayıcıdan arındırma eğitimi
· İki dilli kontrol veri eğitimi
Ters iki dilli eğitim
Ters kontrol verisi oluşturmak için gerçek zamanlı çoklu okuma
Lütfen bilimin sıcak olduğunu unutmayın
Ayrıca kağıtta kullanılmayan bazı işlevler de vardır, örneğin:
· Herhangi bir numara Dil
· Dil Modeli Ön eğitim / Ortak eğitim , Parametre paylaşımı
Yüzleşme eğitimi
PBSMT:
PBSMT kod uygulaması aşağıdaki işlevleri destekler.
· Denetimsiz kelime öbeği listesi ( ifade tablosu ) Komut dosyası oluştur
· Otomatik Musa Eğitim
Bu tavuk çok huysuz olabilir
Kendi AI çevirinizi eğitmek için aşağıdaki araçlara ihtiyacınız vardır:
Python 3
Dizi
PyTorch
Moses (metni temizlemek ve belirtmek / PBSMT modelini eğitmek için kullanılır)
fastBPE (BPE kodunu oluşturmak ve uygulamak için kullanılır)
fastText (yerleştirme oluşturmak için kullanılır)
MUSE (diller arası yerleştirme oluşturmak için kullanılır)
Hazır olduğunuzda başlayalım.
Suçlular lütfen emin olun, hiçbir şey olmayacak
GitHub Portalı:
https://github.com/facebookresearch/UnsupervisedMT
Tez Portalı:
https://arxiv.org/pdf/1804.07755.pdf
Altyazı grubu en ölümcül satan sevimli
- Bitiş -
Samimi işe alım
Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! İlgili ayrıntılar için lütfen QbitAI diyalog arayüzünde "işe alım" kelimesini yanıtlayın.
Qubit QbitAI · Toutiao İmzalayan Yazar
' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin