Açık kaynak! Facebook'un denetimsiz çeviri modeli, iki dil ayrı ayrı öğrenilebilir ve aynı zamanda karşılık gelebilir

İçbükey tapınaktan kestaneleri çevirmek

Qubit Üretildi | Genel Hesap QbitAI

dün, Yann LeCun Yüce Tanrı tweetledi ve Facebook'un iki Denetimsiz çeviri modeli , Açık kaynak.

Lafta Denetimsiz , Gerek yok İki dilli Metin için, AI'nın çeviri yeteneklerini eğitmek için yalnızca tek dilli corpora (Tek dilli Corpora) kullanılır.

Bindik EMNLP 2018

İki açık kaynaklı model, biri İfade tabanlı Çeviri modeli (PBSMT) ve diğeri sinir Çeviri Modeli (NMT).

Her ikisi de aşağıdaki üç adımdan geçmiştir:

1. Parametreler başlatma

2. Dil modelleme, evet Gürültü arındırma etki

3. Geri çeviri , Otomatik olarak iki dilli karşılaştırma oluştur

Böylece, olmadan bile İki dilli yapı Eğitim verileri olarak, AI hala çevirmeyi öğrenebilir.

kullanım WMT'14 İngilizce ve Fransızca ile WMT'16 Almanca-İngilizce Modelin performansını değerlendirmek için yaygın olarak kullanılan iki kıyaslama. Sonuç olarak, iki model BLEU puanı ,herşey Çok daha yüksek Daha önce en iyi performans gösteren model.

28.1, geri çevirinin girişinden sonraki puandır

Artı Geri çeviri PBSMT, öncüllerinin performansını neredeyse ikiye katladı. NMT'nin performansı da fena değil.

Gazetede, daha yüksek performansa ek olarak Facebook ekibinin modelinin de daha basit , Hiperparametre Biraz daha az.

İki gururlu yapay zeka çevirmeni kabul edildi EMNLP 2018 .

Kod, sonunda açık kaynak

NMT ile PBSMT İki modelin kod uygulaması GitHub üzerindedir.

NMT:

NMT kod uygulaması aşağıdaki işlevleri destekler.

· Üç makine çevirisi mimarisi: seq2seq , biLSTM + dikkat , Trafo

· Farklı modeller ve farklı diller arasında, Paylaşılan parametreler

· Otomatik kodlayıcıdan arındırma eğitimi

· İki dilli kontrol veri eğitimi

Ters iki dilli eğitim

Ters kontrol verisi oluşturmak için gerçek zamanlı çoklu okuma

Lütfen bilimin sıcak olduğunu unutmayın

Ayrıca kağıtta kullanılmayan bazı işlevler de vardır, örneğin:

· Herhangi bir numara Dil

· Dil Modeli Ön eğitim / Ortak eğitim , Parametre paylaşımı

Yüzleşme eğitimi

PBSMT:

PBSMT kod uygulaması aşağıdaki işlevleri destekler.

· Denetimsiz kelime öbeği listesi ( ifade tablosu ) Komut dosyası oluştur

· Otomatik Musa Eğitim

Bu tavuk çok huysuz olabilir

Lütfen çevirinize başlayın

Kendi AI çevirinizi eğitmek için aşağıdaki araçlara ihtiyacınız vardır:

Python 3

Dizi

PyTorch

Moses (metni temizlemek ve belirtmek / PBSMT modelini eğitmek için kullanılır)

fastBPE (BPE kodunu oluşturmak ve uygulamak için kullanılır)

fastText (yerleştirme oluşturmak için kullanılır)

MUSE (diller arası yerleştirme oluşturmak için kullanılır)

Hazır olduğunuzda başlayalım.

Suçlular lütfen emin olun, hiçbir şey olmayacak

GitHub Portalı:

https://github.com/facebookresearch/UnsupervisedMT

Tez Portalı:

https://arxiv.org/pdf/1804.07755.pdf

Altyazı grubu en ölümcül satan sevimli

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! İlgili ayrıntılar için lütfen QbitAI diyalog arayüzünde "işe alım" kelimesini yanıtlayın.

Qubit QbitAI · Toutiao İmzalayan Yazar

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

Finaller: Fan Zhendong ve Chen Meng ilk tekler şampiyonasını kazandı!
önceki
Little Pea'nın bir halefi var ve Meksikalı çaylak Avrupa Ligi Altın Çizme'ye meydan okuyor
Sonraki
Northeast Amca bir araba yapmak için 2,000 yuan harcadı ve İngiliz efendinin 2,000 poundluk köpek arabası ikinci oldu!
2018'de oyun çemberindeki ilk on olay: kış geldi, bahar çok uzak olmamalı, değil mi?
Zhang Yuning, Eredivisie'den ayrıldıktan sonra Bundesliga evsiz kaldı.
150.000 popüler büyük uzay ortak girişim arabası, arabaları anlamıyor olsanız da, onları seçin
LOL Alman Kupası: EDG de evde! SN2: 1 oyunu kazanmak için geri döndü! Oyuncu: Ejderha hayatını mahvetti
13 yıl sonra Almanya, Münih Derbisini yeniden üretti
Highlander'dan kaçınan Tuon, orta ve büyük SUV'lar arasında "sihirli araba" olabilir mi?
LOL Almanya Kupası: IG de kaybetti! TOP gerçekten güçlüdür, RNG ve IG için 2: 0 ardışık sıfır mühür! Hayranlar: ikna olmuş
Bu geleneksel yerli marka bir ortak girişim arabası kadar ünlü değildi, ama şimdi Geely kadar iyi satmıyor!
Önceki tüm Altın Çocuk Ödülleri, üçüncüsü en ünlüsü ve dünya futbolu üzerinde etkisi var
26 saniye! Dünyanın 1 numaralı yapay zeka hoparlörü, Tencent tarafından hacklendi ve bir hataya dönüştü
NetEase, yıl sonu performansı için ne kadar sıkı planlar yapıyor? Avantajlar göndermek için yıl sonu bonuslarını kullanmak, ancak oyuncu rutini miydi?
To Top