Makine çevirisi yapay zeka ile buluştuğunda daha güvenilir hale gelecek mi?

Makine çevirisi söz konusu olduğunda, birçok insan kafası karışmış hissediyor. On yıldan daha erken bir tarihte, PowerWord'a bir İngilizce cümle koyduk ve bu cümle Çinceye çevrilebilir. Artık derin öğrenme teknolojisine sahip makine çevirisi eklendiğine göre, ne farklı olabilir?

Elbette pek çok farklılık vardır.Bunlardan en tipik olanı, makine çevirisinin tüm makaleyi çevirebilmesidir, ancak daha uzun cümlelerle karşılaşıldığında sıradan çeviri teknikleri işe yaramayacaktır. Bunun nedeni, makine çevirisinin kelimelerin başka bir dile basit bir çevirisi olmamasıdır, ancak karmaşık cümleleri anlamak için geriye bakan bir insan gibi olabilir ve bağlamla birleştirilerek her bir özel O / O / O Kimin adına.

Bu işlevin gerçekleştirilmesi, biri RNN-tekrarlayan sinir ağı ve diğeri CNN-evrişimli sinir ağı olmak üzere iki sinir ağı mimarisine bağlıdır. Son zamanlarda, hangi RNN veya CNN'nin makine çevirisi için daha uygun olduğuna dair birçok tartışma oldu. Bugün, bu iki tür sinir ağının makine çevirisini nasıl desteklediğine ve yabancı dil pisliğini nasıl kurtardığına bir göz atalım.

RNN: Makine Çevirisinde Eski Okul

Her şeyden önce, bir makine için çevirinin bir kod çözme ve sonra kodlama süreci olduğunu anlamalıyız. İngilizceyi Çinceye çevirmek istiyorsanız, önce orijinal İngilizce metni "sinirsel kod" olarak çözmeniz ve ardından Çince üretmek için kodlamanız gerekir.

Döngüsel sinir ağlarının anahtarı döngüsel sözcüğünde yatmaktadır. Sistem, bir sonraki çıktıyı belirlemek için son çıktının içeriğini "hatırlayacaktır". Son ve bir sonraki sefer kavramıyla, sinir ağı girdi ve çıktı bilgisini bağımsız değil, birbiriyle ilişkili zaman serileri olarak görecek. Bu şekilde, bir sonraki dizide görünecek sözcükler, önceki dizi ilişkilendirmeleriyle tahmin edilebilir.

En yaygın dilde söylemek gerekirse, Guo Degang'ın çapraz konuşmasını dinledikten sonra, "Yu Qian'ın babası" unsurunun "Yaşlı Wang" tarafından takip edilmesi gerektiğini biliyoruz.

Çeviri sırasında, RNN kaynak dili girdi dizisi olarak ve çeviri dilini de çıktı dizisi olarak görür.Her bir çıktı bir önceki çıktının sonucuna atıfta bulunacağından, makine çevirisi basitçe sözcükleri çevirmekten daha bütünleşiktir.

Şu anda en yetkin RNN uygulaması Google Translate olmalı.Geçen yıl Google, makine çevirisi için sinir ağı sisteminin kullanılmasını önerdi.Çince-İngilizce çevirinin hata oranının% 85'e kadar düştüğü ve o sırada sansasyon yarattığı söyleniyor. .

Geleneksel sinir ağı çeviri yaparken her cümleyle yüzleşmek için her zaman boş bir beyin kullanıyorsa, RNN çeviri sırasında kalıcı bir düşünceye sahip olur ve Google Translate tarafından uygulanan LSTM bu noktayı güçlendirir. LSTM, bir zaman tekrarlayan sinir ağı olan uzun ve kısa süreli bellek ağı olarak çevrilen bir RNN çeşididir. RNN'nin eksikliği, kısa aralıklarla "Yu Qian'ın babası-yaşlı adamı Wang" sekans tahminlerinin eskiden kolay olması, ancak "bugün geç saatlere kadar devam edin, öyleyse işe gidin" gibi cümleleri tahmin etmek için birbirinden çok uzak olan bağlamla ilişki kurmanız gerektiğidir. Şu anda, RNN o kadar iyi performans göstermeyebilir.

LSTM ile bu uzun vadeli bağımlılığı öğrenebilir ve anlayabilirsiniz. LSTM, cümledeki her bir öğenin özelliklerinin doğrusal olmayan bir kombinasyonunu oluşturmak için bir dizi hesaplama kullanır.Aynı zamanda, daha düşük ağırlığa sahip öğeleri unutmak için bir "unutma mekanizması" da kurar. Bu, LSTM'nin hafızayı "güncelleyebileceği" anlamına gelir ve uzun vadeli bağımlı faktörlerin daha yakın nöronlarda var olmaya devam etmesine izin verir.

CNN: GPU'nun sevgilisi

RNN makine çevirisi hala güncellenirken, birisi CNN-Convolutional Neural Network'ü makine çevirisine uygulamayı önerdi.

Yukarıdakilerden, RNN (LSTM) makine çevirisinin sırayla çalıştığı sonucuna varabiliriz, yani insanlar gibi sırayla tek tek çevirir. Ancak unutulmaması gereken bir şey, mevcut genel GPU'ların en büyük avantajının paralel hesaplama yapabilmeleridir. Bu şekilde, RNN, GPU'nun bilgi işlem gücünü en üst düzeye çıkaramaz.

CNN, aynı anda birden çok dil parçasını işleyebilir ve bilgileri hiyerarşik olarak işleme yeteneğine sahiptir. Metni serileştirin, sözcükleri vektörleştirin ve katmanlamadan sonra sonucu çıkarın. Katmanlama sürecinde, bir sonraki çıktı sırasını belirlemek için kaynak metin sürekli olarak gözden geçirilecektir.

Bu teknolojiyi öneren Facebook ve son makine çevirisi çaylak DeepL'dir. Facebook, yılın ilk yarısında, RNN tabanlı bir dil çeviri modelinden 9 kat daha hızlı ve daha doğru olduğu söylenen CNN'e dayalı bir dil çeviri modelinin lansmanını duyurdu. Testte, Facebook çeviri sistemi, İngilizce-Almanca ve İngilizce-Fransızca testlerinde insan çevirisine RNN'den daha yakın.

Ve Almanya'dan DeepL, İzlanda'ya, sadece sinir ağlarını eğitmek için saniyede 5.1 peta kayan nokta işlemi gerçekleştirebilen dünya sıralamasında 23. bir süper bilgisayar koydu.

Gösterdikleri verilerden, DeepL'in performansı Facebook, Microsoft ve hatta Google'ı çok geride bıraktı.

Ancak, ne CNN ne de RNN, makine çevirisinin sonu değildir. Örneğin, Google'ın son zamanlarda bahsettiği RNN'ye dayalı olmayan dikkat mekanizması, çok katmanlı sinir ağları, derin sinir ağları vb., Makine çevirisini çözmek için kullanılan yöntemlerdir. Hız, bilgi işlem kaynak tüketimi ve duygusal anlayış gibi birçok boyutta farklı performansları vardır.

Nihai pratiklikten, sinir ağı modeli yalnızca bir parçayı etkileyebilir. Dahası, külliyatın boyutu, ağır külliyat etiketleme işi vb. Aynı zamanda, Moğolca ve Tibetçe gibi daha az külliyata sahip dillerin hala makine çevirisinden yararlanamamasına mahkumdur.

Mevcut makine çevirisi temelde insan çevirisine yardımcı olma aşamasında kalmaktadır. DeepL'in süper bilgisayarı veya Google'ın terk eden sinir ağı olsun, teknolojide bir tür "muhteşem teknik" olarak anlaşılabilir. Ne tür bir sinir ağı kullanacağımızdan daha önemlisi, makine çevirisinin hayatımıza daha çok girmesine izin vermeliyiz.

Daha heyecan verici içerik için Titanium Media WeChat ID'yi (ID: taimeiti) takip edin veya Titanium Media Uygulamasını indirin

Xueshan kredi ofisi "müşterilere teşekkür etmek için kapıyı kapattı" kredi bakiyesi yaklaşık 700 milyon yuan
önceki
CCTV Bahar Şenliği Galasının kurucusu ve ilk Bahar Galasının yöneticisi Huang Yihe, 85 yaşında hayata gözlerini yumdu.
Sonraki
Yi Yang Qianxi rüyasının peşinden gitmek için rahatlık alanından çıktı ve üniversitedeki herhangi birinin peşinden gidip gitmeyeceği soruldu. Yanıt şaşırtıcıydı!
Gümüş madalyayı 0,46 puan dezavantajla Jia Zongyang kazandı. Çin'in N kez kayak ve sürat pateni için oyalanması üzücü.
Ba Teyze haberi verdi: Wu Jinyan CP'yi mi kızarttı? Huo Siyan mı tartışıyor? Qin Lan karışık liman çemberi?
190225 Basit okul üniforması Lu Han olağanüstü mizaç giyiyor, gerçekten okul geyiği
Wang Yuan gerçekten güveç takıntılı bir idol, yani burada güveç öğelerini mi uyguluyor?
Adam 22 kez bir fast food restoranını çaldı, cep telefonunun QR kodunu taradı ve 6.800 yuan transfer etti.
Yuzuru Hanyu hiçbir şüphe duymadan Olimpiyat şampiyonunu tekrar kazandı, Kim Boyang'ın dördüncü kaçırılan madalyası hala tarihe geçti
Paste coffee defalarca blog heyecanını sildi ve geçmişe saldırıldı mı? Reşit olmadığın zaman beyaz mı?
Susu bu hafta ne yedi: Doğal Teras, Ateş Sarayı, Mingwei Yerli Mutfağı, Buğday Kahvesi
"IKON" "Paylaş" 190225 Bir başka "ideal idol" dalgası! Bugünün ideal tipi Big Brother Guinanni ~
Jay Chou'nun hayranları aslında cesur bir fikir öne sürdüler ve ilk reddeden küçük yengeçler oldu!
Ekskavatör meyveleri keser, robotik kol makyaj yapar ... "Geleceğim Ben" in bu sayısı size makinenin nazik yüzünü gösterecek
To Top