Makine çevirisi söz konusu olduğunda, birçok insan kafası karışmış hissediyor. On yıldan daha erken bir tarihte, PowerWord'a bir İngilizce cümle koyduk ve bu cümle Çinceye çevrilebilir. Artık derin öğrenme teknolojisine sahip makine çevirisi eklendiğine göre, ne farklı olabilir?
Elbette pek çok farklılık vardır.Bunlardan en tipik olanı, makine çevirisinin tüm makaleyi çevirebilmesidir, ancak daha uzun cümlelerle karşılaşıldığında sıradan çeviri teknikleri işe yaramayacaktır. Bunun nedeni, makine çevirisinin kelimelerin başka bir dile basit bir çevirisi olmamasıdır, ancak karmaşık cümleleri anlamak için geriye bakan bir insan gibi olabilir ve bağlamla birleştirilerek her bir özel O / O / O Kimin adına.
Bu işlevin gerçekleştirilmesi, biri RNN-tekrarlayan sinir ağı ve diğeri CNN-evrişimli sinir ağı olmak üzere iki sinir ağı mimarisine bağlıdır. Son zamanlarda, hangi RNN veya CNN'nin makine çevirisi için daha uygun olduğuna dair birçok tartışma oldu. Bugün, bu iki tür sinir ağının makine çevirisini nasıl desteklediğine ve yabancı dil pisliğini nasıl kurtardığına bir göz atalım.
RNN: Makine Çevirisinde Eski Okul
Her şeyden önce, bir makine için çevirinin bir kod çözme ve sonra kodlama süreci olduğunu anlamalıyız. İngilizceyi Çinceye çevirmek istiyorsanız, önce orijinal İngilizce metni "sinirsel kod" olarak çözmeniz ve ardından Çince üretmek için kodlamanız gerekir.
Döngüsel sinir ağlarının anahtarı döngüsel sözcüğünde yatmaktadır. Sistem, bir sonraki çıktıyı belirlemek için son çıktının içeriğini "hatırlayacaktır". Son ve bir sonraki sefer kavramıyla, sinir ağı girdi ve çıktı bilgisini bağımsız değil, birbiriyle ilişkili zaman serileri olarak görecek. Bu şekilde, bir sonraki dizide görünecek sözcükler, önceki dizi ilişkilendirmeleriyle tahmin edilebilir.
En yaygın dilde söylemek gerekirse, Guo Degang'ın çapraz konuşmasını dinledikten sonra, "Yu Qian'ın babası" unsurunun "Yaşlı Wang" tarafından takip edilmesi gerektiğini biliyoruz.
Çeviri sırasında, RNN kaynak dili girdi dizisi olarak ve çeviri dilini de çıktı dizisi olarak görür.Her bir çıktı bir önceki çıktının sonucuna atıfta bulunacağından, makine çevirisi basitçe sözcükleri çevirmekten daha bütünleşiktir.
Şu anda en yetkin RNN uygulaması Google Translate olmalı.Geçen yıl Google, makine çevirisi için sinir ağı sisteminin kullanılmasını önerdi.Çince-İngilizce çevirinin hata oranının% 85'e kadar düştüğü ve o sırada sansasyon yarattığı söyleniyor. .
Geleneksel sinir ağı çeviri yaparken her cümleyle yüzleşmek için her zaman boş bir beyin kullanıyorsa, RNN çeviri sırasında kalıcı bir düşünceye sahip olur ve Google Translate tarafından uygulanan LSTM bu noktayı güçlendirir. LSTM, bir zaman tekrarlayan sinir ağı olan uzun ve kısa süreli bellek ağı olarak çevrilen bir RNN çeşididir. RNN'nin eksikliği, kısa aralıklarla "Yu Qian'ın babası-yaşlı adamı Wang" sekans tahminlerinin eskiden kolay olması, ancak "bugün geç saatlere kadar devam edin, öyleyse işe gidin" gibi cümleleri tahmin etmek için birbirinden çok uzak olan bağlamla ilişki kurmanız gerektiğidir. Şu anda, RNN o kadar iyi performans göstermeyebilir.
LSTM ile bu uzun vadeli bağımlılığı öğrenebilir ve anlayabilirsiniz. LSTM, cümledeki her bir öğenin özelliklerinin doğrusal olmayan bir kombinasyonunu oluşturmak için bir dizi hesaplama kullanır.Aynı zamanda, daha düşük ağırlığa sahip öğeleri unutmak için bir "unutma mekanizması" da kurar. Bu, LSTM'nin hafızayı "güncelleyebileceği" anlamına gelir ve uzun vadeli bağımlı faktörlerin daha yakın nöronlarda var olmaya devam etmesine izin verir.
CNN: GPU'nun sevgilisi
RNN makine çevirisi hala güncellenirken, birisi CNN-Convolutional Neural Network'ü makine çevirisine uygulamayı önerdi.
Yukarıdakilerden, RNN (LSTM) makine çevirisinin sırayla çalıştığı sonucuna varabiliriz, yani insanlar gibi sırayla tek tek çevirir. Ancak unutulmaması gereken bir şey, mevcut genel GPU'ların en büyük avantajının paralel hesaplama yapabilmeleridir. Bu şekilde, RNN, GPU'nun bilgi işlem gücünü en üst düzeye çıkaramaz.
CNN, aynı anda birden çok dil parçasını işleyebilir ve bilgileri hiyerarşik olarak işleme yeteneğine sahiptir. Metni serileştirin, sözcükleri vektörleştirin ve katmanlamadan sonra sonucu çıkarın. Katmanlama sürecinde, bir sonraki çıktı sırasını belirlemek için kaynak metin sürekli olarak gözden geçirilecektir.
Bu teknolojiyi öneren Facebook ve son makine çevirisi çaylak DeepL'dir. Facebook, yılın ilk yarısında, RNN tabanlı bir dil çeviri modelinden 9 kat daha hızlı ve daha doğru olduğu söylenen CNN'e dayalı bir dil çeviri modelinin lansmanını duyurdu. Testte, Facebook çeviri sistemi, İngilizce-Almanca ve İngilizce-Fransızca testlerinde insan çevirisine RNN'den daha yakın.
Ve Almanya'dan DeepL, İzlanda'ya, sadece sinir ağlarını eğitmek için saniyede 5.1 peta kayan nokta işlemi gerçekleştirebilen dünya sıralamasında 23. bir süper bilgisayar koydu.
Gösterdikleri verilerden, DeepL'in performansı Facebook, Microsoft ve hatta Google'ı çok geride bıraktı.
Ancak, ne CNN ne de RNN, makine çevirisinin sonu değildir. Örneğin, Google'ın son zamanlarda bahsettiği RNN'ye dayalı olmayan dikkat mekanizması, çok katmanlı sinir ağları, derin sinir ağları vb., Makine çevirisini çözmek için kullanılan yöntemlerdir. Hız, bilgi işlem kaynak tüketimi ve duygusal anlayış gibi birçok boyutta farklı performansları vardır.
Nihai pratiklikten, sinir ağı modeli yalnızca bir parçayı etkileyebilir. Dahası, külliyatın boyutu, ağır külliyat etiketleme işi vb. Aynı zamanda, Moğolca ve Tibetçe gibi daha az külliyata sahip dillerin hala makine çevirisinden yararlanamamasına mahkumdur.
Mevcut makine çevirisi temelde insan çevirisine yardımcı olma aşamasında kalmaktadır. DeepL'in süper bilgisayarı veya Google'ın terk eden sinir ağı olsun, teknolojide bir tür "muhteşem teknik" olarak anlaşılabilir. Ne tür bir sinir ağı kullanacağımızdan daha önemlisi, makine çevirisinin hayatımıza daha çok girmesine izin vermeliyiz.
Daha heyecan verici içerik için Titanium Media WeChat ID'yi (ID: taimeiti) takip edin veya Titanium Media Uygulamasını indirin