Facebook的翻譯年糕

翻譯年糕是個很有趣的名詞,每次看到都會想到多拉A夢,在使用Instagram與Facebook的時候,是一個很有趣的工具可以協助翻譯,其實如果有用過的就知道,翻譯的結果很口語,已經很不錯了,而Facebook最近透過文章宣布,他們將使用神經網絡翻譯neural machine translation,來處理這龐大的數據翻譯量,包含上下文,俚語,打字錯誤,縮寫和意圖,這些基於短句的機器學習,將全面改成神經網絡翻譯來處理,這個好處是可以更精確更流暢地給予完整的翻譯結果。

首先就是LSTM這個技術的使用,以往的翻譯是將幾個字詞去做拼湊,現在則是利用建構的神經網路系統,去做上下文的連貫,這個LSTM代表的就是一種長期記憶的功能,文章中提到,對於英文與土耳其文的幫助會最明顯。

另外對於不認識的字,系統也會先直接無視,再利用上下文的關係去做一個對齊,將中間的文字去去做連貫的揣測,讓語意能更清楚被翻譯。

另外減少詞彙量的建構,用比較少但是完整的詞彙來建構翻譯的例子,神經網絡幾乎總是具有可調參數,可以控制模型的學習速度。選擇這些超參數的最佳集合對於性能可能是非常有益的。然而,這對於規模的機器翻譯提出了重大的挑戰,因為每個翻譯方向由具有其自己的一組參數,由於每個模型的最優值可能不同,因此我們必須分別對生產中的每個系統進行調整。我們在幾個月內進行了數千次端對端翻譯實驗,並且利用Caffe2的學習框架來做翻譯性能的調整。

The Facebook Artificial Intelligence Research (FAIR) 團隊則利用卷積神經網絡CNNs(convolutional neural networks )來做機器學習的翻譯功能,最後並盡可能的涉獵更多的語系,如果有興趣的可以看看下面的連結:

https://code.facebook.com/posts/289921871474277/transitioning-entirely-to-neural-machine-translation/

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *