華文網

科學是如何優雅地解決語言翻譯問題的?

科技

改變生活

今天下午,世超說要去買星巴克喝,

各位差友都知道,差評君在村裡辦公,買星巴克是要進城的。。。

結果跟他出去的同事,全翹班了一下午!

請忽略群名。。。

世超左右不分到 b 和 d 都能弄混,所以很討厭英語,英語極差。

甚至因為他總錯打單詞,

把 Android 打錯成 Andriod 超多次

估計不少差友也有英語不好的困擾,畢竟不是誰都愛學語言的。

這時候翻譯類軟體就派上用場了,不過很多時候這些翻譯軟體並沒有什麼卵用,而是讓溝通更困難。。。

“ 松下問童子 ” 的翻譯

(Matsushita 是松下電器的意思,我竟無力反駁。。。)

講真,就這種二貨程度,還是很多人研究了幾十年才搗鼓出來了。

。。

一開始,他們想出了一個簡單粗暴的方法,把句子裡的詞逐個翻譯成目的語言,然後再根據語法調整順序。

比如把西班牙語翻譯成英語,先拆分

再調整語序

圖來自知乎@九五要當學霸

這麼做,需要很多語言學家來編輯語序語法規則,全世界那麼多語言那麼多規則,他們多半要累死。。。

而且,有的時候,語序是個謎一樣的東西,比如 “ 喂豬了麼? ”,“ 豬喂了麼? ”,“ 喂了豬麼? ” 順序不同,但完全是特麼一回事!

這就尷尬了,後來這些人想出了一個更好的方法——利用統計學。

管他語法不語法,按照概率來唄!

找出所有可能的組合

用這些組合拼湊出所有可能的句子,然後按日常生活中出現概率最高的為准,這在一般情況下結果是對的。

有了這玩意之後,

自然語言處理大師 Frederick Jelinek 說了這樣一句話 “ Every time I fire a linguist, the performance of the speech recognizer goes up ”(每次我斃了一個語言學家,我的翻譯準確度就會提升不少)。。。

Frederick Jelinek

後來神經網路火起來之後,不少工程師開始用神經網路優化統計翻譯演算法,不過概率這種東西,有的時候也會出偏差。。。

我他媽明明是喜歡下班啊!!!

果然是神經機器翻譯。。。

於是,基於機器深度學習的人工智慧翻譯出來了~

咳咳,具體原理麼,差評君實在是不想說,因為此處數學超能預警。。。

看懂算我輸!

(此為基於迴圈神經網路學習的基礎原理的一小部分。。。)

雖然這些東西我們未必看得懂,但我們卻可以輕鬆簡單的享受這項成果~

比如世超最近用上了一個叫 “ 彩雲小譯 ” 軟體。

按照慣例,先念個開場詩~

臥槽有點准啊!

再問點別的。。。

程式師快來撕~

這裡要說一下,右下角那個自動的選項,彩雲小譯會自動識別你說的是中文還是英文,只要你想,隨便說,無縫切換~

自動識別模式可以自由切換

而且他能翻譯很多明星,對於日常的東西特別全~

更叼的是,他連一些很不正經的俚語都能翻譯。。。

可以分清 “ 小雞 ” 和 “ 小雞雞 ”

而且因為 AI 訓練的比較好, Google 翻譯 “ 松下問童子 ” 出現的蠢答案,在彩雲小譯上是不會出現的~

雖然翻譯的沒有那麼文雅,但已經能完整表達意思了

如果插上耳機,你還可以體驗同聲傳譯效果,對方正在說話的時候,你在耳機裡聽到的直接就是翻譯,延遲也就幾秒,溝通無障礙~

這個跟外國人交流時候的螢幕顛倒小細節,簡直不能太貼心!!!

這個小東西,對於像世超這種英語比較殘廢的人來說,簡直就是福音,甚至你可以一句一句的跟他讀,來學習英語!

比如世超最近用上了一個叫 “ 彩雲小譯 ” 軟體。

按照慣例,先念個開場詩~

臥槽有點准啊!

再問點別的。。。

程式師快來撕~

這裡要說一下,右下角那個自動的選項,彩雲小譯會自動識別你說的是中文還是英文,只要你想,隨便說,無縫切換~

自動識別模式可以自由切換

而且他能翻譯很多明星,對於日常的東西特別全~

更叼的是,他連一些很不正經的俚語都能翻譯。。。

可以分清 “ 小雞 ” 和 “ 小雞雞 ”

而且因為 AI 訓練的比較好, Google 翻譯 “ 松下問童子 ” 出現的蠢答案,在彩雲小譯上是不會出現的~

雖然翻譯的沒有那麼文雅,但已經能完整表達意思了

如果插上耳機,你還可以體驗同聲傳譯效果,對方正在說話的時候,你在耳機裡聽到的直接就是翻譯,延遲也就幾秒,溝通無障礙~

這個跟外國人交流時候的螢幕顛倒小細節,簡直不能太貼心!!!

這個小東西,對於像世超這種英語比較殘廢的人來說,簡直就是福音,甚至你可以一句一句的跟他讀,來學習英語!