科學是如何優雅地解決語言翻譯問題的?
科技
改變生活
今天下午,世超說要去買星巴克喝,
結果跟他出去的同事,全翹班了一下午!
請忽略群名。。。
世超左右不分到 b 和 d 都能弄混,所以很討厭英語,英語極差。
甚至因為他總錯打單詞,
把 Android 打錯成 Andriod 超多次
估計不少差友也有英語不好的困擾,畢竟不是誰都愛學語言的。
這時候翻譯類軟體就派上用場了,不過很多時候這些翻譯軟體並沒有什麼卵用,而是讓溝通更困難。。。
“ 松下問童子 ” 的翻譯
(Matsushita 是松下電器的意思,我竟無力反駁。。。)
講真,就這種二貨程度,還是很多人研究了幾十年才搗鼓出來了。
一開始,他們想出了一個簡單粗暴的方法,把句子裡的詞逐個翻譯成目的語言,然後再根據語法調整順序。
比如把西班牙語翻譯成英語,先拆分
再調整語序
圖來自知乎@九五要當學霸
這麼做,需要很多語言學家來編輯語序語法規則,全世界那麼多語言那麼多規則,他們多半要累死。。。
而且,有的時候,語序是個謎一樣的東西,比如 “ 喂豬了麼? ”,“ 豬喂了麼? ”,“ 喂了豬麼? ” 順序不同,但完全是特麼一回事!
這就尷尬了,後來這些人想出了一個更好的方法——利用統計學。
管他語法不語法,按照概率來唄!
找出所有可能的組合
用這些組合拼湊出所有可能的句子,然後按日常生活中出現概率最高的為准,這在一般情況下結果是對的。
有了這玩意之後,
Frederick Jelinek
後來神經網路火起來之後,不少工程師開始用神經網路優化統計翻譯演算法,不過概率這種東西,有的時候也會出偏差。。。
我他媽明明是喜歡下班啊!!!
果然是神經機器翻譯。。。
於是,基於機器深度學習的人工智慧翻譯出來了~
咳咳,具體原理麼,差評君實在是不想說,因為此處數學超能預警。。。
看懂算我輸!
(此為基於迴圈神經網路學習的基礎原理的一小部分。。。)
雖然這些東西我們未必看得懂,但我們卻可以輕鬆簡單的享受這項成果~
比如世超最近用上了一個叫 “ 彩雲小譯 ” 軟體。
按照慣例,先念個開場詩~
臥槽有點准啊!
再問點別的。。。
程式師快來撕~
這裡要說一下,右下角那個自動的選項,彩雲小譯會自動識別你說的是中文還是英文,只要你想,隨便說,無縫切換~
自動識別模式可以自由切換
而且他能翻譯很多明星,對於日常的東西特別全~
更叼的是,他連一些很不正經的俚語都能翻譯。。。
可以分清 “ 小雞 ” 和 “ 小雞雞 ”
而且因為 AI 訓練的比較好, Google 翻譯 “ 松下問童子 ” 出現的蠢答案,在彩雲小譯上是不會出現的~
雖然翻譯的沒有那麼文雅,但已經能完整表達意思了
如果插上耳機,你還可以體驗同聲傳譯效果,對方正在說話的時候,你在耳機裡聽到的直接就是翻譯,延遲也就幾秒,溝通無障礙~
這個跟外國人交流時候的螢幕顛倒小細節,簡直不能太貼心!!!
這個小東西,對於像世超這種英語比較殘廢的人來說,簡直就是福音,甚至你可以一句一句的跟他讀,來學習英語!
比如世超最近用上了一個叫 “ 彩雲小譯 ” 軟體。
按照慣例,先念個開場詩~
臥槽有點准啊!
再問點別的。。。
程式師快來撕~
這裡要說一下,右下角那個自動的選項,彩雲小譯會自動識別你說的是中文還是英文,只要你想,隨便說,無縫切換~
自動識別模式可以自由切換
而且他能翻譯很多明星,對於日常的東西特別全~
更叼的是,他連一些很不正經的俚語都能翻譯。。。
可以分清 “ 小雞 ” 和 “ 小雞雞 ”
而且因為 AI 訓練的比較好, Google 翻譯 “ 松下問童子 ” 出現的蠢答案,在彩雲小譯上是不會出現的~
雖然翻譯的沒有那麼文雅,但已經能完整表達意思了
如果插上耳機,你還可以體驗同聲傳譯效果,對方正在說話的時候,你在耳機裡聽到的直接就是翻譯,延遲也就幾秒,溝通無障礙~
這個跟外國人交流時候的螢幕顛倒小細節,簡直不能太貼心!!!
這個小東西,對於像世超這種英語比較殘廢的人來說,簡直就是福音,甚至你可以一句一句的跟他讀,來學習英語!