您的位置:首頁>正文

為什麼巨頭紮堆做機器翻譯?網易有道用AI替代了50%人工譯員

10年前, 網易有道翻譯產品上線, 接替了傳統電子翻譯機“文曲星”的班, 是國內最早涉足翻譯領域的互聯網公司。 此後數年間, 類似的翻譯產品貫 穿了很多中國人學英語的記憶。

但由於時常出現形態尷尬的整句翻譯, 沒人指望機器翻譯能大規模替代嚴謹的人工譯員。 每逢正式的用途, 人們仍願意出高價雇個英語專八的學生, 甚至專業同傳來確保準確度。

一直以來, 翻譯是很多外文系學生賺外快甚至謀生的管道。 這門生意 規模不大, 但需求穩定。 網易有道CEO周楓估算過人工翻 譯市場的盤子, 400億元左右。

目前有道的純人工翻譯業務, 一年的營收規模數千萬元。 2011年上線五年的訂單總量在一百萬單以上。

不過去年事情有了變化。 原因是穀歌在2016年9月27日宣佈推出穀歌神 經網路機器翻譯系統, 《麻省理工學院技術評論》雜誌評價, 採用神經網路技術的Google翻譯準確率幾乎與 人類無異。

神經網路翻譯之所以準確性高, 是因為“說人話”。 它在翻譯邏輯模 仿了人腦的表達模式, 通俗地講, 能把一句話中所有詞彙的語意融合在一起分析理解。 而統計翻譯是挨個識別和理解詞彙, 卻難 以理解不同詞彙融合後產生的含義。 經常生硬地蹦關鍵字, 串起來就不知所云。

這項技術變革對於翻譯行業有多大意義?周楓的評價是, 從傳統機器 翻譯到神經網路機器翻譯的變革,

可以比喻成從“手工針線活兒”到“縫紉機”的變革, 神經網路翻譯帶來的翻譯品質的提升, 是過去十年的總和。

網易有道開始關注神經網路翻譯技術, 是2014年。 這個舉動源自行業中一項節點性事件——在國際賽事ACL WMT 2014中, 神經網路翻譯技術的準確率首次超過傳統的統計機器翻譯技術, 這意味著神經網路翻譯初步具備了商業化的可能性。

這個突破對於做翻譯產品的公司而言, 出現得恰逢其時。 “2014年, 統計機器翻譯技術的商業化已經發展了近十年, 我們發現再投入人力資金去尋求技術提升, 回報率很低。 而NMT這種基於深度學習 的技術, 每個月翻譯品質的進步都是驚人的。 ”周楓說。

在那之後的兩年間,

關於神經網路翻譯的研發戰爭就開始了。 根據新 智元統計, 在arXiv.org 存儲庫中, 涉及NMT (神經網路翻譯) 的論文從2014年的7篇, 2015年的11篇, 上漲2016年的67篇。

而大規模的產品化, 發生在谷歌發佈翻譯產品之後的半年中, 穀歌、百度、科大訊飛、搜狗、微軟、有道, 均上線或更新了翻譯產品。 有道的NMT技術也被迅速地應 用在商業化產品中, 有道詞典、有道翻譯官、有道智雲、WEB端的有道翻譯以及 有道人機翻譯。 使用者使用這些產品的場景各有側重, 但都能夠使用NMT技術來做翻譯。

你可能會奇怪, 為什麼大型技術公司都紮堆做翻譯?事實上, 無論對 於上述哪家公司, 翻譯都不是塊有極大商業空間的業務。 但在機器替代人類勞動力的征途裡, 這是最先感受到衝擊的前哨陣地。

因為在既有的AI技術中, 機器翻譯 是成熟度相對高的領域。 即便出於炫技, 翻譯也是必爭之地。

當然, 對公司而言, 能轉化成錢、衍生出商業模式的技術才有價值。

有道翻譯有一支3000人規模的眾包譯員 團隊, 此前分為人工翻譯和機器翻譯兩種類別, 前者150-300元/千字, 後者免費。 神經網路翻譯將機器翻譯的準確度提升後, 人機結合的商業模式具備了可行性。 即由機器先做翻譯, 人工翻譯員做後續的審核和 潤色。 人工需要付出的時間和精力由此縮減了50%, 相應的, 人機翻譯的價格, 設定在70-150元/千字檔位。 對企業級客戶, 有道也推出了有道智雲, 通過提供API介面和嵌入SDK的模式銷售。

技術提升引發的成本下降, 往往是撕開商業化缺口的契機。

周楓覺得 人機結合的方式, 降低了使用者的使用成本, 會激發出一部分此前被壓抑的翻譯需求。 “原來人工翻譯篇一萬字的文章大概需要兩 千元左右, 很多人覺得貴, 翻譯需求就會被壓抑掉。 現在用人機結合翻譯能降低一半的成本, 被壓抑的需求會釋放出來, 翻譯的 市場容量也許會因為技術革新而變得更大。 ”

另一方面, 由於精准度提升和移動端翻譯的用戶習慣的拓展, 翻譯的 需求量也在釋放。 網易有道官方提供的資料顯示, 有道翻譯官在去年一年的使用量呈現出三倍的提升。

根據周楓的估算, 除卻藝術屬性的文學領域和對準確性要求非常高的商業合同等領域, 三年左右時間, 機器翻譯會替代包括日常通信、新聞、技術文檔、學術文獻等90%的人工翻譯場景。

不過機器翻譯依然是個贏者通吃的小市場。過去兩年,做語音技術起 家的科大訊飛,也開闢了翻譯業務。集中產品化不到一年,已然是一片紅海態勢。同傳之後,下一個被佔領的人類高地,又會是哪塊呢?

不過機器翻譯依然是個贏者通吃的小市場。過去兩年,做語音技術起 家的科大訊飛,也開闢了翻譯業務。集中產品化不到一年,已然是一片紅海態勢。同傳之後,下一個被佔領的人類高地,又會是哪塊呢?

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示