您的位置:首頁>科技>正文

騰訊推出機器人翻譯,翻譯將下崗,2018年將迎來BAT和科大訊飛的翻譯之戰!

品途解讀:人工智慧技術在機器翻譯領域表現出了讓人驚喜的水準, 巨頭紮推進入, 機器翻譯的未來註定是無限接近於人。

作者/尹天琦

打破語言障礙一直是人類的夢想, 什麼時候人類不用再為學習外語而發愁?翻譯AI正在替人類分憂。 當今, 翻譯軟體已經成為了出國旅行必備品。 雖然有時它還不夠精准, 但是不能否認的是:機器翻譯的未來註定是無限接近於人。

巨頭騰訊也看好機器翻譯的廣闊前景。 在過去兩年, 騰訊內部成立了三個關於人工智慧機器翻譯的部門, 悄悄的開始佈局這一領域。 翻譯君成為了三個團隊中走出來的隊伍。 其專案負責人李學朝向品途商業評論透露:“騰訊的風格就是這樣, 在產品有成果之前保持低調。 ”

如今翻譯君的成果包括:可以完成同聲傳譯、拍照翻譯、詞典查詢、口語跟讀等工作。 其中的即時語音對話功能,

能夠為出境旅遊、外語學習、日常工作生活等跨語種交流提即時、準確、快速的同步翻譯服務。

從騰訊翻譯君看機器翻譯的突破

事實上, 在過去兩年, 深度學習已經完全改寫了機器翻譯方法。 對語言翻譯一無所知的深度學習研究人員正在利用相對簡單的機器學習解決方案,

打敗世界上頂級翻譯學家建造的語言翻譯系統。

騰訊踩在了技術突破的節點提前進入翻譯賽道。 在2016年初, 騰訊開始研發AI翻譯產品。 但是那個時候, 整個機器翻譯技術採用的還是一種叫做SMT的統計機器翻譯技術, 其背後的核心演算法是基於短語的機器翻譯, 錯誤率較高。

直到2016年底穀歌在機器翻譯領域取得重大突破, 其發佈了神經網路機器翻譯系統(Google Neural Machine Translation), 簡稱GNMT, 實現了迄今為止機器翻譯品質的最大提升。 在不同的語言對比中, GNMT把PBMT與人工翻譯的鴻溝縮小了58% ~85%, 接近了人工翻譯的水準。

谷歌翻譯準確率

這一突破背後的技術被稱為序列到序列學習sequence to sequence learning。 這是一項非常強大的技術, 除了應用于翻譯, 這個演算法還可以應用於編寫AI聊天機器人和描述圖片。

這項技術突破後, 許多人工翻譯工作者感慨到:“作為翻譯, 看到這個新聞的時候, 我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼。 ”

NMT演算法雖然成為巨大突破, 但由於但不幸的是, NMT 系統的訓練成本非常高,

限制了這一技術的大範圍使用, 僅有少數互聯網巨頭能夠投入並使用得起這樣的技術。

正是看到這門技術的高門檻和為整個行業帶來的大突破後, 騰訊翻譯君團隊很快調轉走向, 採用了NMT技術。 翻譯君團隊基於神經網路的演算法和騰訊的資料開發了TNMT演算法。

2017年翻譯君悄然上線, 目前, 翻譯君支持中英日韓法德意土等15種語言和80個語種的對翻譯。

李學朝向品途商業評論介紹:“不同於基於短語的機器翻譯, 騰訊翻譯君採用神經網路機器翻譯技術, 能從語料庫中自主學習自動翻譯, 並將整個句子視作翻譯的基本單元, 使譯文更準確, 更符合各個國家的語言習慣。 ”

根據BLEU以及專業人工評測資料顯示, 騰訊翻譯君各項翻譯能力均領先業界, 尤其在中英互譯方面領先優勢明顯。其主要的應用場景包括,出國旅遊、跨語言社交和會議翻譯等。除了2C的應用場景外,騰訊翻譯君還向各行業開放了翻譯服務能力,目前與金山詞霸、VIPKID、大眾點評等多領域頭部平臺達成合作。

李學朝介紹,例如在VIPKID上外國教師對於幼兒的評價,家長可以直接點擊翻譯成中文。而對於美團和途家等佈局海外的企業,翻譯君也可以直接將點評翻譯成不同的語言。在騰訊內部,翻譯君也服務了國際版QQ、QQ郵箱、QQ流覽器和騰訊雲等產品以及騰訊多次國際會議。目前翻譯君的日服務請求量已經超過3億次。

騰訊入局,國內的機器翻譯大戰一觸即發

雖然背靠騰訊這個流量製造機,但是翻譯君確實屬於入行比較晚。在騰訊內部PK勝出後,翻譯君將要面臨的首先是國內的機器翻譯企業的殘酷競爭。目前的國內翻譯市場,已經有百度、科大訊飛、阿裡巴巴和網易等巨頭行動在前,還有外來者穀歌和微軟等外來者的強勢入侵。翻譯君的前途註定充滿挑戰。

百度是國內最早佈局機器翻譯領域的公司,2016年,12 月 21 日,在百度機器翻譯技術開放日上,百度技術委員會聯席主席、自然語言處理部技術負責人吳華博士表示,百度早于穀歌一年多,就率先發佈了世界上首個互聯網 NMT 系統,引領機器翻譯進入神經網路翻譯時代。

百度還結合OCR技術和語音辨識技術,發佈了具有豐富實用功能的翻譯 APP ,可以即時的通過攝像頭的取景框來翻譯外文景點指示牌、菜單、說明書和實物等。結合語音技術的會話翻譯,可以幫助實現不同語種的無障礙交流。

除了百度,在機器翻譯領域一直走在前列的就是科大訊飛,從誕生之提起,訊飛就開始佈局語言和翻譯領域的專案。在我們2016年度發佈會上,科大訊飛CEO胡郁與外國友人為大家現場演示了如何通過一款“神器”,來進行中英文之間的無礙溝通。

基於深度神經網路演算法上的創新和突破,科大訊飛在2014年國際口語翻譯大賽IWSLT上獲得中英和英中兩個翻譯方向的全球第一名;在2015年又在由美國國家標準技術研究院組織的機器翻譯大賽中取得全球第一的成績。

2017年科大訊飛而且還推出了多款硬體翻譯產品,其中曉譯翻譯機1.0plus將世界上最先進的神經網路翻譯系統,從線上系統優化成一個離線系統。它可以在沒有網路的情況下提供基本的翻譯服務,能夠做到這一點的目前似乎只有訊飛。

相比於百度和科大訊飛,阿裡巴巴和騰訊都屬於機器翻譯領域的後來者。

不過馬雲可能不服,因為馬雲爸爸在創立阿裡之前就是做翻譯服務的。2015年6月份,阿裡就已收購國內最大的眾包翻譯平臺——365翻譯。當時把阿裡翻譯平臺定位為阿裡巴巴的語言服務平臺,將瞄準人機結合模式,在語言服務領域進行更多創新。

2017年7月12日,阿裡巴巴披露的一份技術資料顯示,阿裡翻譯團隊通過使用阿裡雲機器學習平臺PAI實現了模型訓練效率5倍的飛躍,並已應用在英俄電商翻譯品質優化項目中。

在阿裡巴巴內部,阿裡翻譯負責為1688國際站、全球速賣通等提供多語言服務,中國賣家填寫的一些中文資訊會被機器自動翻譯成多國語言。該團隊同時還為釘釘、東南亞電商Lazada等提供服務。目前阿裡的翻譯聚焦在電商領域。

除了BAT網易和搜狗也佈局了機器翻譯。2017年5月,網易有道在GMIC(全球移動互聯網大會)未來創新峰會上公佈:由網易公司自主研發的神經網路翻譯( Neural Machine Translation,以下簡稱NMT)技術正式上線。作為受到丁磊親自“過問”、網易最重要技術創新之一,此次在有道上線的NMT技術,由網易有道與網易杭州研究院歷時兩年合力研發,將服務於有道詞典、有道翻譯官、有道翻譯網頁版、有道e讀等產品。

2017年,搜狗機器翻譯團隊獲得 WMT (是機器翻譯領域的國際頂級評測比賽之一)中英機器翻譯冠軍。

搜狗機器翻譯團隊成立於 2016 年,是搜狗知音引擎的重要技術方向,成立之初,基於知音引擎團隊在語音技術方面的積累,半年內自研完成了搜狗自有的神經網路機器翻譯技術,目前機器翻譯技術已經應用在搜狗同傳和搜狗輸入法的語音、文本翻譯中。

巨頭紮推商業模式多元化

既然NMT的技術成本如此之高,為什麼巨頭還紮推來做呢?因為這門技術如果落地到商業領域將帶來非常廣闊的前景。

搜狗王小川認為,機器翻譯類似於“語音辨識”,獨立存在的商業模式有限。最好的方式是把這個技術融入到其他產品中去升級其他產品,讓其他產品更強大。

機器翻譯最廣闊的商用場景就是賦能。

在商用方向,百度翻譯有超過1萬個協力廠商應用接入,例如華為將翻譯服務集成到其Ascend Mate7手機的攝像頭翻譯應用中,帶有翻譯功能的手機被銷往法國、德國等30多個國家和地區;B2B跨境電子商務平臺「敦煌網」使用「百度翻譯」進行跨境貿易,促進了對外貿易的發展。據統計,百度翻譯為企業每年節省的人工翻譯成本折合人民幣高達2億元。這為百度帶來豐厚的利潤。

在C端領域商用中,科大訊飛也實現了變現,曉譯翻譯機可以滿足80%的出國人員在各種各樣情況下使用翻譯系統。其背後設置了SOS的緊急聯絡按鈕。在遇到緊急情況的時候,按下鍵三秒鐘,所在的位置就會在訊飛後臺專業服務中心的大螢幕上呈現出來,還可以接通緊急連絡人或大使館的電話。這樣的產品在京東上售價2999,好評率達到98%。其在京東上已經有數萬的銷量和評論。

在商業模式上,翻譯君負責人李學朝認為,騰訊自己做機器翻譯不僅可以省掉騰訊公司內部的翻譯費用,未來還可以賦能給社交產品、甚至騰訊整個生態。

如今僅翻譯君團隊就有20多位人工智慧專家全職支持這個項目,可見騰訊想要拿下這個領域的決心。

騰訊在全球合作夥伴大會發佈8大AI應用場景

人工智慧技術在機器翻譯領域確實表現出了讓人驚喜的水準。無論是說走就走的出國旅遊,還是跨洋交流的留學辦公,使用語音翻譯軟體來實現“說中文,出英文”的功能效果,基本都能滿足與外國人的日常的短語交流,大大提升彼此的溝通效率。

雖然在長句子和情感的翻譯上,機器翻譯還有很大誤差,但是從巨頭花費大價錢和精力競相投入到該領域的力度就可以看出它未來廣闊的前景。

據統計,全世界有5000餘種語言。其中使用人口達5000萬的有19種。

能夠掌握10種語言以上的人也寥寥無幾,語音辨識與同傳翻譯的組合,提供了溝通無障礙的可能,這影響的不僅是翻譯本身這件事,它還將帶來更多文化上的碰撞。

關於突破語言障礙,《聖經》中有一句這樣的預言:“看哪!他們成為一樣的人民,都是一樣的言語,以後他們所要做的事就沒有不成就的了。”

尤其在中英互譯方面領先優勢明顯。其主要的應用場景包括,出國旅遊、跨語言社交和會議翻譯等。除了2C的應用場景外,騰訊翻譯君還向各行業開放了翻譯服務能力,目前與金山詞霸、VIPKID、大眾點評等多領域頭部平臺達成合作。

李學朝介紹,例如在VIPKID上外國教師對於幼兒的評價,家長可以直接點擊翻譯成中文。而對於美團和途家等佈局海外的企業,翻譯君也可以直接將點評翻譯成不同的語言。在騰訊內部,翻譯君也服務了國際版QQ、QQ郵箱、QQ流覽器和騰訊雲等產品以及騰訊多次國際會議。目前翻譯君的日服務請求量已經超過3億次。

騰訊入局,國內的機器翻譯大戰一觸即發

雖然背靠騰訊這個流量製造機,但是翻譯君確實屬於入行比較晚。在騰訊內部PK勝出後,翻譯君將要面臨的首先是國內的機器翻譯企業的殘酷競爭。目前的國內翻譯市場,已經有百度、科大訊飛、阿裡巴巴和網易等巨頭行動在前,還有外來者穀歌和微軟等外來者的強勢入侵。翻譯君的前途註定充滿挑戰。

百度是國內最早佈局機器翻譯領域的公司,2016年,12 月 21 日,在百度機器翻譯技術開放日上,百度技術委員會聯席主席、自然語言處理部技術負責人吳華博士表示,百度早于穀歌一年多,就率先發佈了世界上首個互聯網 NMT 系統,引領機器翻譯進入神經網路翻譯時代。

百度還結合OCR技術和語音辨識技術,發佈了具有豐富實用功能的翻譯 APP ,可以即時的通過攝像頭的取景框來翻譯外文景點指示牌、菜單、說明書和實物等。結合語音技術的會話翻譯,可以幫助實現不同語種的無障礙交流。

除了百度,在機器翻譯領域一直走在前列的就是科大訊飛,從誕生之提起,訊飛就開始佈局語言和翻譯領域的專案。在我們2016年度發佈會上,科大訊飛CEO胡郁與外國友人為大家現場演示了如何通過一款“神器”,來進行中英文之間的無礙溝通。

基於深度神經網路演算法上的創新和突破,科大訊飛在2014年國際口語翻譯大賽IWSLT上獲得中英和英中兩個翻譯方向的全球第一名;在2015年又在由美國國家標準技術研究院組織的機器翻譯大賽中取得全球第一的成績。

2017年科大訊飛而且還推出了多款硬體翻譯產品,其中曉譯翻譯機1.0plus將世界上最先進的神經網路翻譯系統,從線上系統優化成一個離線系統。它可以在沒有網路的情況下提供基本的翻譯服務,能夠做到這一點的目前似乎只有訊飛。

相比於百度和科大訊飛,阿裡巴巴和騰訊都屬於機器翻譯領域的後來者。

不過馬雲可能不服,因為馬雲爸爸在創立阿裡之前就是做翻譯服務的。2015年6月份,阿裡就已收購國內最大的眾包翻譯平臺——365翻譯。當時把阿裡翻譯平臺定位為阿裡巴巴的語言服務平臺,將瞄準人機結合模式,在語言服務領域進行更多創新。

2017年7月12日,阿裡巴巴披露的一份技術資料顯示,阿裡翻譯團隊通過使用阿裡雲機器學習平臺PAI實現了模型訓練效率5倍的飛躍,並已應用在英俄電商翻譯品質優化項目中。

在阿裡巴巴內部,阿裡翻譯負責為1688國際站、全球速賣通等提供多語言服務,中國賣家填寫的一些中文資訊會被機器自動翻譯成多國語言。該團隊同時還為釘釘、東南亞電商Lazada等提供服務。目前阿裡的翻譯聚焦在電商領域。

除了BAT網易和搜狗也佈局了機器翻譯。2017年5月,網易有道在GMIC(全球移動互聯網大會)未來創新峰會上公佈:由網易公司自主研發的神經網路翻譯( Neural Machine Translation,以下簡稱NMT)技術正式上線。作為受到丁磊親自“過問”、網易最重要技術創新之一,此次在有道上線的NMT技術,由網易有道與網易杭州研究院歷時兩年合力研發,將服務於有道詞典、有道翻譯官、有道翻譯網頁版、有道e讀等產品。

2017年,搜狗機器翻譯團隊獲得 WMT (是機器翻譯領域的國際頂級評測比賽之一)中英機器翻譯冠軍。

搜狗機器翻譯團隊成立於 2016 年,是搜狗知音引擎的重要技術方向,成立之初,基於知音引擎團隊在語音技術方面的積累,半年內自研完成了搜狗自有的神經網路機器翻譯技術,目前機器翻譯技術已經應用在搜狗同傳和搜狗輸入法的語音、文本翻譯中。

巨頭紮推商業模式多元化

既然NMT的技術成本如此之高,為什麼巨頭還紮推來做呢?因為這門技術如果落地到商業領域將帶來非常廣闊的前景。

搜狗王小川認為,機器翻譯類似於“語音辨識”,獨立存在的商業模式有限。最好的方式是把這個技術融入到其他產品中去升級其他產品,讓其他產品更強大。

機器翻譯最廣闊的商用場景就是賦能。

在商用方向,百度翻譯有超過1萬個協力廠商應用接入,例如華為將翻譯服務集成到其Ascend Mate7手機的攝像頭翻譯應用中,帶有翻譯功能的手機被銷往法國、德國等30多個國家和地區;B2B跨境電子商務平臺「敦煌網」使用「百度翻譯」進行跨境貿易,促進了對外貿易的發展。據統計,百度翻譯為企業每年節省的人工翻譯成本折合人民幣高達2億元。這為百度帶來豐厚的利潤。

在C端領域商用中,科大訊飛也實現了變現,曉譯翻譯機可以滿足80%的出國人員在各種各樣情況下使用翻譯系統。其背後設置了SOS的緊急聯絡按鈕。在遇到緊急情況的時候,按下鍵三秒鐘,所在的位置就會在訊飛後臺專業服務中心的大螢幕上呈現出來,還可以接通緊急連絡人或大使館的電話。這樣的產品在京東上售價2999,好評率達到98%。其在京東上已經有數萬的銷量和評論。

在商業模式上,翻譯君負責人李學朝認為,騰訊自己做機器翻譯不僅可以省掉騰訊公司內部的翻譯費用,未來還可以賦能給社交產品、甚至騰訊整個生態。

如今僅翻譯君團隊就有20多位人工智慧專家全職支持這個項目,可見騰訊想要拿下這個領域的決心。

騰訊在全球合作夥伴大會發佈8大AI應用場景

人工智慧技術在機器翻譯領域確實表現出了讓人驚喜的水準。無論是說走就走的出國旅遊,還是跨洋交流的留學辦公,使用語音翻譯軟體來實現“說中文,出英文”的功能效果,基本都能滿足與外國人的日常的短語交流,大大提升彼此的溝通效率。

雖然在長句子和情感的翻譯上,機器翻譯還有很大誤差,但是從巨頭花費大價錢和精力競相投入到該領域的力度就可以看出它未來廣闊的前景。

據統計,全世界有5000餘種語言。其中使用人口達5000萬的有19種。

能夠掌握10種語言以上的人也寥寥無幾,語音辨識與同傳翻譯的組合,提供了溝通無障礙的可能,這影響的不僅是翻譯本身這件事,它還將帶來更多文化上的碰撞。

關於突破語言障礙,《聖經》中有一句這樣的預言:“看哪!他們成為一樣的人民,都是一樣的言語,以後他們所要做的事就沒有不成就的了。”

Next Article
喜欢就按个赞吧!!!
点击关闭提示