華文網

外媒稱百度玩不轉移動互聯網 轉而押注人工智慧

提供材料的客戶將以低價獲得專業級別的中文譯文。但作為這場大型翻譯活動的組織者,百度看重的卻是更有價值的東西:他們希望用數以百萬的英漢詞對來訓練其線上翻譯引擎。

中國向來以“山寨大國”著稱,無論是名牌手包還是互聯網創業公司都概莫能外。但該國領導人似乎意識到,在人工智慧領域,成本低廉的模仿策略已經無法奏效——尤其是在面對Alphabet、Facebook、IBM和微軟這樣的競爭對手時。

今年2月,國家發改委指定百度領導成立一個新的人工智慧實驗室,表明中國政府認為該公司是這一領域的領頭羊。

百度聯合創始人兼CEO李彥宏在這個實驗室上月舉行的成立儀式上表示,百度過去兩年半的研發開支達到200億元人民幣(29億美元),多數都投向了人工智慧領域。但他發展這項技術的主要動機並不是為了迎合政府:百度去年營收增速萎縮到6%左右,

而之前3年平均每年都增長30%以上。

在截至12月31日的財年內,百度實現銷售額705億元人民幣,作為其中的重要來源,搜索廣告業務正在面臨本土競爭對手的圍攻。美國市場研究公司eMarketer今年9月發佈報告稱,

阿裡巴巴集團已經超過百度,成為中國數字廣告市場的領導者。百度希望人工智慧可以幫助其重新增加搜索份額,同時確保新業務取得成功。

由於這家成立至今17年的公司在實施多元化的過程中喜憂參半,所以此次嘗試顯得格外重要。中金分析師娜特莉·吳(Natalie Wu)預計,在截至2017年2月的12個月內,百度旗下團購網站糯米的日用戶訪問量下滑59%。百度外賣也僅位居行業第三。

該公司旗下的視頻網站愛奇藝雖然廣受歡迎,但華興資本分析師艾拉·季(Ella Ji)預計其今年的內容費用高達120億元人民幣。

正是因為有過這些失敗的經歷,因此百度進軍人工智慧領域被賦予更重要的意義。“移動互聯網時代已經結束。”李彥宏在3月10日接受採訪時說,“我們會大舉投資人工智慧,我們認為這會讓很多人獲益,還將改變很多行業。”

今年1月,該公司任命微軟高管陸奇為COO,

負責圍繞深度學習、增強現實和圖像識別等技術重塑該公司。在此之前,該公司還挖來了斯坦福大學學者、Alphabet深度學習部門前負責人吳恩達擔任首席科學家。

在吳恩達的領導下,百度的人工智慧團隊已經擴大到1300人,分佈在北京、深圳、上海和加州桑尼韋爾的多個實驗室。他們今年還有望再招聘幾百人。“有很多人在中國搞發明,還有很多人在美國搞發明。”吳恩達說,“在兩個國家都有人,我們就能看清最新趨勢。”

吳恩達

2014年5月,就在桑尼韋爾研發中心開張的當天,吳恩達和他的副手亞當·考特斯(Adam Coates)坐在一塊白板前,確定他們的第一個專案。在規劃了一系列可能性(和挑戰)之後,他們將語音辨識確定為一大基礎,認為可以基於此開發一系列產品。

到2015年中,這個由50人組成的團隊推出了一款名為Deep Speech的產品,可以分辨出許多英語語音。這款軟體並非挨個單詞進行識別,而是通過理解大量的語言資料來推測某種形態——這一過程被稱作深度學習。

吳恩達表示,由於考慮了文字背景來判斷其含義,該系統的識別準確率高於依靠詞彙表和語音詞典的傳統引擎。

但始終難以克服的是隨著時間推移從其他從語言引入英語的詞彙和姓名。“如果你說‘Play music by Tchaikovsky’(放一首柴可夫斯基的音樂),軟體會理解成‘Play music and try cough ski’。”從斯坦福大學跳槽來的考特斯說,“我們將此稱作‘柴可夫斯基問題’。”

百度的程式師沒有簡單地把“Tchaikovsky”加入系統的詞彙表,而是幫助Deep Speech通過自學來理解這個詞。這就需要通過更多資料説明系統理解上下文。

百度自然語言處理部門副主任趙世奇回憶道,當他在哈爾濱工業大學讀書時,電腦翻譯還只有200萬個英漢詞對,百度目前約有1億個。然而,根據2016年發表在《科學》雜誌上的論文,這仍然遠低於Alphabet的5億個。

為了縮小這一差距,百度採取了“人海戰術”的老辦法。該公司現在一年到頭都會為人工翻譯提供説明,還會定期舉行去年12月那樣的馬拉動活動,並為客戶提供智慧手機和淨水器等獎品。他們會借助這一過程中的資料來提升百度翻譯引擎的表現,同時進一步促進Deep Speech的發展。

桑尼韋爾團隊在2016年7月發佈了自己的軟體TalkType,這是一款帶有語音輸入功能的鍵盤。這項技術此後又整合到其他功能中,包括一款類似於Siri的個人助手——度秘。通過在Deep Speech中整合機器學習技術,便可為其他產品賦予智慧,包括今年1月在拉斯維加斯國際消費電子展(CES)上展示的的小魚在家語音控制機器人。

借助多樣化的網路業務,百度掌握了中國規模最大、最詳細的消費者資料庫之一。這應該為其開發人工智慧產品和服務帶來優勢——至少理論上如此。

通過糯米和百度外賣,該公司可以瞭解中國家庭的購買和就餐習慣,而攜程則可以幫助其瞭解消費者的休假目的地。每個月都有6.65億智慧手機用戶訪問該公司的移動門戶和應用,還有3.41億使用百度地圖搜索目的地。“把人工智慧當成一款產品是一種錯誤觀念——它是一種底層技術,可以催生其他產品。”滙豐銀行分析師Chi Tsang說,“可以設想各種用例。”

新的人工智慧產品並沒有為百度的業績做出太大貢獻。但該公司在這一領域的技能卻可以幫助其主導已經涉足的領域,並推動其進軍雲計算和無人駕駛汽車等新領域。

“未來3至5年,這些領域都有望成為另一個百度。”百度總裁張亞勤說,他指的是百度602億美元的市值。“現在該下注了。”

“在兩個國家都有人,我們就能看清最新趨勢。”

吳恩達

2014年5月,就在桑尼韋爾研發中心開張的當天,吳恩達和他的副手亞當·考特斯(Adam Coates)坐在一塊白板前,確定他們的第一個專案。在規劃了一系列可能性(和挑戰)之後,他們將語音辨識確定為一大基礎,認為可以基於此開發一系列產品。

到2015年中,這個由50人組成的團隊推出了一款名為Deep Speech的產品,可以分辨出許多英語語音。這款軟體並非挨個單詞進行識別,而是通過理解大量的語言資料來推測某種形態——這一過程被稱作深度學習。

吳恩達表示,由於考慮了文字背景來判斷其含義,該系統的識別準確率高於依靠詞彙表和語音詞典的傳統引擎。

但始終難以克服的是隨著時間推移從其他從語言引入英語的詞彙和姓名。“如果你說‘Play music by Tchaikovsky’(放一首柴可夫斯基的音樂),軟體會理解成‘Play music and try cough ski’。”從斯坦福大學跳槽來的考特斯說,“我們將此稱作‘柴可夫斯基問題’。”

百度的程式師沒有簡單地把“Tchaikovsky”加入系統的詞彙表,而是幫助Deep Speech通過自學來理解這個詞。這就需要通過更多資料説明系統理解上下文。

百度自然語言處理部門副主任趙世奇回憶道,當他在哈爾濱工業大學讀書時,電腦翻譯還只有200萬個英漢詞對,百度目前約有1億個。然而,根據2016年發表在《科學》雜誌上的論文,這仍然遠低於Alphabet的5億個。

為了縮小這一差距,百度採取了“人海戰術”的老辦法。該公司現在一年到頭都會為人工翻譯提供説明,還會定期舉行去年12月那樣的馬拉動活動,並為客戶提供智慧手機和淨水器等獎品。他們會借助這一過程中的資料來提升百度翻譯引擎的表現,同時進一步促進Deep Speech的發展。

桑尼韋爾團隊在2016年7月發佈了自己的軟體TalkType,這是一款帶有語音輸入功能的鍵盤。這項技術此後又整合到其他功能中,包括一款類似於Siri的個人助手——度秘。通過在Deep Speech中整合機器學習技術,便可為其他產品賦予智慧,包括今年1月在拉斯維加斯國際消費電子展(CES)上展示的的小魚在家語音控制機器人。

借助多樣化的網路業務,百度掌握了中國規模最大、最詳細的消費者資料庫之一。這應該為其開發人工智慧產品和服務帶來優勢——至少理論上如此。

通過糯米和百度外賣,該公司可以瞭解中國家庭的購買和就餐習慣,而攜程則可以幫助其瞭解消費者的休假目的地。每個月都有6.65億智慧手機用戶訪問該公司的移動門戶和應用,還有3.41億使用百度地圖搜索目的地。“把人工智慧當成一款產品是一種錯誤觀念——它是一種底層技術,可以催生其他產品。”滙豐銀行分析師Chi Tsang說,“可以設想各種用例。”

新的人工智慧產品並沒有為百度的業績做出太大貢獻。但該公司在這一領域的技能卻可以幫助其主導已經涉足的領域,並推動其進軍雲計算和無人駕駛汽車等新領域。

“未來3至5年,這些領域都有望成為另一個百度。”百度總裁張亞勤說,他指的是百度602億美元的市值。“現在該下注了。”