您的位置:首頁>科技>正文

劉霽:延伸機器學習演算法邊界|“35歲以下科技創新35人”中國榜單

自 1999 年起, 《麻省理工科技評論》每年都會推出“35歲以下創新35人”(Innovators Under 35)榜單, 旨在於全球範圍內評選出被認為最有才華、最具創新精神, 以及最有可能改變世界的 35 位年輕技術創新者或企業家, 共分為發明家、創業家、遠見者、人文關懷者及先鋒者五類。

2017 年, 該全球權威榜單正式推出中國區評選, 並已公佈並首屆評選結果。 現在, 《麻省理工科技評論》正式開設“35歲以下創新35人”中國榜單專欄, 以人物報導的形式説明中文讀者瞭解這些來自中國的新生代科技力量。

劉霽·遠見者

延伸機器學習演算法的邊界

獲獎年份:2017年

年齡:34 歲

職位:騰訊AI Lab專家研究員及美國羅徹斯特大學助理教授

獲獎事由:讓機器學習演算法更準確更高效, 探索人工智慧潛力的邊界

遊戲AI的研發將會進一步拓寬人類對於AI能力的認知。 作為騰訊 AI Lab 的專家工程師, 劉霽正在帶領團隊攻克多人即時戰略遊戲的 AI設計問題。

這件在普通人眼裡看來頗好玩的任務, 實際上難度非常大。 因為這樣的研究最終將探索的問題是: AI 能否能夠通過協作超越圍棋AI這種單體智慧, 達到更高層次的群體智慧。

這個問題的解決離不開AI 的核心領域——機器學習。 而在機器學習遠不如當下火熱的時候, 劉霽就選擇了這個研究方向, 一是因為他對研究通用性的方法更感興趣, 二是這個方向也更具挑戰。

具體而言, 劉霽的工作涵蓋了以下幾個領域:非同步平行算法、學習、張量完成、分散優化等時下非常重要的話題。 其中, 劉霽已經在非同步平行算法創新上取得了不少成績。

所謂非同步並行指的是, 本地機器各自進行自己的訓練工作, 一段時間以後將模型更新到參數伺服器上,

然後並不等待其他機器就進行下一輪的本地訓練。 這個過程的好處就是快, 因為各個機器之間不需要互相等待, 因此非同步並行被大量使用。

劉霽提出的一系列非同步平行算法, 則解決了傳統同步平行算法的瓶頸問題——快機等待慢機。 同時, 他的相關理論研究還解決了非同步並行的深度學習演算法中的一個開放性問題——關於非同步 SGD 演算法正確性和效率保證, 該非同步 SGD 平行算法已經廣泛運用於各種主流的機器學習計算軟體和平臺, 例如Google 開發的 Tensorflow、微軟開發的 CNTK以及亞馬遜開發的 MXNet 等。

圖 | 劉霽

他還注意到機器學習領域的一個新趨勢:傳統機器學習的研究側重於改變機器學習演算法去適應已有的硬體, 隨著新一代可程式設計硬體的流行與普及, 共同設計演算法和硬體正在成為工業界和學術界的關注對象。

基於此, 他提出並實踐了優化演算法和計算硬體的聯合設計的概念, 開發出第一個支持“端到端”低精度運算的機器學習框架——通過降低資料精度該框架減少了通訊代價並保證高精度求解,

這解決了ETH合作者在系統層面的的困擾和瓶頸。 隨著可程式設計硬體普及到雲端, 該框架也被實現在了亞馬遜的雲平臺上。 目前, 他正在和合作者共同探索該平臺在加速世界上最大的分佈在南非和澳大利亞的射電望遠鏡陣列、以及加速大規模蛋白質組和醫學與工業三維重建等研究中的應用。

除此之外, 劉霽設計了機器學習中去中心化的平行計算框架。 相比于傳統中心化平行計算, 該計算結構可以極大地減少通訊代價, 相關成果已被頂級機器學習會議 NIPS 2017 大會報告收錄。

劉霽用一個成語概括了這些創新的產生, 那就是“厚積薄發”。 “我從來不相信隨便拍腦袋就能產生有價值的創新。這是一個艱苦卓絕無比煎熬的過程,簡單來說就是掉頭發的過程”,他幽默地說道。

回憶起自己的科研道路,其中既有劉霽自己的堅持,“更多的是幸運得在正確的時間遇到正確的人能給我指引”,劉霽說道。他在博士階段就遇到了很多對他影響深遠的老師:從Benjamin Recht教授那裡學到如何尋找有價值的科研問題;從博士導師Stephen Wright看到了最純粹的科研本質和最嚴謹的科研態度;從袁明教授那裡學到了從一般到特殊再從特殊到一般的科研方法論;從Jerry Zhu教授那裡學到了如何開拓一個全新的研究領域……

而對於自己正在從事的遊戲AI的研發,劉霽認為,“這可以算是一個open research problem。這個項目主要集中研究一些即時戰略遊戲,比如王者榮耀、星際爭霸。即時戰略遊戲其實要比圍棋難很多,Deepmind和openAI也在研究類似的問題。對我來說這個項目的重要意義在於探求AI能力的邊界”。

在遊戲AI的設計中,增強學習演算法的改進將至關重要。增強學習是一種能夠提高 AI 能力的核心演算法,它讓 AI 能夠解決具有不確定性動態的決策問題(比如遊戲 AI,智慧投資,自動駕駛,個性化醫療),這些問題往往也更加複雜。

但是,大部分增強學習的演算法研究都偏於啟發式,缺乏理論支持和本質上的理解。劉霽則打破常規,把增強學習問題等價的轉化成等價的 minimax 優化問題,從此建立了增強學習和優化的橋樑,很多優化的理論結果和計算方法可以更快地應用到增強學習上。該工作被 UAI (The Conference on Uncertainty in Artificial Intelligence)2015 選為 Facebook最優論文獎,相關研究和成果也正被用於研究非基因因素對於一型糖尿病的影響上。

現在,除了遊戲AI的研發,劉霽仍在從事去中心化的平行計算的研究,這可能會改變當前主流機器學習平臺(比如google的TensorFlow)的設計思路,同時也很有可能帶來新的互聯網服務方式。

值得一提的是,對於當下愈演愈烈的AI熱潮,劉霽認為,自己作為AI領域科技工作者的使命是把AI轉化成生產力,讓AI服務於全人類,與此同時,他也有義務幫助普通大眾以更科學的視角看待AI。

“普通人對於AI的看法,通常容易走向兩個極端,要不是AI即將要取代人類,要不就是AI除了下下棋好像沒有什麼實際用處。從AI在歷史上的幾次大起大落的經歷來看,這兩種看法都過於極端,並不利於AI的發展。我對AI持有謹慎的樂觀態度:AI全面影響人類的生活是大勢所趨,但也還有很長的路要走。”劉霽說。

“我從來不相信隨便拍腦袋就能產生有價值的創新。這是一個艱苦卓絕無比煎熬的過程,簡單來說就是掉頭發的過程”,他幽默地說道。

回憶起自己的科研道路,其中既有劉霽自己的堅持,“更多的是幸運得在正確的時間遇到正確的人能給我指引”,劉霽說道。他在博士階段就遇到了很多對他影響深遠的老師:從Benjamin Recht教授那裡學到如何尋找有價值的科研問題;從博士導師Stephen Wright看到了最純粹的科研本質和最嚴謹的科研態度;從袁明教授那裡學到了從一般到特殊再從特殊到一般的科研方法論;從Jerry Zhu教授那裡學到了如何開拓一個全新的研究領域……

而對於自己正在從事的遊戲AI的研發,劉霽認為,“這可以算是一個open research problem。這個項目主要集中研究一些即時戰略遊戲,比如王者榮耀、星際爭霸。即時戰略遊戲其實要比圍棋難很多,Deepmind和openAI也在研究類似的問題。對我來說這個項目的重要意義在於探求AI能力的邊界”。

在遊戲AI的設計中,增強學習演算法的改進將至關重要。增強學習是一種能夠提高 AI 能力的核心演算法,它讓 AI 能夠解決具有不確定性動態的決策問題(比如遊戲 AI,智慧投資,自動駕駛,個性化醫療),這些問題往往也更加複雜。

但是,大部分增強學習的演算法研究都偏於啟發式,缺乏理論支持和本質上的理解。劉霽則打破常規,把增強學習問題等價的轉化成等價的 minimax 優化問題,從此建立了增強學習和優化的橋樑,很多優化的理論結果和計算方法可以更快地應用到增強學習上。該工作被 UAI (The Conference on Uncertainty in Artificial Intelligence)2015 選為 Facebook最優論文獎,相關研究和成果也正被用於研究非基因因素對於一型糖尿病的影響上。

現在,除了遊戲AI的研發,劉霽仍在從事去中心化的平行計算的研究,這可能會改變當前主流機器學習平臺(比如google的TensorFlow)的設計思路,同時也很有可能帶來新的互聯網服務方式。

值得一提的是,對於當下愈演愈烈的AI熱潮,劉霽認為,自己作為AI領域科技工作者的使命是把AI轉化成生產力,讓AI服務於全人類,與此同時,他也有義務幫助普通大眾以更科學的視角看待AI。

“普通人對於AI的看法,通常容易走向兩個極端,要不是AI即將要取代人類,要不就是AI除了下下棋好像沒有什麼實際用處。從AI在歷史上的幾次大起大落的經歷來看,這兩種看法都過於極端,並不利於AI的發展。我對AI持有謹慎的樂觀態度:AI全面影響人類的生活是大勢所趨,但也還有很長的路要走。”劉霽說。

Next Article
喜欢就按个赞吧!!!
点击关闭提示