您的位置:首頁>科技>正文

【鈦坦白】阿裡雲閔萬里:從人腦研究入手,使人工智慧不再“四肢發達,頭腦簡單”

在鈦媒體Pro專業用戶和付費用戶專享的“鈦坦白”線上課堂第32期, 我們請來了三位鈦客, 分享對機器學習的思考 。 本期鈦客之一、阿裡雲人工智慧科學家、人工智慧孵化團隊負責人閔萬里博士,

是千人計畫專家, 同濟大學客座教授, 2017 KDD CUP 大賽出題者。 14歲被中科大少年班錄取, 19歲赴美攻讀物理學碩士, 後獲得芝加哥大學統計學博士學位。 先後在IBM TJ Watson Research Center及 Google 擔任研究員。 2013年加入阿裡巴巴, 參與主導了杭州城市大腦、餓了麼人工智慧調度等大型AI項目。

本文根據閔萬里博士的分享整理。 全文需要成為鈦媒體專業用戶才可以查看。 進入鈦坦白九個專業群交流, 並查看更豐富的專業資料和資訊, 可點擊:http://www.tmtpost.com/pro 註冊成為鈦媒體專業用戶。

以下根據閔萬里在鈦坦白的分享實錄整理:

大家好, 我叫閔萬里, 花名山景, 山中的景色, 很高興第一次以鈦坦白這種新媒體的形式跟大家進行交流。

我今天分享的重點是人工智慧的實踐。

研究大腦, 做互聯互通的人工智慧

說到人工智慧, 我想大家都耳熟能詳, 在鈦坦白也聽了很多。 我希望今天能夠把一句話留在你的腦海當中, 就是“互聯互通的人工智慧”, 這句話背後的意思是什麼呢?用中國的一句俗語來說就是“四肢發達、頭腦簡單”。

今天有這麼多的創業公司在做人工智慧, 有做電腦視覺識別的, 有做語音的, 有做機器人控制的, 但沒有看到有一家公司在做大腦, 所以我今天給大家分享的最核心的理念就是我們要做互聯互通的人工智慧, 要研究大腦。 大家前幾天可能聽說過的城市大腦, 其實就是其中之一。

我用以上圖來解釋大腦的意思, 在這張圖上有左腦和左腦, 左腦負責邏輯、算術、理性的推演, 右腦負責的是藝術、文學鑒賞, 創造力。 人工智慧在這兩個維度上的發展, 其實我們可以看到, 從理性, 也就是智商的角度上看, 很早的時候機器就打敗了人, 從遠古的算盤到近代的電腦, 從深藍到最近的AlphaGo,

在理性上面其實人工智慧早就超過了人類, 但是在感性的基礎上, 也就是右腦這一塊其實還是有很大的空間。

上面這張圖是對人腦的研究。 在國外很多年前就開始了, 甚至到了白宮的層面。 2013年的時候, 奧巴馬總統提出了在美國高校研究機構聯合做一個關於大腦功能的研究。

核心就是要充分的理解人腦的認知層面, 它究竟是怎樣工作的, 它的信號的鏈路, 它啟動的功能區究竟是怎樣相互關聯的, 時間的滯延、先後的邏輯順序、空間、時空上的特徵是怎麼樣分佈的, 對於旋轉的物體、快速移動的物體、以及顏色快速變化, 但是位置又不變化的物體, 人腦識別這個過程又是怎樣啟動了哪些神經元、細胞元、認知的功能區。 這個非常重要的意義在哪裡呢?如果我們對一個認知過程的抽象理解, 都能夠用一些演算法、公式甚至是一些定理把它描述出來, 那麼就有可能從演算法層面以及工程層面, 重現一個人腦的思考過程, 這可能是人工智慧最極致的一個狀態。

這樣一個雄心壯志是否能夠實現?答案是可以。

如何用演算法重現人腦的思考過程?

上面這張圖是一個高度抽象的腦部神經元相互作用的網路模型,在這個模型上,各個節點可能是一個功能區,或者是一個細胞神經元,他們之間是相連的。他們有遠近,他們之間信號的傳遞不可能是暫態完成的,有一個神經反應的速度,一個人反應慢、反映快就是指這個。當我們把它抽象為一個簡化的網路流模型之後,就有很多的數學上的定義,是可以幫助我們來反推它的。在這張圖上各個相鄰的神經元之間傳遞的信號,有強刺激、弱刺激,因為有的人可能對某些東西特別敏感,他的細胞會被啟動的非常的活躍,所以他這個信號很強,但是有的人可能相對來說就弱一些,遲鈍一些,他的信號就相對弱一點,還有的人反應快那就是信號傳遞得更快,反應慢就代表信號傳遞的速度會慢一點,所以這個網路,大家可以看其實跟交通網絡非常相似,或者跟一個水管的網路也很相似。

在這個模型當中,有一個非常基礎性的數學問題,就是當我們觀測到了相鄰的兩個神經元或者是兩個節點之間的資訊流,這個資訊流是源源不斷隨著時間在變化的,如果我們觀測到了這些東西之後,我們是否可以反推這個資訊流的傳播的特殊路徑是什麼,最重要的路徑是什麼,他不可能是漫無邊際的在整個網路上面是均勻的傳遞,他一定是沿著一個特殊的主要的路徑去傳遞,朝某一個方向,啟動某一個功能元,這個有點像我們早晨上班的時候,交通流肯定是沿著有序的方嚮往上班的CBD,中央商務區去。

現在問題抽象為一個可以簡明扼要描述的數學問題,就是在一個固定的網路結構上,我們觀測到了很多信號的傳遞,我們怎麼樣來理解這些信號的特徵路徑,也就是主要的路徑,以及來預測某一類新的信號他會沿著什麼樣的路徑去傳遞。

那麼這個數學問題怎麼解?我用三頁紙來解釋一下背後的定理。這些定理不是別人開源的東西裡面有的,這是我們自主研發的,確切來說是我在過去十幾年裡做的一些研究發表的論文,這些發表的論文都是網上可以公開搜索到的。下圖列了幾篇主要的論文,其中2005年的一篇是理論性的,2011年和2013年有兩篇是基於這個理論的應用。

在這裡面最核心的理論就是當我們觀測到了非常多的資訊流之後,我們對它進行一些統計分析的時候,它的分佈特性是什麼樣的。就有點像大家聽說過的中心極限定理或者大數定理,當你觀測到某一個現象非常多次數之後,基本上你就知道他趨近於一個平均值或者說他是一個正態分佈,這是統計物理學中非常經典的一個結論。這個理論在腦神經認知科學的流程當中是否成立,我的這幾篇paper當中實際上是給了一些正面的回答,在一定條件下,是可以滿足正態分佈以及中心極限分佈的這個特性。

如果我們用一個定理來描述這個認知的過程,就如下圖所示。這個定理其實也是當時我們做研究得到的最令人興奮的一條結論,就是在網路流、資訊流這個認知過程當中,如果這個網路本身是有限連接、緊致連接,當你重複很多次的時候,你會看到一個收斂的過程。也可以反推,當一個人見了某一個現象很多次之後,他就慢慢熟悉了,他的反應就可以趨向於可預測的狀態,這就是印證了我們中國古話所說的“見多識廣”,你見識很多了,你也不會大驚小怪,你會很自然的面對他,然後做出一個理性的判斷。

基於以上理性的判斷,後面就有很多可以做延伸的,比如,你會怎麼想,什麼樣的進程讓你感覺值得追尋,你的回應會是什麼樣……這樣,你的行為就變得可預期了。

人腦研究在實際生活中的應用案例

以上這些理論,具體有哪些用途呢?以下是我們做的一些具體項目:

《我是歌手》總決賽的排名預測ET

去年8月份我們發佈了ET,這是集大成者,裡面有語音的對話,還有一些網路流的預測,比如說我要預測交通網絡是不是堵塞?

以上兩個例子就可以看出,我們要判斷多種不同的信號。在《我是歌手》中,有聲音、有光、有伴舞、現場氛圍等多種不同的信號對人的認知過程的產生刺激,而在ET的發佈當中,其實我們要判斷的是多種信號所帶來的一個複雜的疊加效應會怎樣在網路流上傳播,這個網路就是整個城市網。

交通管理

這個網路流的理論,不光能應用在預測唱歌、文學藝術的創作,還可以在現實的物理網路當中用起來,這個物理網路最簡單的一個就是交通網絡。

大家每天都要參加,從一個節點跑到另外一個節點,你自駕車也好,坐計程車也好,這是一個交通網絡上的一個動態的流,對於這個資訊流,我們需要預知它的變化,現在的擁堵會蔓延到哪裡,然後怎麼樣進行預防性的排堵。

去年我們在廣州做的專案,可能是在人工智慧指揮交通管理當中第一個成功的實踐。為什麼這樣講是第一個?這是因為我們動了一個交通管理當中最核心的東西,信號燈。大家在實際生活當中經常會發現,很多車都在等紅燈變綠,但是在綠燈的方向一輛車都沒有,這種供給的錯配是因為它沒有及時的發現這個網路流已經發生了變化,跟以往的經驗不同。

我們在廣州做的這件事情的核心是就是用移動互聯網的資料,以及交警自有的資料,把多種信號融匯在一起,我們來判斷,當一個路口的信號燈不健康的時候,配時不合理的時候如果我對它進行調節,相當於我在這個網路上刺激一個信號進去,它會怎麼樣沿著這個網路傳遞。

為什麼我們要做這樣一件事情,大家可以看下圖。傳統的信號燈是一個近視眼,因為它所有的觸覺都是基於周邊採集設備所看到的情況,比如說視頻,比如說地面的線圈,雷達槍等等,但是它探測的範圍都是非常的局部,而且是滯後的。

而互聯網信號燈不一樣,因為我們看到的資料是從天而降的,大家在開車的時候都是帶著有手機的,而手機上又有你的定位,把這些資料聚合在一起就成了交通路況,甚至精准的知道在每一個路段上有多少輛車在跑,在往東邊走,在直行、左轉還是右轉,能夠看得清,甚至看得全,所以你看的是整個城市,沒有盲點。再配上我們人工智慧的演算法,網路流的演算法你就可能看得透。看得透直接的效果就是什麼?我們能夠判斷管控的信號調整,就是一個信號燈,我把綠燈的時間占比調整,會怎麼樣影響到周邊的幾個街道,怎麼蔓延,這就有點像我在腦部的神經當中某一個神經元上刺激一下之後,會影響到大腦當中周邊哪些區域,哪些功能區。

這件事情其實也有另外一種完全不同的做法,如果我們不想去研究人腦的過程,或者是類比的過程,我們是可以用深度學習的方法來做這樣一件事情。如下圖:

這是一個典型的城市路網上即時路況,每個路段上標的紅黃綠,代表的是交通是擁堵,還是暢通。大家設想一下,如果在我們的城市當中,每分每秒我們都有一張快照,我們就可以把一個交通狀態的描述從網路的結構轉化為一個image,有了image就可以用很多現在經常用到的深度學習的方法,來進行分類或者說進行監督學習或者無監督學習,來判斷當前的狀態會怎麼樣演變。

如果用深度學習的方法對當前的盤面做一個推演,我們就應該清楚該在哪些地方下手調整。比如說我要調整信號燈,甚至我臨時的限制上高架路路口通行流量的占比。但你要具體判斷,限流多久,從什麼時間點開始,什麼時間點結束,是100%的限流還是20%的限流,這些具體資料在今天的深度學習還沒法得到,還是需要回歸到原始的網路流的理論上去。所以在這個approach當中,深度學習可以給我們找到下手的目標,然後我們再用網路流的理論來判斷,應該採用多大的力度,在什麼時間點內採取行動,阻止整個盤面的惡化。

這個專案去年已經在廣州的兩個成功落地,今年在廣州市將要全面推開,所以這應該說在全世界是第一個,在這麼大規模的城市當中用人工智慧去即時的控制他的信號燈。

城市大腦

如果說用互聯網的資料控制信號燈是人工智慧在交通管控當中成功落地的一個案例的話,城市大腦就是一個全面的升級。

上面這張圖片是城市大腦的一個截屏。過去一年不少媒體在問,杭州做城市大腦的初衷是什麼?其實跟上面是同樣的道理,杭州要把所有的資料彙集,要看得清楚各種信號,要做即時的推演,要判斷這個盤面,交通狀況會怎麼樣的變化,公車在哪裡會有堵塞。再基於這個判斷,進行即時的調度比如說調節高架路的信號燈,調節地面道路的信號燈,調節骨幹公交運行班次甚至臨時加開特快專線。

大家肯定會問,為什麼我們要在這個時間點提出城市大腦的概念,這個答案其實要回歸到十多年以前,智慧城市的提出,IBM 2005年前後提出智慧星球,我們當時是第一批做這個事情的人,我們明確的感到了一個痛點,就是當你在一個城市規模的範圍上做計算的時候,計算能力成為一個瓶頸,因為資料量太大了,太豐富了,處理往往是滯後的,成為一個事後諸葛亮的分析,而不是一個即時線上的一個預防性的決策助手。

群裡各位可能知道,阿裡巴巴技術委員會主席王堅博士最近出版了一本書叫《線上》,線上這兩個字背後的含義非常的深刻,我們現實生活當中,有很多偽智慧城市的工程,就是因為不線上導致的。事後諸葛亮的分析大家都可以做,但是線上的即時分析,而且線上的有智慧的分析,卻需要海量的計算能力,海量資料的處理能力和計算能力,而在沒有雲計算的時候這是不可想像的一件事情,但是在今天,這個已經成為現實,因為類似阿裡雲這樣的雲計算大頭已經起來,在國外有AWS、亞馬遜的雲,所以雲計算的出現使得大資料的分析變成即時線上可能,城市大腦也就自然而然地出來了。

KDD Cup 賽題

KDD是國際資料採擷電腦學會,KDD Cup 資料採擷大賽已經有20多年歷史了,每年舉行一次。這次我們提交了一個賽題,立意就來自于廣州的信號燈。

在這個賽題醞釀的過程當中,我們也經過了很多思考,究竟什麼樣的題目既能夠引起學術界的興趣,同時他又具備充分的可落地性,而不是為了一個大賽而大賽,這裡面還是蠻絞盡腦汁,最後我們發現從信號燈的管控上,高速路口的瓶頸著手,既能夠解實際問題,又有學術挑戰性。

更重要的是我們在廣州已經有了成功的實踐,所以我們知道這道題目是有答案的,只是我們今天的答案可能不是很完美,當你是一個全球首創的解決方案的提出者的時候,你知道肯定有更好的答案在後面,所以我們希望通過這道賽題,能夠喚醒學術界的關注,包括同仁們的關注,讓我們一起找到更好的答案,幫助廣州以及其他城市,儘快的讓信號燈變得智慧,讓城市大腦能夠跟它的每一個觸覺地面上的信號燈能夠即時的聯動。

當時出這道題目的時候,我們也有些猶豫,外界包括學術界對阿裡巴巴的認知都是在電商,如果我們把電商的資料拿出來,可能更符合大家的預期,但是後來我們想了一下,畢竟電商中國色彩太濃,而交通是一個全球性的問題,所以我們最後選了這樣一道題目。這個大賽已經正式開賽,大家感興趣可以在網上搜索大賽的情況。

運輸車輛調度

有一個工廠每天需要從周邊的零部件供應商那兒用卡車把部件送到生產廠組裝線上來即時的生產,生產線有非常嚴格的開工時間要求,一旦開工就不能停下來,那些送貨的人必須確保零部件及時的送到工廠,所以他們每天用七輛卡車,共1835公里運輸總里程數。

當我們用人工智慧大資料,以及雲計算的方法去即時的計算整個沿途所能遇到的情況,以及現在生產線還有多少冗餘的備件,還可以運行多久的時候,我們就有可能判斷中間某些卡車可以在運輸的過程當中,再去另外一個地方取備件,既能保證時間,還能節省一趟無謂的行程,最後實際上我們是成功做到了。最後是只用了五輛卡車,每天只跑1600多公里就已經做到了同樣的要求。

而要做到這樣,其實得益於的就是我們有一套即時線上的調度引擎,即時線上能夠看到所有的位置,以及各個崗位上現在的狀況,還有的就是在沿途的整個的交通狀況,所以集合在一起,就做了一個經典的運籌學的問題,叫Vehicle Routing Problem(車輛路徑問題)。這個就是路線問題,有非常多的約束條件可能變化,稍微變一變約束條件,他的難度可能就會增加好幾個量級,在以往沒有雲計算是幾乎不可想像的事情,只能成為經驗性的操作,但是今天不一樣,我們把它變為線上的即時計算,每一步都是算出來的。

送外賣

這裡面有三種角色——餐館、吃飯點餐的人、運輸的人,而中央調度台需要判斷每一個訂單分給哪一個運輸的人,尤其在高峰期大家都餓的時候非常難,靠人來調是應接不暇的。這個問題怎麼求解,這就有點像滴滴打車、快滴打車,這個訂單發給誰,實際上還是需要靠一套調度的機制和演算法即時線上進行計算。你不僅要知道彼此的位置,還需要知道時間,還要需要知道從一個點到另外一個點中間的行程時間,交通狀況是不是有擁堵。而這個問題其實我們從去年年底開始,已經在餓了麼開發上線,所以現在餓了麼已經有相當多的網站是自動化的調度。

品質管控

上個月有一篇新聞報導,我們用資料採擷的演算法和模型,成功説明江蘇的協鑫光伏(全球最大的光伏切片企業)把整個生產線的良品率提升了一個百分點,每年創造上億元人民幣的價值。大家可能會問,這個問題跟人工智慧有什麼關係,感覺就是一個很經典的品質管控問題。

其實我們做的跟原來用統計的方法做的事情是完全不一樣的,今天在這個生產線上有幾十個環節,上千個參數,而且是即時線上收集的,所以他的資料量已經超過用經典統計方法可以分析的力度。在複雜性方面,有離散性變數,有連續性變數,採集的變數之間還帶有一些強依賴性,有冗餘性在裡面。更重要的是,它需要做即時線上的分析,及時發現異常即時回饋控制這個生產線。

用人工智慧怎麼解決這個複雜問題呢?首先我們要把這個生產線抽象為一個神經元模型,就是一個神經鏈路有多個功能區連結在一起,你可以認為是某一種認知行為的一個特徵路徑。在這個特徵路徑上面,每一個環節到下一個環節,都傳遞的是一個資訊,而在光伏切片當中傳遞的是一組參數,以及這個物件用這樣一組參數我切割下來的這個產品,他到了哪個階段,然後傳遞到下游去,所以他傳遞的資訊是通過物件,就是它切的那個光伏的板塊來傳遞的。

所以當我們把切割的流程抽象為一個資訊傳遞的流程的時候,後面的分析就變得很自然了。它就是一個資訊流,它的異常以及這個資訊流上的關鍵節點,哪幾步是最關鍵的,對整個資訊完整的表達是最至關重要的,我們通過歷史的海量資料去挖掘,在雲計算的大資料平臺上去挖掘,是能夠發現這個最關鍵節點,也就是對應了在這個生產流程當中最關鍵的工序,它有幾十道工序,是第幾道工序,在對應關鍵節點的工序上,他最優的參數控制應該是什麼樣,又是另外一個問題,就有點像我們剛剛講的調節信號燈一樣的。

協鑫的這個案例其實他代表的是一類看上去非常傳統的製造業,尤其是流程製造業,包括半導體流片、印染企業、鋼鐵都是流程製造企業,他們都可以抽象為一種資訊流,有不同的節點,那麼怎麼樣從海量的歷史資料當中,去發覺在這個資訊流當中最關鍵的節點,以及每一個關鍵節點裡面他最優的參數控制,我們今天找到一種解法,所以協鑫的這個實踐其實是具有很強的行業輻射性。

基礎理論實現突破的希望——量子計算

前面講的都是我們基於要做大腦,要做認知,要從信號的傳遞、網路流傳遞這個基礎性的物理過程上來解題,找到一些實戰的應用案例。那麼再從實戰回歸到到基礎性的理論研究上,我想我剛剛給大家展示的那些文章、圖片,都是很多年前我做的,肯定已經是不充分的,不夠用了,只是一個抛磚引玉。今天如果在基礎理論上我們要突破,方向在哪裡?

可能大家聽得最多的是誰誰誰開源了某一個平臺,這個年代,我們不缺平臺,我們缺的是思想,我們缺的是演算法。更重要的是我們缺少原創性的演算法和理論。在科學和技術這兩者的結合上,其實今天有相當多的公司,包括從業者們,更看重的或者更加關注的是那些技術上的發展,誰誰誰開源了一個平臺,把計算效率提升了多少,當然這個非常重要,但是為什麼深度學習的理論,包括神經網路的理論,不是在中國創造出來的?我們有沒有機會在下一輪的人工智慧的理論發展上,或者腦科學的發展上,互聯互通的人工智慧發展理論上,做出一個開創性的成果?我覺得有可能。這個方向在哪裡?在量子計算。

下面這張圖是跟我今天要講的核心思想“互聯互通的人工智慧”緊密相關的一張圖片:

(以下全文僅限鈦媒體專業用戶開放,點選連結:http://www.tmtpost.com/pro註冊鈦媒體專業版)

……

今天我們要問一個問題,當量子電腦哪天成功的實現了之後,我們今天那些吹得很厲害的演算法還有多少能夠跟它相比,或者說能夠改造為用量子位元來表徵的演算法?究竟能帶來多大效能的提升?

所以量子計算是一個非常基礎性的理論問題,我們也是自己一直在追蹤研究這個東西,但它確實非常的難,因為任何一個推演,都需要物理實現去做實驗,去驗證,而做量子電腦的實驗是非常難的。可能大家也從新聞看到過,阿裡巴巴跟中國科學技術大學潘建偉院士有合作,已經宣佈過,我們要在量子電腦上進行突破,其實就是瞄準了這樣一個目標,我們要在原創性的機器學習、人工智慧的演算法理論上來突破。

至於這個目標什麼時候能實現,其實真的我們都沒有底,因為這是一個非常漫長的過程,確切來說幾十年來,從量子電腦在八十年代的時候,首先提出不等式,已經過去三十多年了。就像任何一個劃時代的創新,從來不會事先規劃出來的,是做出來的,我們唯一能保證的就是我們埋頭苦幹。鈦坦白群裡的也都是在科技界的同仁,希望我們能夠一起來關注這樣一件事,來呼籲更多科技從業者關注量子演算法這樣一個方向。

(本文獨家首發鈦媒體,根據阿裡雲人工智慧科學家、人工智慧孵化團隊負責人閔萬里博士在鈦坦白上的分享整理)

……………………………………

鈦坦白第32期,AI已來之機器學習1,三晚上的分享已經結束了

乾貨會陸續發佈:http://www.tmtpost.com/tag/1508094

鈦坦白第33期預告:AI已來之機器學習2

來自百度、第四範式、地平線機器人的鈦客,繼續就“機器學習”帶來精彩分享~

時間:3月20日、21日、22日

報名聽課、交流:

鈦坦白目前有醫療健康、人工智慧、文娛社交、VR/AR、區塊鏈、支付創新、體育、雲計算、SaaS等九個專業群。

1、鈦媒體Pro專業版用戶,可以點選連結http://www.tmtpost.com/pro,登錄帳號,線上免費、任意選擇自己要進入的群,按提示操作;

推薦鈦客、贊助、合作:

請與鈦坦白負責人佳音聯繫,郵箱jiayinge@tmtpost.com

這樣一個雄心壯志是否能夠實現?答案是可以。

如何用演算法重現人腦的思考過程?

上面這張圖是一個高度抽象的腦部神經元相互作用的網路模型,在這個模型上,各個節點可能是一個功能區,或者是一個細胞神經元,他們之間是相連的。他們有遠近,他們之間信號的傳遞不可能是暫態完成的,有一個神經反應的速度,一個人反應慢、反映快就是指這個。當我們把它抽象為一個簡化的網路流模型之後,就有很多的數學上的定義,是可以幫助我們來反推它的。在這張圖上各個相鄰的神經元之間傳遞的信號,有強刺激、弱刺激,因為有的人可能對某些東西特別敏感,他的細胞會被啟動的非常的活躍,所以他這個信號很強,但是有的人可能相對來說就弱一些,遲鈍一些,他的信號就相對弱一點,還有的人反應快那就是信號傳遞得更快,反應慢就代表信號傳遞的速度會慢一點,所以這個網路,大家可以看其實跟交通網絡非常相似,或者跟一個水管的網路也很相似。

在這個模型當中,有一個非常基礎性的數學問題,就是當我們觀測到了相鄰的兩個神經元或者是兩個節點之間的資訊流,這個資訊流是源源不斷隨著時間在變化的,如果我們觀測到了這些東西之後,我們是否可以反推這個資訊流的傳播的特殊路徑是什麼,最重要的路徑是什麼,他不可能是漫無邊際的在整個網路上面是均勻的傳遞,他一定是沿著一個特殊的主要的路徑去傳遞,朝某一個方向,啟動某一個功能元,這個有點像我們早晨上班的時候,交通流肯定是沿著有序的方嚮往上班的CBD,中央商務區去。

現在問題抽象為一個可以簡明扼要描述的數學問題,就是在一個固定的網路結構上,我們觀測到了很多信號的傳遞,我們怎麼樣來理解這些信號的特徵路徑,也就是主要的路徑,以及來預測某一類新的信號他會沿著什麼樣的路徑去傳遞。

那麼這個數學問題怎麼解?我用三頁紙來解釋一下背後的定理。這些定理不是別人開源的東西裡面有的,這是我們自主研發的,確切來說是我在過去十幾年裡做的一些研究發表的論文,這些發表的論文都是網上可以公開搜索到的。下圖列了幾篇主要的論文,其中2005年的一篇是理論性的,2011年和2013年有兩篇是基於這個理論的應用。

在這裡面最核心的理論就是當我們觀測到了非常多的資訊流之後,我們對它進行一些統計分析的時候,它的分佈特性是什麼樣的。就有點像大家聽說過的中心極限定理或者大數定理,當你觀測到某一個現象非常多次數之後,基本上你就知道他趨近於一個平均值或者說他是一個正態分佈,這是統計物理學中非常經典的一個結論。這個理論在腦神經認知科學的流程當中是否成立,我的這幾篇paper當中實際上是給了一些正面的回答,在一定條件下,是可以滿足正態分佈以及中心極限分佈的這個特性。

如果我們用一個定理來描述這個認知的過程,就如下圖所示。這個定理其實也是當時我們做研究得到的最令人興奮的一條結論,就是在網路流、資訊流這個認知過程當中,如果這個網路本身是有限連接、緊致連接,當你重複很多次的時候,你會看到一個收斂的過程。也可以反推,當一個人見了某一個現象很多次之後,他就慢慢熟悉了,他的反應就可以趨向於可預測的狀態,這就是印證了我們中國古話所說的“見多識廣”,你見識很多了,你也不會大驚小怪,你會很自然的面對他,然後做出一個理性的判斷。

基於以上理性的判斷,後面就有很多可以做延伸的,比如,你會怎麼想,什麼樣的進程讓你感覺值得追尋,你的回應會是什麼樣……這樣,你的行為就變得可預期了。

人腦研究在實際生活中的應用案例

以上這些理論,具體有哪些用途呢?以下是我們做的一些具體項目:

《我是歌手》總決賽的排名預測ET

去年8月份我們發佈了ET,這是集大成者,裡面有語音的對話,還有一些網路流的預測,比如說我要預測交通網絡是不是堵塞?

以上兩個例子就可以看出,我們要判斷多種不同的信號。在《我是歌手》中,有聲音、有光、有伴舞、現場氛圍等多種不同的信號對人的認知過程的產生刺激,而在ET的發佈當中,其實我們要判斷的是多種信號所帶來的一個複雜的疊加效應會怎樣在網路流上傳播,這個網路就是整個城市網。

交通管理

這個網路流的理論,不光能應用在預測唱歌、文學藝術的創作,還可以在現實的物理網路當中用起來,這個物理網路最簡單的一個就是交通網絡。

大家每天都要參加,從一個節點跑到另外一個節點,你自駕車也好,坐計程車也好,這是一個交通網絡上的一個動態的流,對於這個資訊流,我們需要預知它的變化,現在的擁堵會蔓延到哪裡,然後怎麼樣進行預防性的排堵。

去年我們在廣州做的專案,可能是在人工智慧指揮交通管理當中第一個成功的實踐。為什麼這樣講是第一個?這是因為我們動了一個交通管理當中最核心的東西,信號燈。大家在實際生活當中經常會發現,很多車都在等紅燈變綠,但是在綠燈的方向一輛車都沒有,這種供給的錯配是因為它沒有及時的發現這個網路流已經發生了變化,跟以往的經驗不同。

我們在廣州做的這件事情的核心是就是用移動互聯網的資料,以及交警自有的資料,把多種信號融匯在一起,我們來判斷,當一個路口的信號燈不健康的時候,配時不合理的時候如果我對它進行調節,相當於我在這個網路上刺激一個信號進去,它會怎麼樣沿著這個網路傳遞。

為什麼我們要做這樣一件事情,大家可以看下圖。傳統的信號燈是一個近視眼,因為它所有的觸覺都是基於周邊採集設備所看到的情況,比如說視頻,比如說地面的線圈,雷達槍等等,但是它探測的範圍都是非常的局部,而且是滯後的。

而互聯網信號燈不一樣,因為我們看到的資料是從天而降的,大家在開車的時候都是帶著有手機的,而手機上又有你的定位,把這些資料聚合在一起就成了交通路況,甚至精准的知道在每一個路段上有多少輛車在跑,在往東邊走,在直行、左轉還是右轉,能夠看得清,甚至看得全,所以你看的是整個城市,沒有盲點。再配上我們人工智慧的演算法,網路流的演算法你就可能看得透。看得透直接的效果就是什麼?我們能夠判斷管控的信號調整,就是一個信號燈,我把綠燈的時間占比調整,會怎麼樣影響到周邊的幾個街道,怎麼蔓延,這就有點像我在腦部的神經當中某一個神經元上刺激一下之後,會影響到大腦當中周邊哪些區域,哪些功能區。

這件事情其實也有另外一種完全不同的做法,如果我們不想去研究人腦的過程,或者是類比的過程,我們是可以用深度學習的方法來做這樣一件事情。如下圖:

這是一個典型的城市路網上即時路況,每個路段上標的紅黃綠,代表的是交通是擁堵,還是暢通。大家設想一下,如果在我們的城市當中,每分每秒我們都有一張快照,我們就可以把一個交通狀態的描述從網路的結構轉化為一個image,有了image就可以用很多現在經常用到的深度學習的方法,來進行分類或者說進行監督學習或者無監督學習,來判斷當前的狀態會怎麼樣演變。

如果用深度學習的方法對當前的盤面做一個推演,我們就應該清楚該在哪些地方下手調整。比如說我要調整信號燈,甚至我臨時的限制上高架路路口通行流量的占比。但你要具體判斷,限流多久,從什麼時間點開始,什麼時間點結束,是100%的限流還是20%的限流,這些具體資料在今天的深度學習還沒法得到,還是需要回歸到原始的網路流的理論上去。所以在這個approach當中,深度學習可以給我們找到下手的目標,然後我們再用網路流的理論來判斷,應該採用多大的力度,在什麼時間點內採取行動,阻止整個盤面的惡化。

這個專案去年已經在廣州的兩個成功落地,今年在廣州市將要全面推開,所以這應該說在全世界是第一個,在這麼大規模的城市當中用人工智慧去即時的控制他的信號燈。

城市大腦

如果說用互聯網的資料控制信號燈是人工智慧在交通管控當中成功落地的一個案例的話,城市大腦就是一個全面的升級。

上面這張圖片是城市大腦的一個截屏。過去一年不少媒體在問,杭州做城市大腦的初衷是什麼?其實跟上面是同樣的道理,杭州要把所有的資料彙集,要看得清楚各種信號,要做即時的推演,要判斷這個盤面,交通狀況會怎麼樣的變化,公車在哪裡會有堵塞。再基於這個判斷,進行即時的調度比如說調節高架路的信號燈,調節地面道路的信號燈,調節骨幹公交運行班次甚至臨時加開特快專線。

大家肯定會問,為什麼我們要在這個時間點提出城市大腦的概念,這個答案其實要回歸到十多年以前,智慧城市的提出,IBM 2005年前後提出智慧星球,我們當時是第一批做這個事情的人,我們明確的感到了一個痛點,就是當你在一個城市規模的範圍上做計算的時候,計算能力成為一個瓶頸,因為資料量太大了,太豐富了,處理往往是滯後的,成為一個事後諸葛亮的分析,而不是一個即時線上的一個預防性的決策助手。

群裡各位可能知道,阿裡巴巴技術委員會主席王堅博士最近出版了一本書叫《線上》,線上這兩個字背後的含義非常的深刻,我們現實生活當中,有很多偽智慧城市的工程,就是因為不線上導致的。事後諸葛亮的分析大家都可以做,但是線上的即時分析,而且線上的有智慧的分析,卻需要海量的計算能力,海量資料的處理能力和計算能力,而在沒有雲計算的時候這是不可想像的一件事情,但是在今天,這個已經成為現實,因為類似阿裡雲這樣的雲計算大頭已經起來,在國外有AWS、亞馬遜的雲,所以雲計算的出現使得大資料的分析變成即時線上可能,城市大腦也就自然而然地出來了。

KDD Cup 賽題

KDD是國際資料採擷電腦學會,KDD Cup 資料採擷大賽已經有20多年歷史了,每年舉行一次。這次我們提交了一個賽題,立意就來自于廣州的信號燈。

在這個賽題醞釀的過程當中,我們也經過了很多思考,究竟什麼樣的題目既能夠引起學術界的興趣,同時他又具備充分的可落地性,而不是為了一個大賽而大賽,這裡面還是蠻絞盡腦汁,最後我們發現從信號燈的管控上,高速路口的瓶頸著手,既能夠解實際問題,又有學術挑戰性。

更重要的是我們在廣州已經有了成功的實踐,所以我們知道這道題目是有答案的,只是我們今天的答案可能不是很完美,當你是一個全球首創的解決方案的提出者的時候,你知道肯定有更好的答案在後面,所以我們希望通過這道賽題,能夠喚醒學術界的關注,包括同仁們的關注,讓我們一起找到更好的答案,幫助廣州以及其他城市,儘快的讓信號燈變得智慧,讓城市大腦能夠跟它的每一個觸覺地面上的信號燈能夠即時的聯動。

當時出這道題目的時候,我們也有些猶豫,外界包括學術界對阿裡巴巴的認知都是在電商,如果我們把電商的資料拿出來,可能更符合大家的預期,但是後來我們想了一下,畢竟電商中國色彩太濃,而交通是一個全球性的問題,所以我們最後選了這樣一道題目。這個大賽已經正式開賽,大家感興趣可以在網上搜索大賽的情況。

運輸車輛調度

有一個工廠每天需要從周邊的零部件供應商那兒用卡車把部件送到生產廠組裝線上來即時的生產,生產線有非常嚴格的開工時間要求,一旦開工就不能停下來,那些送貨的人必須確保零部件及時的送到工廠,所以他們每天用七輛卡車,共1835公里運輸總里程數。

當我們用人工智慧大資料,以及雲計算的方法去即時的計算整個沿途所能遇到的情況,以及現在生產線還有多少冗餘的備件,還可以運行多久的時候,我們就有可能判斷中間某些卡車可以在運輸的過程當中,再去另外一個地方取備件,既能保證時間,還能節省一趟無謂的行程,最後實際上我們是成功做到了。最後是只用了五輛卡車,每天只跑1600多公里就已經做到了同樣的要求。

而要做到這樣,其實得益於的就是我們有一套即時線上的調度引擎,即時線上能夠看到所有的位置,以及各個崗位上現在的狀況,還有的就是在沿途的整個的交通狀況,所以集合在一起,就做了一個經典的運籌學的問題,叫Vehicle Routing Problem(車輛路徑問題)。這個就是路線問題,有非常多的約束條件可能變化,稍微變一變約束條件,他的難度可能就會增加好幾個量級,在以往沒有雲計算是幾乎不可想像的事情,只能成為經驗性的操作,但是今天不一樣,我們把它變為線上的即時計算,每一步都是算出來的。

送外賣

這裡面有三種角色——餐館、吃飯點餐的人、運輸的人,而中央調度台需要判斷每一個訂單分給哪一個運輸的人,尤其在高峰期大家都餓的時候非常難,靠人來調是應接不暇的。這個問題怎麼求解,這就有點像滴滴打車、快滴打車,這個訂單發給誰,實際上還是需要靠一套調度的機制和演算法即時線上進行計算。你不僅要知道彼此的位置,還需要知道時間,還要需要知道從一個點到另外一個點中間的行程時間,交通狀況是不是有擁堵。而這個問題其實我們從去年年底開始,已經在餓了麼開發上線,所以現在餓了麼已經有相當多的網站是自動化的調度。

品質管控

上個月有一篇新聞報導,我們用資料採擷的演算法和模型,成功説明江蘇的協鑫光伏(全球最大的光伏切片企業)把整個生產線的良品率提升了一個百分點,每年創造上億元人民幣的價值。大家可能會問,這個問題跟人工智慧有什麼關係,感覺就是一個很經典的品質管控問題。

其實我們做的跟原來用統計的方法做的事情是完全不一樣的,今天在這個生產線上有幾十個環節,上千個參數,而且是即時線上收集的,所以他的資料量已經超過用經典統計方法可以分析的力度。在複雜性方面,有離散性變數,有連續性變數,採集的變數之間還帶有一些強依賴性,有冗餘性在裡面。更重要的是,它需要做即時線上的分析,及時發現異常即時回饋控制這個生產線。

用人工智慧怎麼解決這個複雜問題呢?首先我們要把這個生產線抽象為一個神經元模型,就是一個神經鏈路有多個功能區連結在一起,你可以認為是某一種認知行為的一個特徵路徑。在這個特徵路徑上面,每一個環節到下一個環節,都傳遞的是一個資訊,而在光伏切片當中傳遞的是一組參數,以及這個物件用這樣一組參數我切割下來的這個產品,他到了哪個階段,然後傳遞到下游去,所以他傳遞的資訊是通過物件,就是它切的那個光伏的板塊來傳遞的。

所以當我們把切割的流程抽象為一個資訊傳遞的流程的時候,後面的分析就變得很自然了。它就是一個資訊流,它的異常以及這個資訊流上的關鍵節點,哪幾步是最關鍵的,對整個資訊完整的表達是最至關重要的,我們通過歷史的海量資料去挖掘,在雲計算的大資料平臺上去挖掘,是能夠發現這個最關鍵節點,也就是對應了在這個生產流程當中最關鍵的工序,它有幾十道工序,是第幾道工序,在對應關鍵節點的工序上,他最優的參數控制應該是什麼樣,又是另外一個問題,就有點像我們剛剛講的調節信號燈一樣的。

協鑫的這個案例其實他代表的是一類看上去非常傳統的製造業,尤其是流程製造業,包括半導體流片、印染企業、鋼鐵都是流程製造企業,他們都可以抽象為一種資訊流,有不同的節點,那麼怎麼樣從海量的歷史資料當中,去發覺在這個資訊流當中最關鍵的節點,以及每一個關鍵節點裡面他最優的參數控制,我們今天找到一種解法,所以協鑫的這個實踐其實是具有很強的行業輻射性。

基礎理論實現突破的希望——量子計算

前面講的都是我們基於要做大腦,要做認知,要從信號的傳遞、網路流傳遞這個基礎性的物理過程上來解題,找到一些實戰的應用案例。那麼再從實戰回歸到到基礎性的理論研究上,我想我剛剛給大家展示的那些文章、圖片,都是很多年前我做的,肯定已經是不充分的,不夠用了,只是一個抛磚引玉。今天如果在基礎理論上我們要突破,方向在哪裡?

可能大家聽得最多的是誰誰誰開源了某一個平臺,這個年代,我們不缺平臺,我們缺的是思想,我們缺的是演算法。更重要的是我們缺少原創性的演算法和理論。在科學和技術這兩者的結合上,其實今天有相當多的公司,包括從業者們,更看重的或者更加關注的是那些技術上的發展,誰誰誰開源了一個平臺,把計算效率提升了多少,當然這個非常重要,但是為什麼深度學習的理論,包括神經網路的理論,不是在中國創造出來的?我們有沒有機會在下一輪的人工智慧的理論發展上,或者腦科學的發展上,互聯互通的人工智慧發展理論上,做出一個開創性的成果?我覺得有可能。這個方向在哪裡?在量子計算。

下面這張圖是跟我今天要講的核心思想“互聯互通的人工智慧”緊密相關的一張圖片:

(以下全文僅限鈦媒體專業用戶開放,點選連結:http://www.tmtpost.com/pro註冊鈦媒體專業版)

……

今天我們要問一個問題,當量子電腦哪天成功的實現了之後,我們今天那些吹得很厲害的演算法還有多少能夠跟它相比,或者說能夠改造為用量子位元來表徵的演算法?究竟能帶來多大效能的提升?

所以量子計算是一個非常基礎性的理論問題,我們也是自己一直在追蹤研究這個東西,但它確實非常的難,因為任何一個推演,都需要物理實現去做實驗,去驗證,而做量子電腦的實驗是非常難的。可能大家也從新聞看到過,阿裡巴巴跟中國科學技術大學潘建偉院士有合作,已經宣佈過,我們要在量子電腦上進行突破,其實就是瞄準了這樣一個目標,我們要在原創性的機器學習、人工智慧的演算法理論上來突破。

至於這個目標什麼時候能實現,其實真的我們都沒有底,因為這是一個非常漫長的過程,確切來說幾十年來,從量子電腦在八十年代的時候,首先提出不等式,已經過去三十多年了。就像任何一個劃時代的創新,從來不會事先規劃出來的,是做出來的,我們唯一能保證的就是我們埋頭苦幹。鈦坦白群裡的也都是在科技界的同仁,希望我們能夠一起來關注這樣一件事,來呼籲更多科技從業者關注量子演算法這樣一個方向。

(本文獨家首發鈦媒體,根據阿裡雲人工智慧科學家、人工智慧孵化團隊負責人閔萬里博士在鈦坦白上的分享整理)

……………………………………

鈦坦白第32期,AI已來之機器學習1,三晚上的分享已經結束了

乾貨會陸續發佈:http://www.tmtpost.com/tag/1508094

鈦坦白第33期預告:AI已來之機器學習2

來自百度、第四範式、地平線機器人的鈦客,繼續就“機器學習”帶來精彩分享~

時間:3月20日、21日、22日

報名聽課、交流:

鈦坦白目前有醫療健康、人工智慧、文娛社交、VR/AR、區塊鏈、支付創新、體育、雲計算、SaaS等九個專業群。

1、鈦媒體Pro專業版用戶,可以點選連結http://www.tmtpost.com/pro,登錄帳號,線上免費、任意選擇自己要進入的群,按提示操作;

推薦鈦客、贊助、合作:

請與鈦坦白負責人佳音聯繫,郵箱jiayinge@tmtpost.com

Next Article
喜欢就按个赞吧!!!
点击关闭提示