您的位置:首頁>科技>正文

【GMIC 2017】吳恩達的離職帶熱AI話題 張巨集江說AI將成為水電煤一樣的基礎設施

百度吳恩達的離職讓AI成為熱點話題, 人工智慧技術的成熟使得可用資料集的大小、結構都有了極大增長。

例如, 特斯拉收集了 780mn 英里的駕駛資料, 而且通過他們的互連汽車, 每 10 小時就能增加 100 萬英里的資料。 此外, Jasper 有一個平臺, 能讓多家汽車製造商和電信公司進行機器間的交流, 這家公司於今年 2 月份被 Cisco 收購。 Verizon 在 8 月份做了類似的投資, 宣佈收購 Fleetmatics。 Fleetmatics 做的是將汽車上的遠端感測器通過無線網路連接到雲軟體。

未來, 5G 網路的上線將會加速資料生成與傳輸的速率。 據 IDC 的 Digital Universe Report 顯示, 年度資料生成預期到 2020 年達到 44zettabytes, 表明我們正在見證應用這些技術的使用案例。

與之類似的還有硬體成本的降低。 GPU 的再次使用、低成本計算能力的普遍化, 特別是通過雲服務, 以及建立新的神經網路模型, 已經極大增加了神經網路產生結果的速度與準確率。

GPU 和並行架構要比傳統的基於資料中心架構的 CPU 能更快地訓練機器學習系統。 通過使用圖像晶片, 網路能更快的反覆運算, 能在短期內進行更準確的訓練。

同時, 特製矽的發展, 比如微軟和百度使用的 FPGA, 能夠用訓練出的深度學習系統做更快的推斷。 另外, 從 1993 年開始超級電腦的原計算能力有了極大發展。 在 2016 年, 單張英偉達遊戲顯卡就有了類似於 2002 年之前最強大的超級電腦擁有的計算能力。

在資料和計算能力大幅提升背後, 演算法是配套設施。

更好的輸入(計算和資料)使得更多的研發是面向演算法, 從而支援深度學習的使用。 例如伯克利的 Caffe、穀歌的 TensorFlow 和 Torch 這樣的開源框架。 比如, 剛開源一周年的 TensorFlow, 成為了 GitHub 上有最多 forked repositories 的框架。 雖然不是所有的人工智慧發生於普遍可用的開源框架中,

但開源確實在加速發展, 而且也有更多先進的工具正在開源。

總結起來, AI興起背後的本質原因是大量資料的產生:從2013年到2020年, 資料將以每年40%的速率增長:傳統零售巨頭沃爾瑪每4小時產生2.5PB級的資料量;推特上每天的推文量在5億條左右;今日頭條每天要完成6BT的請求、完成6.3PB的資料處理量(1PB=1024BT)。

下圖展示的是最近幾年各個應用軟體圖片上載的情況:

張宏江認為, 中國因為人口眾多, 在資料來源、AI產業上的能力是不輸發達國家的, 目前處於各自在發力狂奔的狀態。

張宏江目前比較看好的兩個國內AI創業專案是Face++和今日頭條, 代表了兩個不同的AI創業方向:Face++是人臉識別技術服務提供者, 通過AI訓練提高人臉識別的精准度, 業務做得較早, 建立了行業門檻;今日頭條則是從行業本身出發, 把新聞推送業務做起來, 再把AI放進去改善產品。 這是兩種完全不同的發展模式。

張宏江博士把AI比喻為像電力系統一樣的基礎設施, 沒有電的時候, 可能有蒸汽機推動;但電被發明後, 就創造出了許多基礎性的工作。 AI也是一樣, 現在仍處於AI發展早期, 未來許多重複性的簡單腦力活動都可以用AI來取代。

比如, 一些call center都可以完全用AI來替代;一些專科醫生的影像識別, 可能也會被AI取代, 人需要看很多很多案例, 積累豐富的經驗才能做出判斷, 這正是AI擅長的。人本身的價值在於創意。

張宏江認為,現在的創業公司如果做單純的AI技術供應商是沒有價值的。AI必須與資料結合起來。而BAT這種巨頭公司因為業務已經滲透進人們生活的方方面面,更容易獲取更多的資料。創業公司需要同行業、具體的應用服務結合在一起。

“純粹的技術提供商,如果沒有資料,你是沒有前途的。AI的演算法只是讓資料變得更有價值。”張宏江說。

這正是AI擅長的。人本身的價值在於創意。

張宏江認為,現在的創業公司如果做單純的AI技術供應商是沒有價值的。AI必須與資料結合起來。而BAT這種巨頭公司因為業務已經滲透進人們生活的方方面面,更容易獲取更多的資料。創業公司需要同行業、具體的應用服務結合在一起。

“純粹的技術提供商,如果沒有資料,你是沒有前途的。AI的演算法只是讓資料變得更有價值。”張宏江說。

Next Article
喜欢就按个赞吧!!!
点击关闭提示