【GMIC 2017】吳恩達的離職帶熱AI話題張巨集江說AI將成為水電煤一樣的基礎設施

百度吳恩達的離職讓AI成為熱點話題，人工智慧技術的成熟使得可用資料集的大小、結構都有了極大增長。

例如，特斯拉收集了 780mn 英里的駕駛資料，而且通過他們的互連汽車，每 10 小時就能增加 100 萬英里的資料。此外， Jasper 有一個平臺，能讓多家汽車製造商和電信公司進行機器間的交流，這家公司於今年 2 月份被 Cisco 收購。 Verizon 在 8 月份做了類似的投資，宣佈收購 Fleetmatics。 Fleetmatics 做的是將汽車上的遠端感測器通過無線網路連接到雲軟體。

未來， 5G 網路的上線將會加速資料生成與傳輸的速率。據 IDC 的 Digital Universe Report 顯示，年度資料生成預期到 2020 年達到 44zettabytes，表明我們正在見證應用這些技術的使用案例。

與之類似的還有硬體成本的降低。 GPU 的再次使用、低成本計算能力的普遍化，特別是通過雲服務，以及建立新的神經網路模型，已經極大增加了神經網路產生結果的速度與準確率。

GPU 和並行架構要比傳統的基於資料中心架構的 CPU 能更快地訓練機器學習系統。通過使用圖像晶片，網路能更快的反覆運算，能在短期內進行更準確的訓練。

同時，特製矽的發展，比如微軟和百度使用的 FPGA，能夠用訓練出的深度學習系統做更快的推斷。另外，從 1993 年開始超級電腦的原計算能力有了極大發展。在 2016 年，單張英偉達遊戲顯卡就有了類似於 2002 年之前最強大的超級電腦擁有的計算能力。

在資料和計算能力大幅提升背後，演算法是配套設施。

更好的輸入（計算和資料）使得更多的研發是面向演算法，從而支援深度學習的使用。例如伯克利的 Caffe、穀歌的 TensorFlow 和 Torch 這樣的開源框架。比如，剛開源一周年的 TensorFlow，成為了 GitHub 上有最多 forked repositories 的框架。雖然不是所有的人工智慧發生於普遍可用的開源框架中，

但開源確實在加速發展，而且也有更多先進的工具正在開源。

總結起來， AI興起背後的本質原因是大量資料的產生：從2013年到2020年，資料將以每年40%的速率增長：傳統零售巨頭沃爾瑪每4小時產生2.5PB級的資料量；推特上每天的推文量在5億條左右；今日頭條每天要完成6BT的請求、完成6.3PB的資料處理量（1PB=1024BT）。

下圖展示的是最近幾年各個應用軟體圖片上載的情況：

張宏江認為，中國因為人口眾多，在資料來源、AI產業上的能力是不輸發達國家的，目前處於各自在發力狂奔的狀態。

張宏江目前比較看好的兩個國內AI創業專案是Face++和今日頭條，代表了兩個不同的AI創業方向：Face++是人臉識別技術服務提供者，通過AI訓練提高人臉識別的精准度，業務做得較早，建立了行業門檻；今日頭條則是從行業本身出發，把新聞推送業務做起來，再把AI放進去改善產品。這是兩種完全不同的發展模式。

張宏江博士把AI比喻為像電力系統一樣的基礎設施，沒有電的時候，可能有蒸汽機推動；但電被發明後，就創造出了許多基礎性的工作。 AI也是一樣，現在仍處於AI發展早期，未來許多重複性的簡單腦力活動都可以用AI來取代。

比如，一些call center都可以完全用AI來替代；一些專科醫生的影像識別，可能也會被AI取代，人需要看很多很多案例，積累豐富的經驗才能做出判斷，這正是AI擅長的。人本身的價值在於創意。

張宏江認為，現在的創業公司如果做單純的AI技術供應商是沒有價值的。AI必須與資料結合起來。而BAT這種巨頭公司因為業務已經滲透進人們生活的方方面面，更容易獲取更多的資料。創業公司需要同行業、具體的應用服務結合在一起。

“純粹的技術提供商，如果沒有資料，你是沒有前途的。AI的演算法只是讓資料變得更有價值。”張宏江說。

這正是AI擅長的。人本身的價值在於創意。

“純粹的技術提供商，如果沒有資料，你是沒有前途的。AI的演算法只是讓資料變得更有價值。”張宏江說。

【GMIC 2017】吳恩達的離職帶熱AI話題 張巨集江說AI將成為水電煤一樣的基礎設施

【GMIC 2017】吳恩達的離職帶熱AI話題張巨集江說AI將成為水電煤一樣的基礎設施