關於Google發佈AutoML的幾點看法

文章為作者對AutoML的幾點思考，希望能夠給你帶來一些啟發。

我曾拋出過一個問題：

有沒有這樣的模型，可以對應用環境做出即時回饋，

動態重構整套模型？例如：前一秒還是深度神經網路，接受刺激後，就立馬坍縮成一個SVM。

當時得到的一個回答是Alpha Zero，這不是我期待的答案，但在大方向上比較接近。

提出這種疑問，是因為人類對事物的認知也是即時重構的。人腦的神經網路有一種在同經驗的對話交流中重新串聯它們自己的能力。每當人看到一個模式，那些認識這個模式的神經網路連接會長得更強大，直到認識變成某種自動反應。如果模式改變了，那麼我們用來感知它的能力也會慢慢改變，直到我們自己的大腦重新串聯來認識這個新模式。

若將人腦的這種學習機制放到AI領域，就是遷移學習，一種對變化環境的適應能力。

今天， Google發佈了Cloud AutoML，能夠通過增強學習自動完成模型選擇+超參數優化。

它一定程度上再現了Alpha Zero的設計理念，也比Zero更直觀。

人工神經網路已經實現了學習模型的自編碼，還需要人來訓練。而AutoML更進一步，實現了訓練過程的自編碼，通過類似Axure的拖拽方式就能完成對話操作。部分場景的訓練效果可能比AI工程師還好，

提高了開發效率，也降低了准入門檻。

下面是本人對AutoML的幾點思考，還不太成熟，歡迎指正。

AI工程師是否將被取代？

目前只會刺激更多人投身到AI領域，估計很快就會有《零基礎1小時創建機器學習模型》這類教學視頻出現。至於取代工程師？未來不好說，目前AutoML還遠沒有那麼強大，優秀的AI工程師依然是爭搶的對象。

AutoML對AI產品經理意味著什麼？

它像一款製作Demo的工具，可以幫PM理解端到端學習的應用邊界。大部分PM（尤其轉型中的）並不具備AI工程師的實操能力，這是個真實存在的痛點。以後若要驗證新的場景思路，可以先做個Demo試試。解放出更多精力，分攤到分析場景、獲取資料、設計方案、推進落地上。

頂尖企業是否會用AutoML？

有AI基因的頂尖企業會選擇自研ML訓練平臺，比如BAT、華為、訊飛會將AutoML作為參考和過渡，不會依賴。這類雲服務有很好的商業前景，估計國內很快就會有類似的平臺上線，並借助自研的平臺高效為產業賦能。

非頂尖企業是否會用AutoML？

這取決於Google的功能反覆運算和售後服務，

能否滿足企業日益增長的細分場景需求。若AutoML能支撐更多場景，用真實資料打消中小型企業對黑盒訓練的顧慮，就可以幫助互聯網企業省掉大量研發成本。傳統企業也可通過招募工程師或外包團隊，借助AutoML搞定簡單場景。

AutoML後續的反覆運算方向有哪些？

a）無監督、半監督學習

目前只支持監督學習，解決了設計模型、調參兩大痛點。其實相對於訓練模型，有時候標注資料的問題更令人頭疼。後續肯定可以支撐半監督學習，將部分標籤資料做為參考，對剩餘資料自動打標。

b）增強學習

連AutoML本身都是增強學習的產物，沒道理不支持。想想也蠻有意思，用增強學習來自動擬合增強學習模型，這就像師父教了個徒弟，然後徒弟再去教自己的徒弟。

c）NLP、CV、ASR、翻譯

第一版本只開放了圖像識別，也是最成熟的一塊，其他標準模型的支撐不會太遠。

d）從模型延伸到應用

能否進一步降低門檻，將模型對通用場景生成API，甚至直接生成AI應用呢？

例如一家小型超市，想知道如何調整商品擺放、商品品類、進貨量、促銷活動等來實現更高收益，他們雇不起工程師。這樣的超市還有很多，AutoML將來能否滿足類似的需求？

e）應用即訓練

目前大部分模型的訓練過程與應用部署是分開的，當然也看具體場景和終端的容量。小米的防盜鎖，每次指紋識別都會增加下一次的識別速度、準確度，越用越爽。

AutoML能否在雲端實現應用場景下的即時訓練呢？相信會有這樣的需求，比如線上醫療成像診斷，即時獲取N家醫院的診斷資料，通過動態的訓練使診斷正確率持續提升。

f）共用模型/應用

資料是戰略資源，共用資料（尤其打標好的）的阻力很大，但共用訓練好的模型並非沒有可能。若AutoML支援共用行業解決方案，會受到很多企業的青睞，尤其是冷開機的創業項目。這樣企業就不用再愁訓練資料，只要支付雲服務費就獲得現成的模型或應用。

g）通用能力

估計企業最關心的就是通用能力了，如果不支撐複雜場景、長尾場景，就有一大批企業無法靠AutoML訓練出想要的模型。

AutoML對國內巨頭意味著什麼？

Google大方地公佈Tensorflow、AutoML的源碼，不僅因為開放的基因和格局，更因為它手裡掌握著核心競爭力與撒手鐧，具備降維打擊的能力。它正在汲取群眾的智慧來完善自己，把更多敵人變為朋友。

我覺得未來AI公司的競爭，拼的是這3方面：

以區塊鏈、遷移學習、AI晶片為代表的技術突破下探到行業將場景落地的能力持續自我反覆運算的進化能力

這三方面在AutoML上均有體現。不難想像，國內巨頭們可能已經將自研類似的產品納入到戰略規劃了。它在自編碼、場景遷移的方向上擁有巨大潛力，這種向內生長的可能性比雲服務本身更有價值。

在探索未來的道路上，Google是走的最遠的那一個。我們有理由相信，AutoML只是道開胃小菜，後面會有一大波滿漢全席靠近，不知國內巨頭如何抵擋。

AutoML的局限有哪些？

AutoML降低了准入門檻，但目前的深度學習體系本就是殘缺的，例如：抽象的層次太淺、無視因果關係、黑盒、基於統計。DNN還不夠優雅，缺乏生機，這是我作為一名產品經理感受。

無論NLP還是遷移學習，瓶頸都在於機器意識、知識圖譜的突破，我的思路是：

從認知學、腦科學、神經學尋找靈感結合最先進的機器學習和區塊鏈技術，做模型間的深度耦合，在演算法層面持續推演量子計算晶片的突破，新的底層架構一定會催生出顛覆性的應用思路對知識圖譜的思維轉變，需要有更複雜的描述框架。相信未來的知識圖譜不會是簡單的存儲結構，而是包含計算力和演算法的動態體系，就像人和地球一樣。

作者：於長弘，公眾號：AI小宇宙（ID：AI_endless）

本文由 @於長弘原創發佈于人人都是產品經理。未經許可，禁止轉載

題圖來自 Unsplash ，基於 CC0 協議

然後徒弟再去教自己的徒弟。