專家總結2017年機器學習重大行業成果，AlphaGo Zero是一大關鍵

過去的2017年對於機器學習來說，是充滿驚喜的一年，從GAN的發展到膠囊演算法的提出再到人工智慧的落地應用。許多人擔憂的十年一輪的AI“寒冬”似乎還沒有露頭的徵兆。面對即將到來的2018，我們又可以展望哪些值得期待的技術成果呢？

近日， KDnuggets網站向幾位機器學習和AI專家諮詢了2017最重要的行業發展成果，以及他們對2018年關鍵趨勢的預測意見。

首先，讓我們回顧一下2016年行業的主要趨勢和預測，主要集中在這四個領域：

AlphaGo的成功；

對深度學習的狂熱；

自動駕駛汽車；

TensorFlow以及神經網路的應用

在2017年結束之際，我們和大資料、資料科學、人工智慧還有機器學習界的幾位專家談了談，

瞭解了一下他們對2017年重要成果的看法以及2018年重要的趨勢是什麼。如果你也感興趣，就接著往下看吧~

Xavier Amatriain， Curai公司的聯合創始人兼CTO、前Quora工程副總裁、前Netflix研發/工程總監

如果一定要做出一個選擇，

那麼我認為AlphaGo Zero是今年的最大亮點。這種新方法不僅能在一些最先進的方向上有所改進（例如深度強化學習），這種無需資料就能學習的方法還代表著一種全新模式。而且AlphaGo Zero現在已經能自學國際象棋等好幾種棋類遊戲了，非常令人驚歎。

再看人工智慧方面，年初的PyTorch後來居上，頗有挑戰TensorFlow的趨勢，尤其是在研究領域。不過TensorFlow也不甘示弱，立刻發佈了動態網路TensorFlow Fold。

大公司之間的“AI之戰”涉及方方面面，不過最激烈的還是“雲”的競爭。現在所有主要的供應商都加緊了對雲服務的支援。亞馬遜已經對AWS進行了大量創新，比如最近推出的用來構建和部署ML模型的Sagemaker。除此之外一些小型玩家也加入了進來。英偉達最近推出了他們的GPU雲，這將成為訓練DL模型的另一個有趣的選擇。

儘管有競爭，但是各大公司在必要時也會選擇合作。 Facebook與微軟等公司合作推出的最新版ONNX正是實現共用神經網路的重要一步。

2017年，圍繞人工智慧所展開的社會問題也進一步延續升級。埃隆·馬斯克（Elon Musk）仍然覺得我們慢慢會造出殺人機器人。還有很多關於人工智慧在未來幾年會影響工作的言論。最後，還有很多關於AI演算法透明度和偏見的討論。

關於Xavier Amatriain的更多觀點，可以查看：https://www.kdnuggets.com/2017/12/xavier-amatriain-machine-leanring-ai-year-end-roundup.html

Pedro Domingos，華盛頓大學電腦科學與工程系教授

人工智慧Libratus戰勝德州撲克頂級選手，將AI的主導地位擴展到不完善的資訊博弈中（www.cmu.edu/news/stories/archives/2017/january/AI-beats-poker-pros.html）；

自動駕駛汽車和虛擬助手的競爭越來越激烈， Alexa在虛擬助手中脫穎而出；

谷歌、亞馬遜、微軟、IBM之間的雲人工智慧發展競賽層出不窮；

AlphaGo Zero非常強大，但不是一項突破。自我對抗是ML最原始的原理之一，但人類不用對戰500萬局遊戲就能掌握圍棋的下法。

Charles Martin，資料科學家、機器學習和人工智慧諮詢

2017年見證了深度學習作為AI的平臺發展上升的過程。今年， Facebook發佈了PyTorch，成為TensorFlow強有力的競爭對手。除此之外， Gluon、Alex、AlphaGo都在不斷進步。 ML從特徵識別和邏輯回歸發展到閱讀文章、搭建神經網路、優化訓練效果。在我的諮詢工作中，客戶已經在尋求個性化的物體檢測、高級的NLP模型以及強化學習。當市場和比特幣飆升的時候，人工智慧一直是場沉默的革命，零售業的變革表明人工智慧將佔領這一行業。在工作中我發現，公司都積極地想改變自己，他們對在技術和戰略方面應用人工智慧非常感興趣。

2018年必將成為全球人工智慧經濟突破的第一年。我們有來自歐洲、亞洲、印度甚至沙烏地阿拉伯的需求。全球需求將繼續增長，中國、加拿大、印度等國正將重點從IT轉向人工智慧。同時，不管是美國還是海外，對企業培訓的需求也很大。人工智慧將使效率大規模提高，讓許多傳統行業，如製造業、醫療保健和金融業都受益。人工智慧創企將把新產品推向市場並全面提高投資回報率。而不管是機器人還是自動駕駛技術，都將會帶來驚人的改變。

對創新來說，這將是偉大的一年。

Nikita Johnson， RE.WORK的創始人

2017年， ML和AI取得了巨大的進步，特別是最近DeepMind推出的一般強化學習演算法，能夠在四小時內自學，打敗了世界上最好的棋類電腦程式。

2018年，我希望看到智慧的自動化設備滲透到更多公司，例如傳統製造業、零售業以及公共事業公司。隨著資料收集和分析的不斷增加，企業對自動化系統戰略的需求將至關重要，這將讓公司把AI列入長期投資計畫中，並將其看作是企業未來增長的優先事項。

我們還將看到，自動化的機器學習系統能説明非AI研究人員更容易地使用該技術，並使更多的公司能將機器學習方法應用到他們的工作場所中去。

Georgina Cosma，諾丁漢特倫特大學科學與技術學院的高級講師

機器學習，特別是深度學習模型，正在對一些特殊領域產生重要影響，例如醫療保健、法制體系、工程領域以及金融行業。但是，大部分機器學習模型並不容易解釋。瞭解一個模型如何實現在分析和診斷模型中非常重要，因為人們需要有足夠的信心相信模型的預測。重要的是，一些機器學習模型做出的決定符合規則。現在我們需要創建足夠透明的深度學習模型來解釋它們的預測，特別是當這些模型用來影響人類的決策時。

Ajit Jaokar，首席資料科學家，牛津大學資料科學和物聯網課程的創建者

2017是AI元年，2018將是AI成熟的一年。我們更多的是從“系統工程或雲原生”的角度看待人工智慧，AI正變得越來越複雜，而像h2o.ai這樣的公司就簡化了部署AI的複雜性。

我看到AI正越來越多地成為競爭優勢，特別是在工業物聯網、零售和醫療保健方面。同時，AI正迅速被應用在企業的各個層面，雖然會增加新的工作機會，但也會導致大量失業。因此，AI的熱度已經超越了Python與R之爭。

我認為AI是通過嵌入式人工智慧（即跨越企業和物聯網的資料科學模型）將傳統企業與更廣泛的供應鏈合併。

最後，除了銀行業等傳統企業之外，整個行業對懂得AI或深度學習的資料科學家將繼續處於短缺狀態。

Hugo Larochelle，谷歌研究科學家，加拿大高級研究機構和大腦學習機構的副主任

我最感興趣的機器學習領域是元學習（meta-learning）。元學習是一個比較寬泛的說法，但今年，最令人激動的是少數學習問題上取得的進展，它解決了從少數幾個例子中發現學習演算法的問題。Chelsea Finn今年年初時總結了這個話題早期進展，博客位址：bair.berkeley.edu/blog/2017/07/18/learning-to-learn/。值得注意的是，在現在很多機器學習方面的博士生中，Chelsea Finn被認為是今年最令人印象深刻的學生之一。

今年後半年，關於少數案例的元學習研究就更多了。例如使用深度時空域卷積網路，圖形神經網路及其他。我們還看到用元學習方法主動學習，冷開機項目推薦，few-shot分佈估計，強化學習，分層強化學習，模仿學習，等等。

Sebastian Raschka，密西根州立大學應用機器學習和深度學習研究者、電腦生物學家、Python Machine Learning一書的作者

在過去幾年中，開源社區就已經對新出現的深度學習框架進行了大量討論。現在這些工具已經大致成熟了，我希望並且期待看到更多不再依賴於工具的方法，而是將精力用於開發和實現利用深度學習的新穎想法中。並且，我希望看到更多利用生成對抗神經網路和Hinton的膠囊網路解決的新問題，這是今年討論的熱門話題。

此外，基於我們最近的一篇關於半對抗神經網路（semi-adversarial neural nets）論文中所寫的將隱私賦予到臉部圖像中，使用者隱私在深度學習中是一個非常重要的問題，我希望這個話題將在2018年繼續被關注。

Brandon Rohrer，Facebook資料科學家

2017年出現了個更多機器打敗人類的事件。去年，AlphaGo擊敗了世界上最好的圍棋選手，創建了AI之路上重要的里程碑。今年，AlphaGo Zero超越了他的上一代，從頭教自己下棋，不僅擊敗了人類，還擊敗了彙集所有人類經驗的圍棋遊戲（deepmind.com/blog/alphago-zero-learning-scratch）。除此之外，現在一台機器可以在Switchboard對話語音辨識任務中已經達到人類對等的水準（arxiv.org/abs/1708.06073）。

然而，人工智慧的成就所覆蓋的範圍仍然比較窄，成果也很脆弱。圖像中單個圖元的改變就有可能擊敗最先進的圖像分類器（arxiv.org/pdf/1710.08864.pdf）。我預計2018年會出現更多通用、強大的AI解決方案，“AGI”將會替代“AI”成為明年的流行詞。

Elena Sharova，投資銀行的資料科學家

2017年機器學習和人工智慧的主要發展成果是什麼？

我看到有更多的公司和個人把它們的資料和分析轉移到基於雲的解決方案中，同時越來越多的人意識到了資料安全的重要性。

大型技術公司正競相成為資料分析和儲存平臺。對於資料科學家來說，這意味著這一平臺所能提供的功能正影響著他們開發的工具箱和解決方案。

2017年，全球資料安全問題頻發，這是一個不容忽視的問題。隨著越來越多的資料轉移到協力廠商存儲，對於能夠應對新型威脅的需求將繼續增長。

看到了2018年的哪些趨勢？我認為2018年將有更多公司遵守“全球資料保護條例”（GDPR），並且應對機器學習系統“隱藏”的技術。作為一項歐盟法規，GDPR具有全球影響力，所有資料科學家應該充分意識到它是如何影響他們工作的。根據穀歌NIPS 2016中的論文，資料依賴的代價高昂，而且隨著企業創建複雜的資料驅動模型，他們必須思考如何解決這一問題。

Tamara Sipes，Optum/UnitedHealth集團的商業資料科學總監

深度學習和組合建模的力量在2017年繼續顯示出與其他機器學習工具相比的價值和優勢。尤其是深度學習，在各個領域都有所應用。

至於2018年的趨勢，深度學習很可能會被用來從原始的輸入中生成新的特徵和概念，並取代手工創建或設計新變數。深度網路在檢測資料特徵和結構方面是非常強大的，資料科學家們認識到無監督的深度學習可在此領域發揮更多價值。

另外，有效地異常檢測可能也是近期的重點。在許多行業中，異常事件和其他異常情況都是資料科學工作的重點：入侵偵測、財務欺詐檢測、醫療保健中的欺詐、浪費、濫用和錯誤以及其他故障等等。檢測這些不常見的事情是使企業在競爭中保持優勢的方法，瞭解這些時間的本質是這一領域有趣且困難的挑戰。

Rachel Thomas，fast.ai創始人，USF教授助理

雖然沒有AlphaGo和會後空翻的機器人那樣驚豔，但2017年最令我興奮的事情是深度學習框架變得更加友好且易於訪問。今年發佈的PyTorch對任何熟悉Python的人都很友好（主要是由於動態計算和OOP設計）。即使是TensorFlow也正朝著這個方向發展，將Keras加入到其核心代碼庫並宣佈動態執行。我希望可以看到2018年程式設計人員使用深度學習框架的障礙越來越低。

第二個趨勢是媒體報導關於政府將人工智慧用於監督的數量將會增加。隱私威脅在今年已經不是什麼新鮮事了，但直到最近才受到廣泛關注。例如用深度學習來識別戴著圍巾和帽子的示威者，或者用圖片判斷某人的性取向，使得今年更多媒體開始關注AI隱私風險。希望2018年不只是能看到馬斯克擔憂AI的言論，還能有更多對隱私、監控的關注，以及在通過編碼消除對性別和種族的歧視。

Daniel Tunkelang，Twiggle的首席搜索傳播者、知名組織顧問

對自動駕駛和語音助手來說，2017年是意義重大的一年。這兩個應用是深度學習如何從小說變為現實的典範。

但是今年機器學習和AI最重要的發展成果是對於道德、可靠性以及可解釋性上的研究。埃隆·馬斯克（Elon Musk）今年關於人工智慧可能會帶來世界大戰的言論引發了媒體的激烈討論，奧倫·埃佐尼（Oren Etzioni）和羅德尼·布魯克斯（Rodney Brooks）等人都參與反駁。儘管有人說他是危言聳聽，但我們真切地面臨著機器學習模型中明顯的差異和危險，比如word2vec裡面的性別歧視、刑事判決所用的演算法中的種族主義，以及對社交媒體回饋評分的故意操縱模型。這些都不是新問題，但是機器學習，特別是深度學習，卻讓這一現象更加嚴重。

我們終於看到可解釋的AI作為一門學科出現，它結合了學者、業界從業者以及政策制定者。希望明年，我們將有更多動力照亮深度學習這個黑盒子。