新智元編譯
在即將告別2017年之際, KDnuggets向多位機器學習和AI專家詢問了哪些是2017年最重要的發展, 以及他們對2018年關鍵趨勢的預測有哪些。 這份報告試圖抓住2017年的重要事件, 以及產業、學術和技術發展的脈搏, 同時也盡力去展望即將到來的2018年的關鍵趨勢。
被採訪者是大資料、資料科學、人工智慧和機器學習領域的一些頂尖專家。 具體來說, 採訪的問題是:“在2017年, 與機器學習和人工智慧相關的主要發展是什麼?2018年,
作為一個快速的回顧, 去年的趨勢和預測主要集中在以下議題:
AlphaGo的成功
深度學習的熱潮
自動駕駛汽車
TensorFlow對神經網路技術商用化的影響
AlphaGo Zero令人興奮, 雲競爭激烈
Xavier Amatriain:Curai的聯合創始人兼CTO, 之前是Quora的工程副總裁和Netflix的研究/工程總監。
如果一定要選一個今年的主要亮點的話, 那就是AlphaGo Zero。 這一新方法不僅在一些最有前途的方向上得到改進(例如深度強化學習), 而且它還代表了一種范式轉換, 即模型可以在沒有資料的情況下學習。 最近我們也瞭解到, AlphaGo Zero還能推廣到象棋等其他遊戲。
至於人工智慧的工程方面, 2017年Pytorch開始升溫, 成為Tensorflow的一個對手, 特別是在研究領域。
Tensorflow通過在Tensorflow Fold中發佈動態網路,
2017年, 圍繞AI的社會問題也在延續(升級)。 伊隆·馬斯克(Elon Musk)認為我們越來越接近殺手AI的觀點繼續發酵, 令許多人感到沮喪。 關於AI在未來幾年將如何影響工作,
深度學習模型需要透明度
Georgina Cosma:諾丁漢特倫特大學科學與技術學院高級講師
機器學習模型, 尤其是深度學習模型, 正在對醫療、法律體系、工程和金融等關鍵領域產生重大影響。 但是, 大多數機器學習模型不容易解釋。 在分析和診斷模型中, 理解模型是如何實現預測的尤其重要, 因為人類必須要有足夠的信心去相信模型提出的預測。 重要的是, 一些機器學習模型的決定必須與法律法規相符。 現在是創建足夠透明的深度學習模型以解釋它們的預測的時候了, 特別是當這些模型的結果被用來影響或告知人類決策時。
AlphaGo Zero很偉大,
Pedro Domingos:華盛頓大學電腦科學與工程系教授, 《終極演算法》作者。
Libratus(冷撲大師)在德州撲克上的勝利, 將AI的優勢擴展到不完善的資訊博弈
自動駕駛汽車和虛擬助理的競爭日益激烈, Alexa在後者的競爭中勢如破竹。
谷歌、亞馬遜、微軟和IBM之間雲AI的競爭持續升溫。
AlphaGo Zero很偉大, 但算不上是一個突破。 self-play 是ML的一個存在已久的想法, 而人類遠遠不需要下夠500萬盤棋才能掌握圍棋。
2018年將是AI成熟的一年
Ajit Jaokar:主任資料科學家, 牛津大學物聯網資料科學課程的創建者。
2017年是AI的一年。 2018年將是AI成熟的一年。 我們已經從更多是“系統工程/雲”的角度看到這一趨勢。 AI正在變得越來越複雜, h2o.ai這類公司則簡化了部署AI的複雜性。
AI正越來越多地用於競爭優勢, 尤其是在工業物聯網、零售和醫療領域, 這將導致更大的顛覆。AI也正在迅速地部署到企業的各個層面(帶來許多新的機會,但也將導致更多職業消失)。
我認為AI正在通過嵌入式AI(即跨越企業和物聯網的資料科學模型)融合傳統的企業和更廣泛的供應鏈。
最後,傳統行業將繼續缺乏懂得AI/深度學習技術的資料科學家,例如銀行業(尤其是工業物聯網領域)。
智慧自動化將滲透到各行各業
Nikita Johnson:RE.WORK創始人
2017年,ML和AI的發展取得了巨大的進步,尤其是最近DeepMind發表的通用強化學習演算法,在自我對弈4個小時之後,擊敗了世界上最好的象棋程式。
2018年,我期望看到智慧自動化滲透到各行各業的公司,從傳統製造業、零售業到公共事業。隨著資料收集和分析的不斷增加,企業級自動化系統原則的需求將變得至關重要。這將使企業能夠投資於一個更長期的AI計畫,並確保它是未來增長和效率提升的優先事項。
我們還將看到自動化機器學習幫助非AI研究人員更容易使用機器學習技術,並使更多公司將機器學習方法應用到他們的工作場景。
meta-learning 和 few-shot learning
Hugo Larochelle:谷歌研究科學家,加拿大高級研究所Learning in Machines and Brains專案副主任
在機器學習的趨勢中,我最感興趣也最關注的是元學習(meta-learning)。元學習是一個特別寬泛的概括性術語。但今年,對我來說最令人興奮的是 few-shot learning 的進展,它解決了發現學習演算法的問題,這些演算法從很少的樣本中得到很好的泛化。 Chelsea Finn 今年年初針對這個問題寫了一篇很好的總結文章:bair.berkeley.edu/blog/2017/07/18/learning-to-learn/。
今年有更多關於 few-shot learning 和 meta-learning 研究,包括使用深度時序卷積網路(arxiv.org/abs/1707.03141),圖形神經網路(arxiv.org/abs/1711.04043)等等。meta-learning 方法也被用於主動學習(arxiv.org/abs/1708.00088),冷開機專案推薦(papers.nips.cc/paper/7266-a-meta-learning-perspective-on-cold-start-recommendations-for-items),few-shot分佈估計(arxiv.org/abs/1710.10304),強化學習(arxiv.org/abs/1611.05763),分層RL(arxiv.org/abs/1710.09767 ),模仿學習(arxiv.org/abs/1709.04905),等等。
這是一個令人興奮的領域,2018年我會繼續密切關注。
2018年將成為全球“AI first”經濟的突破之年
Charles Martin:資料科學家、機器學習AI顧問
2017這一年,我們看到了一個巨大的深度學習AI平臺和應用程式。今年,Facebook發佈了他們的Tensorflow競爭對手PyTorch。Gluon, Alex, AlphaGo等等成果不斷。 機器學習從特徵工程和邏輯回歸發展到閱讀論文,實現神經網路,優化訓練效果。在我的諮詢實踐中,客戶已經在尋求自訂物件檢測,高級NLP和強化學習。當市場和比特幣飆升的時候,人工智慧一直是一場沉默的革命,零售業的啟示激起人們認為人工智慧將顛覆行業。公司都想要進行自我變革。我們非常感興趣進行AI指導,包括技術層面和戰略層面。
2018年必將成為全球“AI first”經濟的突破之年。我們有來自歐洲、亞洲、印度、甚至沙烏地阿拉伯的需求。全球需求將繼續增長,來自中國和加拿大的人工智慧進步很大,印度等國家正從IT重新調整為人工智慧。美國和海外的企業培訓需求都很大。人工智慧將實現大規模的效率,傳統行業(如製造業,醫療保健和金融)將從中受益。人工智慧創業公司將把新產品推向市場並全面提高投資回報率。而從機器人到自動駕駛汽車的新技術將會帶來驚人的進步。
對於創新而言,明年將是偉大的一年。
以工具為中心的方法將減少,重要的是開發和實現利用深度學習的新想法和應用
Sebastian Raschka:密西根州立大學應用機器學習和深度學習研究員和計算生物學家,《Python機器學習》的作者。
在過去的幾年中,開源社區已經就所有新出現的深度學習框架進行了大量的討論。現在,這些工具已經有所成熟了,我希望以工具為中心的方法會有所減少,期待將更多精力用於開發和實現利用深度學習的新穎想法和應用。我尤其期望看到用生成對抗神經網路和Hinton的capsule來解決更多問題。
“AGI”將會取代“AI”成為流行詞
Brandon Rohrer:Facebook的資料科學家。
2017年還有更多機器擊敗人類的成就。去年,AlphaGo擊敗了世界上最好的人類棋手,通過了智慧之路上的一個長期里程碑。今年,AlphaGo Zero通過從零開始的自我對弈學習,超越了它的上一版本。(deepmind.com/blog/alphago-zero-learning-scratch)它不僅擊敗了一個人類,還擊敗了全體人類的圍棋智慧。更實際的興趣,一台機器現在可以從交換機基準來轉錄電話交談。 (arxiv.org/abs/1708.06073)
然而,人工智慧的成就仍然狹窄和脆弱。改變圖像中的單個圖元可以擊敗最先進的分類器。 (arxiv.org/pdf/1710.08864.pdf)我預計2018年將帶來更多通用和強大的AI解決方案。幾乎每個主要的科技公司都已經有了一個人工智慧的工作。這些團體及其早期成果將成為頭條新聞。至少,“AGI”將會取代“AI”成為當年的流行詞。
機器學習系統“隱藏”技術欠下的債不容忽視
Elena Sharova是一家投資銀行的資料科學家。
要說2017年機器學習/人工智慧主要的發展,我看到越來越多的公司和個人將他們的資料和分析轉移到基於雲的解決方案,對資料安全的重要性的意識也急劇上升。
最大和最成功的技術公司已經競相成為資料存儲和分析平臺。對於資料科學家來說,這意味著他們所開發的工具箱和解決方案正被這種平臺所能提供的功能和能力所塑造。
2017年,全球發生了幾起大型資料安全性漏洞。這一點不容忽視。隨著越來越多的資料轉移到協力廠商存儲,對於適應新威脅的更強大安全性的需求將繼續增長。
至於2018年的關鍵趨勢,一個是確保遵守《全球資料保護條例》(GDPR),另一個則是應對機器學習系統“隱藏”技術欠下的債,這筆債正在越變越多,不容忽視。GDPR作為一項歐盟法規,具有全球影響力,所有資料科學家應該充分意識到它對自己工作的影響。根據Google的NIPS’16論文,資料依賴性代價高昂,而且隨著企業創建複雜的資料驅動模型,他們將不得不仔細考慮如何解決這一成本問題。
資料科學家正認識到無監督深度學習的價值
Tamara Sipes,Optum/UnitedHealth Group商業資料科學總監
2017年的主要發展和2018年的主要趨勢:
深度學習和集成建模方法在2017年繼續證明了它們相比其他機器學習工具的價值和優勢。特別是深度學習,在各個領域和行業得到了更加廣泛的應用。
至於2018年的發展趨勢,深度學習可能會被用來從原始輸入中產生新的特徵和新的概念,並且取代手動創建或設計新變數的需求。深度網路在檢測資料的特徵和結構方面是非常強大的,資料科學家正在認識到無監督深度學習可以為此發揮的價值。
有效異常檢測(Effective anomaly detection)可能也是近期的重點。在許多行業中,資料科學工作的重點是異常事件和其他類型的罕見事件:入侵偵測、財務欺詐檢測、詐騙、醫療保健中的濫用和錯誤以及設備故障等等。檢測所有這些罕見的事件將會使企業在領域中產生競爭優勢。跟上這些罕見事件檢測的演變節奏,將是一個有趣的問題和困難的挑戰。
深度學習框架變得更加用戶友好且易於訪問
Rachel Thomas,fast.ai創始人,USF助理教授。
雖然不像AlphaGo或者波士頓動力會後空翻的機器人那樣華麗,但讓我感到最興奮的2017年AI趨勢,是深度學習框架變得更加用戶友好且易於訪問。今年發佈的PyTorch,對任何瞭解Python的人都很友好(主要是由於動態計算和OOP設計)。不過,TensorFlow也正朝著這個方向發展,將Keras納入其核心代碼庫並宣佈動態圖運算。編碼人員使用深度學習的門檻正變得越來越低。我預計2018年,這種開發人員可用性增長的趨勢將持續下去。
第二個趨勢是媒體報導專制政府監督人工智慧的能力。2017年爆出了很多威脅隱私的新聞,但直到最近這才開始受到廣泛的關注。利用深度學習來識別戴著圍巾和帽子的示威者,或者通過圖片來識別某人的性取向,使得今年有更多的媒體開始關注AI的隱私風險。希望在2018年,我們可以繼續擴大討論馬斯克說的邪惡超級AI的話題,並解決通過編碼涉嫌監視、隱私和對性別歧視和種族主義偏見的問題。
“可解釋的AI”作為一門學科出現
Daniel Tunkelang是Twiggle的首席搜索傳播者,也是眾多知名組織的顧問。
2017年對於自動駕駛汽車和會話數字助理來說都是一個大年。這兩個都是深度學習將科幻小說變為事實的應用領域。
但是,今年機器學習和人工智慧最重要的發展,是對道德、問責和可解釋性的持續關注。馬斯克關於人工智慧觸發世界大戰的啟示性警告點燃了媒體,Oren Etzioni和Rodney Brooks等人則認真反駁。儘管如此,機器學習模型偏差的風險仍然存在,比如word2vec中的性別主義,演算法在刑事判決中的種族主義,以及對社交媒體資訊流的評分模型的故意操縱。這些問題都不是新出現的,但是機器學習的加速應用,特別是深度學習的大量使用,已經將這些問題推到了普通公眾面前。
2017年,我們終於看到“可解釋的AI”作為一門學科出現,彙集了學者、業界從業者和政策制定者的參加。2018年,照亮深度學習模型黑箱的壓力和動力都將進一步加大。
原文:https://www.kdnuggets.com/2017/12/machine-learning-ai-main-developments-2017-key-trends-2018.html
這將導致更大的顛覆。AI也正在迅速地部署到企業的各個層面(帶來許多新的機會,但也將導致更多職業消失)。我認為AI正在通過嵌入式AI(即跨越企業和物聯網的資料科學模型)融合傳統的企業和更廣泛的供應鏈。
最後,傳統行業將繼續缺乏懂得AI/深度學習技術的資料科學家,例如銀行業(尤其是工業物聯網領域)。
智慧自動化將滲透到各行各業
Nikita Johnson:RE.WORK創始人
2017年,ML和AI的發展取得了巨大的進步,尤其是最近DeepMind發表的通用強化學習演算法,在自我對弈4個小時之後,擊敗了世界上最好的象棋程式。
2018年,我期望看到智慧自動化滲透到各行各業的公司,從傳統製造業、零售業到公共事業。隨著資料收集和分析的不斷增加,企業級自動化系統原則的需求將變得至關重要。這將使企業能夠投資於一個更長期的AI計畫,並確保它是未來增長和效率提升的優先事項。
我們還將看到自動化機器學習幫助非AI研究人員更容易使用機器學習技術,並使更多公司將機器學習方法應用到他們的工作場景。
meta-learning 和 few-shot learning
Hugo Larochelle:谷歌研究科學家,加拿大高級研究所Learning in Machines and Brains專案副主任
在機器學習的趨勢中,我最感興趣也最關注的是元學習(meta-learning)。元學習是一個特別寬泛的概括性術語。但今年,對我來說最令人興奮的是 few-shot learning 的進展,它解決了發現學習演算法的問題,這些演算法從很少的樣本中得到很好的泛化。 Chelsea Finn 今年年初針對這個問題寫了一篇很好的總結文章:bair.berkeley.edu/blog/2017/07/18/learning-to-learn/。
今年有更多關於 few-shot learning 和 meta-learning 研究,包括使用深度時序卷積網路(arxiv.org/abs/1707.03141),圖形神經網路(arxiv.org/abs/1711.04043)等等。meta-learning 方法也被用於主動學習(arxiv.org/abs/1708.00088),冷開機專案推薦(papers.nips.cc/paper/7266-a-meta-learning-perspective-on-cold-start-recommendations-for-items),few-shot分佈估計(arxiv.org/abs/1710.10304),強化學習(arxiv.org/abs/1611.05763),分層RL(arxiv.org/abs/1710.09767 ),模仿學習(arxiv.org/abs/1709.04905),等等。
這是一個令人興奮的領域,2018年我會繼續密切關注。
2018年將成為全球“AI first”經濟的突破之年
Charles Martin:資料科學家、機器學習AI顧問
2017這一年,我們看到了一個巨大的深度學習AI平臺和應用程式。今年,Facebook發佈了他們的Tensorflow競爭對手PyTorch。Gluon, Alex, AlphaGo等等成果不斷。 機器學習從特徵工程和邏輯回歸發展到閱讀論文,實現神經網路,優化訓練效果。在我的諮詢實踐中,客戶已經在尋求自訂物件檢測,高級NLP和強化學習。當市場和比特幣飆升的時候,人工智慧一直是一場沉默的革命,零售業的啟示激起人們認為人工智慧將顛覆行業。公司都想要進行自我變革。我們非常感興趣進行AI指導,包括技術層面和戰略層面。
2018年必將成為全球“AI first”經濟的突破之年。我們有來自歐洲、亞洲、印度、甚至沙烏地阿拉伯的需求。全球需求將繼續增長,來自中國和加拿大的人工智慧進步很大,印度等國家正從IT重新調整為人工智慧。美國和海外的企業培訓需求都很大。人工智慧將實現大規模的效率,傳統行業(如製造業,醫療保健和金融)將從中受益。人工智慧創業公司將把新產品推向市場並全面提高投資回報率。而從機器人到自動駕駛汽車的新技術將會帶來驚人的進步。
對於創新而言,明年將是偉大的一年。
以工具為中心的方法將減少,重要的是開發和實現利用深度學習的新想法和應用
Sebastian Raschka:密西根州立大學應用機器學習和深度學習研究員和計算生物學家,《Python機器學習》的作者。
在過去的幾年中,開源社區已經就所有新出現的深度學習框架進行了大量的討論。現在,這些工具已經有所成熟了,我希望以工具為中心的方法會有所減少,期待將更多精力用於開發和實現利用深度學習的新穎想法和應用。我尤其期望看到用生成對抗神經網路和Hinton的capsule來解決更多問題。
“AGI”將會取代“AI”成為流行詞
Brandon Rohrer:Facebook的資料科學家。
2017年還有更多機器擊敗人類的成就。去年,AlphaGo擊敗了世界上最好的人類棋手,通過了智慧之路上的一個長期里程碑。今年,AlphaGo Zero通過從零開始的自我對弈學習,超越了它的上一版本。(deepmind.com/blog/alphago-zero-learning-scratch)它不僅擊敗了一個人類,還擊敗了全體人類的圍棋智慧。更實際的興趣,一台機器現在可以從交換機基準來轉錄電話交談。 (arxiv.org/abs/1708.06073)
然而,人工智慧的成就仍然狹窄和脆弱。改變圖像中的單個圖元可以擊敗最先進的分類器。 (arxiv.org/pdf/1710.08864.pdf)我預計2018年將帶來更多通用和強大的AI解決方案。幾乎每個主要的科技公司都已經有了一個人工智慧的工作。這些團體及其早期成果將成為頭條新聞。至少,“AGI”將會取代“AI”成為當年的流行詞。
機器學習系統“隱藏”技術欠下的債不容忽視
Elena Sharova是一家投資銀行的資料科學家。
要說2017年機器學習/人工智慧主要的發展,我看到越來越多的公司和個人將他們的資料和分析轉移到基於雲的解決方案,對資料安全的重要性的意識也急劇上升。
最大和最成功的技術公司已經競相成為資料存儲和分析平臺。對於資料科學家來說,這意味著他們所開發的工具箱和解決方案正被這種平臺所能提供的功能和能力所塑造。
2017年,全球發生了幾起大型資料安全性漏洞。這一點不容忽視。隨著越來越多的資料轉移到協力廠商存儲,對於適應新威脅的更強大安全性的需求將繼續增長。
至於2018年的關鍵趨勢,一個是確保遵守《全球資料保護條例》(GDPR),另一個則是應對機器學習系統“隱藏”技術欠下的債,這筆債正在越變越多,不容忽視。GDPR作為一項歐盟法規,具有全球影響力,所有資料科學家應該充分意識到它對自己工作的影響。根據Google的NIPS’16論文,資料依賴性代價高昂,而且隨著企業創建複雜的資料驅動模型,他們將不得不仔細考慮如何解決這一成本問題。
資料科學家正認識到無監督深度學習的價值
Tamara Sipes,Optum/UnitedHealth Group商業資料科學總監
2017年的主要發展和2018年的主要趨勢:
深度學習和集成建模方法在2017年繼續證明了它們相比其他機器學習工具的價值和優勢。特別是深度學習,在各個領域和行業得到了更加廣泛的應用。
至於2018年的發展趨勢,深度學習可能會被用來從原始輸入中產生新的特徵和新的概念,並且取代手動創建或設計新變數的需求。深度網路在檢測資料的特徵和結構方面是非常強大的,資料科學家正在認識到無監督深度學習可以為此發揮的價值。
有效異常檢測(Effective anomaly detection)可能也是近期的重點。在許多行業中,資料科學工作的重點是異常事件和其他類型的罕見事件:入侵偵測、財務欺詐檢測、詐騙、醫療保健中的濫用和錯誤以及設備故障等等。檢測所有這些罕見的事件將會使企業在領域中產生競爭優勢。跟上這些罕見事件檢測的演變節奏,將是一個有趣的問題和困難的挑戰。
深度學習框架變得更加用戶友好且易於訪問
Rachel Thomas,fast.ai創始人,USF助理教授。
雖然不像AlphaGo或者波士頓動力會後空翻的機器人那樣華麗,但讓我感到最興奮的2017年AI趨勢,是深度學習框架變得更加用戶友好且易於訪問。今年發佈的PyTorch,對任何瞭解Python的人都很友好(主要是由於動態計算和OOP設計)。不過,TensorFlow也正朝著這個方向發展,將Keras納入其核心代碼庫並宣佈動態圖運算。編碼人員使用深度學習的門檻正變得越來越低。我預計2018年,這種開發人員可用性增長的趨勢將持續下去。
第二個趨勢是媒體報導專制政府監督人工智慧的能力。2017年爆出了很多威脅隱私的新聞,但直到最近這才開始受到廣泛的關注。利用深度學習來識別戴著圍巾和帽子的示威者,或者通過圖片來識別某人的性取向,使得今年有更多的媒體開始關注AI的隱私風險。希望在2018年,我們可以繼續擴大討論馬斯克說的邪惡超級AI的話題,並解決通過編碼涉嫌監視、隱私和對性別歧視和種族主義偏見的問題。
“可解釋的AI”作為一門學科出現
Daniel Tunkelang是Twiggle的首席搜索傳播者,也是眾多知名組織的顧問。
2017年對於自動駕駛汽車和會話數字助理來說都是一個大年。這兩個都是深度學習將科幻小說變為事實的應用領域。
但是,今年機器學習和人工智慧最重要的發展,是對道德、問責和可解釋性的持續關注。馬斯克關於人工智慧觸發世界大戰的啟示性警告點燃了媒體,Oren Etzioni和Rodney Brooks等人則認真反駁。儘管如此,機器學習模型偏差的風險仍然存在,比如word2vec中的性別主義,演算法在刑事判決中的種族主義,以及對社交媒體資訊流的評分模型的故意操縱。這些問題都不是新出現的,但是機器學習的加速應用,特別是深度學習的大量使用,已經將這些問題推到了普通公眾面前。
2017年,我們終於看到“可解釋的AI”作為一門學科出現,彙集了學者、業界從業者和政策制定者的參加。2018年,照亮深度學習模型黑箱的壓力和動力都將進一步加大。
原文:https://www.kdnuggets.com/2017/12/machine-learning-ai-main-developments-2017-key-trends-2018.html