谷歌讓機器學會畫簡筆劃,媽媽再也不用擔心我手殘了
近日,谷歌開發了一款名為“AutoDraw”的應用,這款應用受到網友的追捧:它拯救了一些不會畫畫的人,還讓低齡塗鴉畫變成美術作品。
從上面的這個動圖中可以看到,這款程式能從簡單的幾筆劃像中識別特徵,並給出一個更完美的簡筆劃。
谷歌的研究人員正訓練自己的人工智慧程式,希望它能像人類一樣繪畫和概括抽象概念。4月11日,穀歌大腦專案研究員David Ha和Douglas Eck發表了一篇名為《繪製簡筆劃的神經表徵》(A Neural Representation of Sketch Drawings)的論文。
在這篇論文中,谷歌利用神經網路(RNN)訓練了一個實驗性的應用程式,可以協助藝術家創作以及幫助老師教學生繪畫。那麼這個程式究竟是如何做到的?
首先,大家需要瞭解什麼是神經網路模型。在人工智慧領域,神經網路最重要的用途是分類和識別。舉例說明,把一張貓的照片交給電腦讓其識別,
目前,科學家們利用神經網路,在訓練圖像識別和圖像生成上已經有大量的實踐經驗。例如,谷歌的研究人員將圖片輸入搭建好的神經網路模型,讓它識別該圖片中的一個特徵,而後修改圖片以強調這項特徵。接著,修改後的圖像被回饋到神經網路,
在新的這篇論文中,
研究員以貓為例做了解釋。當開發者們將一幅繪有三隻眼的貓圖片輸入時,模型會生成一隻只有兩隻眼睛的貓作為輸出,這表明這一模型已經學習到貓類一般只有兩隻眼睛(如下圖)。同時,為了證明這一模型不僅簡單地從大量的貓類圖片中記住了最接近正常外表的貓,開發者還嘗試以完全不同於貓類的牙刷圖片作為輸入。最後,一個像貓、長有鬍鬚、模仿了牙刷特徵和朝向的圖就生成了。
這表明網路已經學會將輸入圖片編碼為一組抽象的貓類概念,嵌入到特徵向量中,再基於該特徵向量重建一個全新的圖片。
“這個程式的關鍵在於研究了人們在畫畫時做了什麼。比如朝哪個方向移動,什麼時候起筆,什麼時候停止繪畫等。” David Ha說。他還強調,這個程式並不是在分析圖片,而是進行了繪畫創作。
開發者還嘗試以完全不同於貓類的牙刷圖片作為輸入。最後,一個像貓、長有鬍鬚、模仿了牙刷特徵和朝向的圖就生成了。這表明網路已經學會將輸入圖片編碼為一組抽象的貓類概念,嵌入到特徵向量中,再基於該特徵向量重建一個全新的圖片。
“這個程式的關鍵在於研究了人們在畫畫時做了什麼。比如朝哪個方向移動,什麼時候起筆,什麼時候停止繪畫等。” David Ha說。他還強調,這個程式並不是在分析圖片,而是進行了繪畫創作。