您的位置:首頁>科技>正文

畫師們害怕了沒?AI竟然只靠描述就能自己繪畫啦!

關於人工智慧的圖像識別應用, 相信小夥伴兒已經接觸了許多, 比如面部識別、情緒識別和視覺搜索等。 作為科技業巨頭之一的微軟, 在該領域同樣有過許多嘗試:在牛津項目(Project Oxford)中, AI能識別圖片中人物的情緒;在CaptionBot應用中, AI不僅能識別使用者上傳的圖片, 還能給出一段有趣的描述。

如今, 微軟在AI圖片研究方面更近一步, 帶來了AI繪圖功能:你只需給出說明(比如文字描述), AI就可以自動生成圖片。 據悉, 與之前考慮過的頂級技術相比, drawing bot帶來了三重改進。 比如上圖就是AI根據“一隻擁有黃色身軀、黑色翅膀和短喙的小鳥(a bird with a yellow body, black wings and a short beak)”這一說明, 繪製出來的小鳥。

AI繪圖背後的技術原理

據介紹, drawing bot基於生成對抗網路(GANs)技術, 而且微軟研究人員更進一步, 使用被稱為AttnGAN(Attentional Generative Adversarial Network)的技術, 能將輸入的句子分成獨立的單詞, 並與圖像的特定區域匹配起來。 研究人員提到AttnGAN時表示, 這是用算術替代了專注這一概念,

“專注是人類的概念;我們通過數學讓專注可計算了!”

據悉, 研究人員以數學演算法, 為AI提供了注意力模型(The attention model)和DAMSM模型(Deep Attentional Multimodal Similarity Model)。 其中, 注意力模型擁有文字特徵和圖片特徵兩種輸入資料(input)。 DAMSM則包括了text encoder、image encoder和基於attention model的attention-driven image-text matching score模組, 能學習映射圖像和單詞分區兩個神經網路的公共語義空間,

以及以單詞層級測量圖像文本相似度, 從而計算包括細密紋理的圖像生成。

想瞭解更多技術細節, 請查看研究人員發佈的論文:https://arxiv.org/abs/1711.10485v1

AI繪圖未來大有可為

據悉, 該研究團隊最初借助名為CaptionBot的AI系統來深入研究電腦視覺和自然語言處理問題(該系統可以自動為照片添加字幕);此後, 研究團隊又創建了名為SeeingAI的AI系統, 它的作用是説明盲人群體認識世界(通過識別圖像給出地點、物體屬性等回答);然後, 研究團隊想通過文字來生成圖像, “這意味著你需要AI的機器學習演算法能想像圖片中丟失的部分。 ”

有趣的是, 得益于研究人員提供的訓練資料, drawing bot也擁有了一點基本常識和想像力, 能填補圖像的一些細節。 以小鳥為例, 即使文本中並沒提到樹枝, drawing bot也經常會畫出一隻站在樹枝上的鳥, 那是因為最初給它輸入的圖像大部分都是這樣的。

微軟研究員強調, 該AI系統不是根據描述去尋找網路中對應的圖片, 而是完全靠自己創作出來的, “AI畫出來的鳥可能並不存在於真實世界——這些鳥只不過是電腦想像力的結果而已!”據悉,

該技術未來可扮演畫家設計師等的草圖助理, 或是用於聲控照片細化工具。

隨著技術的進步, 這項技術甚至還能在生成基於劇本的動畫電影, 為動畫電影製作人提供助力。 當然, 目前該技術還存在瑕疵, 不過微軟已經邁出了非常重要的一步。 如果未來真的有根據文本描述繪畫的AI投入實用, 你會有什麼感想呢?

Next Article
喜欢就按个赞吧!!!
点击关闭提示