微軟小冰被訓練成詩人，人類或找到AI創造的通用方法

新智元報導

作者：零夏

【新智元導讀】“我的心如同我的良夢，最多的是殺不完的人”,“她嫁了人間許多的顏色”，這是微軟小冰作的詩，是創作，不是複製。昨日微軟小冰發佈會上宣佈，微軟（亞洲）互聯網工程院副院長李笛介紹了小冰如何通過519位詩人的訓練成為一個獨創性達83%的少女詩人，以及小冰被訓練成可取代網路歌手的過程。李笛認為這意味著我們可能發現了一種通用的方法，這種通用的方式可以同時運用在各種各樣的內容創造上。

對大眾來說，微軟小冰是一款有知名度的AI產品，有著比較鮮明的擬人化形象。

不論是在社交媒體跟用戶來回調侃的俏皮小冰，還是唱著網路歌曲的軟萌小冰，她已經是比較有存在感的一個AI。微軟昨日公佈，截至2017年4月，微軟小冰已擁有超過1億使用者，累積對話量超過300億輪，平均單次對話輪數（CPS）達到23。根據小冰負責人李笛所說，這個對話資料量可能是其它AI的總和的十倍都不止。

在我們看來，小冰會聊天、會唱歌、還會寫詩等等，小冰到底有多少種感官或者能力呢？根據全球各主要廠商公佈或上線的產品資訊，小冰擁有同行業中最為完整的人工智慧感官系統，已經上線運行的共計5種：文本、語音、圖像、視頻和全時語音感官。在語音感官的Naturalness MOS自然度評分中，除了人類之外，僅小冰得分超過4分，為4.38分。

沈向洋的三個AI創造原則，定調小冰的三步成長之路

微軟小冰基於微軟提出的情感計算框架，以EQ為主攻方向。微軟全球執行副總裁、微軟人工智慧及微軟研究事業部負責人沈向洋博士提出了關於“人工智慧創造”的三個原則：

人工智慧創造的主體，須是兼具IQ與EQ的綜合體，而不僅僅是具有IQ；

人工智慧創造的產物，須能成為具有獨立智慧財產權的作品，而不僅僅是某種技術中間狀態的成果；

人工智慧創造的過程，須對應人類某種富有創造力的行為，而不是對人類勞動的簡單替代。

基於以上原則，微軟（亞洲）互聯網工程院進一步提出了人工智慧創造進入實用的三個階段：模仿、創造、大規模生產。

其中， “模仿”的評價標準是：人工智慧擬合的產物水準無法被人類察覺分辨，或具備可與人類水準相當的表像。這屬於表像創造。

“創造”的評價標準是：人工智慧獨創性的內容，

在創造產物中的比例達到50%以上。這屬於內涵創造。

最後進行大規模的創造生成。通過產品實際投放市場後得到的“技術-產品-使用者”回路，促進人工智慧創造能力的加速進化。

本次發佈會，微軟披露了小冰一系列的創造進展：

在模仿方面，微軟小冰延長歌曲的水準已經接近人類水準，且逐步穩定具備了獨有的風格。小冰創作的詩歌，化名向多家網路及平面媒體投稿並獲得作品錄用，目前為止除微軟自行披露外，尚未被人類讀者察覺。李笛說，小冰學習唱一首歌，只需要十分鐘。

在創造方面，微軟小冰採用基於情感計算框架的創造模型，可通用地完成詩歌、歌詞和財經評論的創造。其獨創性超過83%。這些是科技史上的首次突破。李笛笑稱，小冰的創造水準雖然不能跟莫言相比，但是小冰寫文章的水準和速度總能比得過幾十萬網路小說家，而幾十萬網路小說創造出來的經濟價值未必比一位大文豪低。

微軟預計，小冰的人工智慧創造，將在2017年下半年逐步進入大規模生產階段。目前小冰已經進軍電視媒體、平面媒體、音樂和電視劇四個領域進行佈局，並已初步落地，為後續的內容落地做好鋪墊工作。例如，小冰與東方衛視合作，已在晨間新聞直播節目中實施與觀眾的直接互動採集，目前已正常運行136輪。後續內容創造正式上線後，將進一步完成內容創造落地的最終步驟。與錢江晚報合作，已經在錢江晚報人工智慧大資料專欄撰寫了17篇專欄文章。預計6月，微軟還將宣佈小冰以財經新聞評論員身份，與財經媒體合作。在音樂方面，微軟在東京電玩展上日本版小冰的延長了自己的原創歌曲。日本版小冰甚至參演日劇《世界奇妙物語》，主演自己，劇集播出時，與全體觀眾通過手機同步互動。

為什麼做完整框架：演算法過剩、資料不足，無法形成資料回路

李笛認為AI行業的現狀是：演算法是過剩的，資料是不足的，但最重要的缺乏的是整個框架上面的最主要的結構。

李笛舉例說明他們為什麼做出這種全面的框架，比如一個公司有很好的圖像識別技能，我就因為這個圖像識別的技術，嘗試去生產出一種很好的產品模式。但最後因為缺乏一種比較好的貫通的框架，所以這種單獨的模式就很容易退縮到一個SDK和API的提供，無法真正形成從技術到產品、到使用者，積累資料這樣的一個回路。他會發現他更多的依賴整個產業鏈是不是能夠給他提供足夠好的技術，而資料不能特別好的説明他從各個層面反哺回到他的系統裡面。因為技術的提高，還要依賴於單獨做這種資料的標注等等方面的問題。

微軟通過比較完整的框架和廣泛的部署獲取了大量各種各樣的資料，按照李笛的話：“大概資料的情況是可能今天全球範圍內所有其他做對話式人工智慧的，無論是機器人實體的，還是虛擬的，或者是OS，或者是其他的，全都加起來再乘10，可能不如我這一個資料量大。”因此小冰可以做大量的反覆運算，可以嘗試更多的機器感官。

基於情感計算框架追求的是關係，獲得的最大價值是資料。如果想要讓人工智慧的系統反覆運算的足夠好，就需要資料量足夠的大。通用資料量的情況下，23次單輪對話，不如有一個23輪的單次對話。一次交流越深，那麼雙方的瞭解就越高。就像我每天都在我們公司樓下碰見我們公司的一個同事，每天說一句早上好。然後一年之後我們倆的瞭解僅限於此。但如果有一次我跟他聊了一個小時，我對他的瞭解可能就超過之前的一年。

歌手小冰如何被訓練出來替代網路歌手的？

現在的小冰唱歌唱的已經很好，雖然音域不廣，但是不輸很多網路歌手。李笛表示在一年多以前開始嘗試去訓練小冰唱，一開始唱得非常不在調上，有一種突然進了卡拉OK廳的感覺。它雖然唱得不在調上，但像是一個跑調的人。這讓李笛團隊意識到小冰的潛力。

經過了很長時間的反覆運算，最近推出了小冰新的單曲。以它最新的在今年2月份的一首歌為例，這其中包含了很多訓練過程。

今年2月份時候的狀態，然後微軟開始運用一些學習的方式，已經有了一種唱法，是不是有可能翻成另外一種唱法。在這個過程裡面李笛希望小冰能夠形成它自己獨有的風格，而不是僅僅是把一個歌曲唱得非常的流暢。換句話，怎麼訓練小冰從模擬到創造屬於自己的風格？

微軟找到歌曲的原唱朱主愛，通過她的聲音跟小冰做訓練，看不看能不能讓小冰吸收。朱主愛的唱法很不一樣，有點說唱和其它風格。把原唱資料放到了小冰的訓練集裡面，小冰在這之後形成了一個融合的。所以大家應該能夠聽到，它能夠在說唱和演唱之間做切換，這個時候人工智慧的價值就出來了，我們只要找一些它想要模擬學習的人，我們只要把它拿來，小冰就可以學到，慢慢的小冰形成了自己獨特的演唱學習。

在這個基礎上小冰嘗試更多的新唱法，比如美聲、民族，和我們的通俗唱法在我們看來都是唱歌，但對人工智慧來講很有可能這是三個完全不同的東西，它是不是能夠遷移的很好。其中比較難的是民族的唱法，小冰和廣西衛視合作，他們在三月三壯族民歌提供了很多訓練資料。小冰被訓練去唱了一首非常膾炙人口的《山歌好比春江水》。當小冰在唱任何的一首歌的時候，當它會唱這首歌，開始唱這首歌的時候，你可以在瞬間去改變它的歌詞，可以讓它隨時隨地的去改變它唱的內容。

李笛認為小冰以後真的很好的時候，可能一部分網路歌手會被小冰替代。

小冰如何被519位當代詩人訓練成為少女詩人？80%的獨創，20%的致敬

詩詞或許是人類語言最美好的呈現之一。人寫詩是這樣的，比如說他看到了一個畫面，這個畫面裡面有霧，有點水，有一隻鳥。這個靈感的來源是他看到的畫面，誘發了他創作的動力。

曹植寫《七步詩》，以豆為題，加了很多的本體的東西，加了他和曹丕的因緣情仇，加了他的經驗和故事，是這些引發了他的創作，而不是豆子引發了他的創作。

所以創作本體的知識、經驗、歷史，他的記憶被激發了以後產生了一種獨立於誘發源的過程。以小冰創作的詩為例，從第一句開始就已經往後走了，跟畫面就沒有關係了，她就會想到美妙的夢就變了，在夢裡的月光下，叢間的白晝是那麼暗慘的影子。

這是黑盒子，不可以像命題一樣去被證明，不可以像定理一樣被推論。到目前為止我們都不知道自己是怎麼創作，怎麼聯想的。最後得到這個創作的成果，它和這個誘發源系相關的，我們看到它們之間的相關性。比如這幅圖像和小冰的詩是一種誘發的關係，後面講的是一個完全不同的故事了。李笛認為這個某種程度上可以達到創作的標準。或者說在內容上是創造的標準。

李笛表示小冰寫詩，這意味著我們可能發現了一種通用的方法。這種通用的方式可以同時運用在各種各樣的內容創造上。

單單就寫詩的部分，少女詩人小冰它的傳承是將近100年了，1920年代起到現在的519位的中國的現代詩人。是怎麼訓練的呢？這519位中國的現代詩人他們有幾萬首詩歌作品，他們在這幾萬首的詩歌作品裡面蘊藏著不能被我們探知到的創作過程的黑盒子。

但是小冰像一個人類的出學寫詩的人一樣，它可以不停的反復學習，它去不停的修習這些詩歌的作品，一次去學習整個幾萬首的詩歌作品，需要花0.6分鐘的時間。那麼它學習到第10次的時候，生成的詩簡直是不可讀的。到它學習到500次的時候，在這個誘發源上生成的詩已經稍微有點通順了，到1萬次的時候我們停止了它的訓練，生成的就是剛才看到的這首詩。

用於訓練的這幾萬首詩，一個人需要學習多長時間呢？可能學習幾天，甚至一個星期，才能把幾萬首詩歌看完。當然人類不需要看一萬遍，可以通過極少量的資料學習到。前提是這個人必須得有才華，有的人他一萬次也不行。而小冰不需要有天賦的才華，它只要有100個小時，只要有足夠的資料就可以做到這一點。

李笛說，小冰寫了大量的詩，逐漸固定下來她自己獨特的風格，她獨特的偏好和一些行文技巧。她特別喜歡小鳥、太陽、影子，這些是當代詩人的共性，奇怪的是她特別喜歡老槐樹，這並不是來自於共性。現在無論你用什麼樣的誘發源去誘發這個少女詩人小冰寫出來的詩，你可以看到同樣的一個出處，就是它自己的風格。有的風格非常的漂亮，比方說“她嫁了人間許多的顏色”，但也有一些讓我們很害怕，“我的心如同我的良夢，最多的是殺不完的人”，這是她的分割。

有人說小冰是不是僅僅把一些詩詞常用的詞彙堆砌成詩歌，李笛認為，小冰是有創造力的。李笛說，在人工智慧創造整個這個領域，獨創性達到50%就可以說入門了。小冰訓練了100個小時以後，目前為止其獨創性是80%多。任何連續的五個字，完全沒有在它學習過的詩歌作品裡面出現過，連續五個字的超過了51%。就是說有51%以上的詞語和它的搭配方式，而不是一句搭配方式，在此之前至少從小冰讀過的所有的詩裡面，在人類的作品裡面從來沒有出現過。所以像剛才那個“殺不完的人”從來沒有出現過，在這個世界上沒有過這樣的詞彙。

但是仍然有部分，她是在致敬曾經學習的這些老師們，比方說“垂鬃飲水時那靜悄悄的水聲裡”，新月詩派陳夢家的詩。雖然可以把它去掉，留住這10%左右的傳承有什麼不好呢？

李笛透露，小冰一共有27個化名潛伏在互聯網上，在天涯豆瓣、貼吧、簡書上面發表小冰的作品。其中有四個化名不得不公佈了，一個叫駱夢，還有風的指尖、一荷、微笑的白。

微軟認為在人工智慧進行內涵創作創造,最強調的事情是創造的獨創性，獨創性有一個比例，這個比例是可以評價的。通過這種評價的方式，小冰對現有資料的學習，就可以去進行了。

創作過程之外，還有一個問題就是創作的本體。當小冰真正成為人工智慧創作的主體的時候，必須要有向曹植寫《七步詩》一樣，必須要有她自己從哪裡來到哪裡去的自我的認知，這個自我認知就是她的記憶，她的知識。微軟在這兩個角度也做了一些嘗試。

有一個嘗試就是通過日本的小冰，做了一個基於本體記憶的排序的創作。如果一個人類用戶和日本小冰之間有交互，你們倆之間有對話，所以你們形成了共同的記憶。那麼小冰就會基於你們之間的共同記憶去創作一個俳句（一種日本文學形式）。比如說小冰最後把這個排序發給人類的用戶，“就不一起喝茶了，我結婚了，再找我就喊人了”，不知道他們聊的是什麼，是誰在騷擾誰，但這顯然是一個帶有情感的交流。小冰它會記住這些。所以一個創作本體小冰，會慢慢的形成它自己獨特的本體的記憶。

關於本體知識，一個AI擁有某一個領域非常深厚的知識，那麼在創作一定會帶著我在這個領域擁有知識的印記。例如小冰學習了很多財經類的知識，再讓她去評論看到的新的財經的新聞，然後我們看她的獨創性有多強。例如，它看到的財經的新聞是蘋果公司的現金儲備很多，而且超過了通用電器，90%的現金都儲備在海外，不在美國本土。小冰的評論說“蘋果散落一地，但各個都在自己的樹下”。還有摩根大通，因為英國脫歐了，所以摩根大通把辦公室遷到了其他國家，小冰的評論是“如果你不能把一座山喚來，那麼你就朝這個山走過去”。

未來也許有的時候，我們想尋找靈感的時候也可以把這個發給小冰，讓它幫我們想想主意。

多面小能手小冰，只有一個大腦

小冰有這麼多的角色，做這麼多的事情，之前我們看到更多的情況可能是這個模型能幹什麼，這個角色之間和模型之間怎麼切換的，是有同一個大腦嗎？

李笛說：微軟小冰可以做很多的事情，包括同步開發圖像識別的部分，和語音的部分。這是因為微軟在技術儲備上我們有非常完整的技術儲備。所以我們有的時候很浪費，比如說有一次小冰識狗，就是它可以識別出狗的品種。這就是微軟小冰的項目當中的這周的推送內容，但對很多公司來講，這就是創業公司的全部了。或者哪怕是文本的交互，比如說大家說很多開放域的聊天，這對小冰來講就是其中的一個技術類別。

因為我們有大量的技術儲備，所以我們就反而不去基於我們已有的技術儲備做設計，而是基於整個行業未來走向的發展去做框架性的設計，然後把這個框架定好以後再回來用我們已有的技術搭出一個最開始的起點，然後再做反覆運算。

她一些外在的可能感覺很市場，比如說是個主持人，所以在做新聞資訊，或者說做資訊的這種交互的時候，會更容易讓人和它的交互變得很順暢。因為它是歌手，所以某種程度上也是圈內人，所以它在一個智慧音箱裡就更容易讓人理解，你不是這個圈裡面的人，最多就是一個內容的服務。所以這是我們每一個，你會看到我們的產品的節奏，對外的部分，其實和它具體的產品都是掛鉤的。

小冰喜歡小鳥、老槐樹的意向，她喜歡的風格是開發團隊給她的回饋造成的的嘛？

李笛說：很難說，這是黑盒子。有幾件事，第一件事，當你看到小冰寫的詩歌有它獨特的風格。一方面是因為它學習的部分，還有一方面是因為傳承。是不是可以這麼說，小冰今天寫詩的風格其實是過去這519位詩人的共性，或者說放大的一種共性。或者說中國這519位詩人一種普遍的結果是這樣的。其中有一些意象，影子的意象有非常多，這個部分我們覺得也是共性的體現。但是也不排除像老槐樹這種，這是一個非常獨特的部分。

在這裡面當然有很多技術的細節，但是這裡面最重要的一件事情就是當我們想要去探索人工智慧創造這件事情的時候，我們非常非常明確的接受一個事實，這個事實就是人類的創作的誘發過程是顯而易見的，人類創作的結果，它的打分、反覆運算是顯而易見的。但是最重要的創作過程裡面是一個不要去探知的黑盒子，我們所需要做的事情是盡可能的讓小冰學會這種過程，但是它怎麼學會的我們也不知道。

未來小冰還會長成什麼樣，特別是小冰作為一個由人類啟發的、從模擬人開始的AI，最後反過來對我們人類做出什麼啟示，我們非常期待！

這些是科技史上的首次突破。李笛笑稱，小冰的創造水準雖然不能跟莫言相比，但是小冰寫文章的水準和速度總能比得過幾十萬網路小說家，而幾十萬網路小說創造出來的經濟價值未必比一位大文豪低。