阿裡人工智慧連奪兩項世界冠軍，自然語言處理就服它！

文/ 天下網商記者汪佳婧

不久前的雲棲大會上，馬雲宣佈成立“以科技，創新世界”的阿裡巴巴達摩院。

最近，阿裡巴巴在自然語言處理技術取得的兩項新成績：在全球頂級的知識庫構建測評KBP2017中，斬獲英文實體發現測評全球冠軍；在中文語法錯誤自動診斷大賽（Chinese Grammatical Error Diagnosis，以下簡稱 CGED）三個level中全面奪得冠軍，核心指標比其他參賽機構高出一倍。

CGED官網

比賽中使用的分詞、詞性標注和句法分析等基礎NLP工具都是由該團隊自主研發的AliNLP 平臺。這個平臺支援阿裡大生態的每天多達600億次的自然語言處理需求。

這次參賽的是阿裡巴巴iDST自然語言處理首席科學家司羅以及iDST自然語言處理團隊。

司羅是全球權威機器智慧學者，曾擔任美國普渡大學電腦系終身教授，主持的20餘個專案得到美國政府、工業界資助，先後獲得美國國家科學基金會成就獎、雅虎、穀歌研究獎等。

司羅

語法錯誤自動診斷大賽奪冠

中文語法錯誤自動診斷大賽（Chinese Grammatical Error Diagnosis，以下簡稱 CGED）是自然語言處理領域的權威賽事，由IJCNLP聯辦，今年已是第四屆。阿裡巴巴iDST在三個level中全面奪得冠軍。即便是最難的level，核心指標F1（綜合考慮準確率與召回率）依舊達到了 0.2693，比其他參賽機構高出一倍。

參賽機構比賽成績

“組辦方給我們一個題目，然後由我們研發系統，然後測評，就是給我一個句子，我挑出出錯的那個地方。 ” iDST自然語言處理團隊主力成員李林琳表示，這次組辦方給的比賽的背景是：學習中文的外國人數不斷增加，由於中文的博大精深，外國友人在中文寫作中會出現各式錯誤。主辦方挑選了一些外國友人寫的中文作文片段，希望參賽者用人工智慧演算法自動識別裡面的語法語意錯誤。

賽題中包含的錯誤分為四種類型：多詞（Redundant）、缺詞（Missing）、錯詞（Selection）和詞序錯誤（Word Order）。系統性能的評估也由易到難分為3個level：detection level(識別句子有沒有錯誤)、identification level（識別錯誤句子的具體錯誤類型）和position level（識別錯誤的位置和對應類型）

比賽要求診斷的四種錯誤類型

比如， “我要送給你一個慶祝禮物。要是兩、三天晚了，請別生氣”這句話，在第3個Level， AI需要明確指出“兩、三天晚了”存在錯誤才能得分（正確用法應該是“晚了兩、三天”）。此外，團隊還結合了分詞、詞性、依存句法等特徵，同時將language model等無監督的知識embedding到神經網路。依靠RNN結構以及詞性、依存等特徵，不光能識別短程的語法錯誤，比如“一頭牛”好於“一隻牛”；也能識別比較長程的語法錯誤，比如“雖然父母很辛苦，而且對孩子照顧得很好”中“雖然”和“而且“不搭配。此外，他們針對比賽的3個不同level，設計了不同的基於神經網路的snapshot emsembles方法。

基於深度學習的結果，將被用於這些方面

據瞭解，這次比賽中主力成員李林琳，謝朋峻，楊毅等通過在深度學習中引入無監督的語法知識，

同時結合了集成學習等方法取得了好成績。

李林琳說，中文語法診斷的挑戰性在於，中文語言知識豐富、語法多樣；人在判斷一句話是否有錯誤的時候，會用到長期積累的知識體系（比如一句話是否通順、兩個詞是否可以搭配、語義上是否成立等）。相比之下，比賽提供的訓練資料非常有限，僅通過訓練資料來識別錯誤是很困難的。

“這是一個基於深度學習的結果。 ”李林琳說，深度學習有很多基礎模組，比如做了中文詞彙切分的積累，就是讓AI首先知道什麼是一個詞，比如給AI一句話“我是中國人”， AI可以將這句話切分成“我”“是”“中國人”三個詞，然後要對詞性做一個分析，知道“中國人”是一個名詞，和動詞“是”搭配就是“動詞+名詞”，即動賓短語。如果是副詞+名次，就不對了。這哥基礎模組就是讓AI系統學習詞性的使用方法。

“還有基於更深度的句法分析，就是要檢查整個句子的語法輸入是否正確。”李林琳舉例說，如果整個句子裡面，有個主語是名詞，加動賓短語，就是名詞+動詞+賓語，這就是一個合理的句法結構，如果少了動詞，語法上就不正確。

“整體來說，這次比賽是我們長期在AliNLP方面的積累、能力方面的綜合體現。” 李林琳說，比賽中使用的分詞、詞性標注和句法分析等基礎NLP工具都是由該團隊自主研發的AliNLP 平臺。

中文語法錯誤自動診斷會被運用在什麼地方？李林琳說，AliNLP 平臺支持阿裡大生態（新零售、金融、物流、娛樂、旅行等）的每天多達600億次的自然語言處理需求。比如現在大家使用的SNS軟體和對方語音聊天，在一些環境下，不方便聽，或轉換成文字，“這個轉換成文字的過程中，經常會有很多語法錯誤，中文語法錯誤自動診斷就能自動糾錯，使語音轉換的文字更加好理解。” 李林琳說，還有很多網路媒體的內容品質審核，即需要審核文字內容時，也可以運用到這項技術，

AI不僅能看懂英文，還能做到對文章上下文的理解

另外一項比賽，KBP是由NIST（National Institute of Standards and Technology，美國國家標準與技術研究院）指導、美國國防部協辦的賽事，主要任務為從自然書寫的非結構化文本中抽取實體，以及實體之間的關係。

這項測評要求AI演算法在“讀完”一篇英文文章後，構建一個物理世界的命名實體和實體之間關係的知識庫，如“克林頓和希拉蕊之間是夫妻關係”、“克林頓畢業于耶魯法學院”這樣一個個實體的關係。

司羅介紹，阿裡的演算法可以做到對文章上下文的理解。比如，文章出現了Apple，再出現Jobs，就可以辨別出這個Jobs指的是約伯斯，而不是工作。再比如，文章出現了Microsoft，那麼Apple就更有可能是蘋果公司，而不是一種水果。

“另外，我們構建了一個演算法去學習不同領域之間共同的部分，通過遷移學習提升我們學習的準確度。對於不同領域資料，我們取其精華，去其糟粕，進行智慧學習”，司羅說。

在這次測評中，iDST團隊採用經過改良的深度神經網路架構對文本進行理解。改良的架構有三個主要特點：首先該模型可以自動閱讀海量文章（如維琪百科）並從中汲取經驗；其次，該架構可以智慧選擇訓練資料集以保證訓練資料的準確性；最後，我們採用post regularization的辦法保證模型結果的一致性。

對於KBP2017的成績，司羅表示：“很榮幸能夠同全球的同行分享阿裡巴巴的研究成果，人工智慧在機器閱讀理解和知識庫構建上還處在起步階段，我們正在積極和同行業頂尖機構學習交流，推動行業發展。比如我們內部建設的資訊抽取平臺AliIE專案就在同斯坦福大學展開積極合作”。

阿裡巴巴正在將這樣的資訊抽取技術廣泛的應用到實際業務當中，並致力於讓更多的中小開發者從中收益。他們搭建的資訊抽取平臺AliIE擁有最頂尖的AI技術，並從一開始的架構設計就考慮到平臺的開放性和可擴展性。可以讓更多的開發者、研究員共同開發，並將成果回饋給這個社區。

即動賓短語。如果是副詞+名次，就不對了。這哥基礎模組就是讓AI系統學習詞性的使用方法。

AI不僅能看懂英文，還能做到對文章上下文的理解