您的位置:首頁>科技>正文

阿裡人工智慧連奪兩項世界冠軍,自然語言處理就服它!

文/ 天下網商記者 汪佳婧

不久前的雲棲大會上, 馬雲宣佈成立“以科技, 創新世界”的阿裡巴巴達摩院。

最近, 阿裡巴巴在自然語言處理技術取得的兩項新成績:在全球頂級的知識庫構建測評KBP2017中, 斬獲英文實體發現測評全球冠軍;在中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis, 以下簡稱 CGED)三個level中全面奪得冠軍, 核心指標比其他參賽機構高出一倍。

CGED官網

比賽中使用的分詞、詞性標注和句法分析等基礎NLP工具都是由該團隊自主研發的AliNLP 平臺。 這個平臺支援阿裡大生態的每天多達600億次的自然語言處理需求。

這次參賽的是阿裡巴巴iDST自然語言處理首席科學家司羅以及iDST自然語言處理團隊。

司羅是全球權威機器智慧學者, 曾擔任美國普渡大學電腦系終身教授, 主持的20餘個專案得到美國政府、工業界資助, 先後獲得美國國家科學基金會成就獎、雅虎、穀歌研究獎等。

司羅

語法錯誤自動診斷大賽奪冠

中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis, 以下簡稱 CGED)是自然語言處理領域的權威賽事, 由IJCNLP聯辦, 今年已是第四屆。 阿裡巴巴iDST在三個level中全面奪得冠軍。 即便是最難的level, 核心指標F1(綜合考慮準確率與召回率)依舊達到了 0.2693, 比其他參賽機構高出一倍。

參賽機構比賽成績

“組辦方給我們一個題目, 然後由我們研發系統, 然後測評, 就是給我一個句子, 我挑出出錯的那個地方。 ” iDST自然語言處理團隊主力成員李林琳表示, 這次組辦方給的比賽的背景是:學習中文的外國人數不斷增加, 由於中文的博大精深, 外國友人在中文寫作中會出現各式錯誤。 主辦方挑選了一些外國友人寫的中文作文片段, 希望參賽者用人工智慧演算法自動識別裡面的語法語意錯誤。

賽題中包含的錯誤分為四種類型:多詞(Redundant)、缺詞(Missing)、錯詞(Selection)和詞序錯誤(Word Order)。 系統性能的評估也由易到難分為3個level:detection level(識別句子有沒有錯誤)、identification level(識別錯誤句子的具體錯誤類型)和position level(識別錯誤的位置和對應類型)

比賽要求診斷的四種錯誤類型

比如, “我要送給你一個慶祝禮物。 要是兩、三天晚了, 請別生氣”這句話, 在第3個Level, AI需要明確指出“兩、三天晚了”存在錯誤才能得分(正確用法應該是“晚了兩、三天”)。 此外, 團隊還結合了分詞、詞性、依存句法等特徵, 同時將language model等無監督的知識embedding到神經網路。 依靠RNN結構以及詞性、依存等特徵, 不光能識別短程的語法錯誤, 比如“一頭牛”好於“一隻牛”;也能識別比較長程的語法錯誤, 比如“雖然父母很辛苦, 而且對孩子照顧得很好”中“雖然”和“而且“不搭配。 此外, 他們針對比賽的3個不同level, 設計了不同的基於神經網路的snapshot emsembles方法。

基於深度學習的結果, 將被用於這些方面

據瞭解, 這次比賽中主力成員李林琳, 謝朋峻, 楊毅等通過在深度學習中引入無監督的語法知識,

同時結合了集成學習等方法取得了好成績。

李林琳說, 中文語法診斷的挑戰性在於, 中文語言知識豐富、語法多樣;人在判斷一句話是否有錯誤的時候, 會用到長期積累的知識體系(比如一句話是否通順、兩個詞是否可以搭配、語義上是否成立等)。 相比之下, 比賽提供的訓練資料非常有限, 僅通過訓練資料來識別錯誤是很困難的。

“這是一個基於深度學習的結果。 ”李林琳說, 深度學習有很多基礎模組, 比如做了中文詞彙切分的積累, 就是讓AI首先知道什麼是一個詞, 比如給AI一句話“我是中國人”, AI可以將這句話切分成“我”“是”“中國人”三個詞, 然後要對詞性做一個分析, 知道“中國人”是一個名詞, 和動詞“是”搭配就是“動詞+名詞”, 即動賓短語。如果是副詞+名次,就不對了。這哥基礎模組就是讓AI系統學習詞性的使用方法。

“還有基於更深度的句法分析,就是要檢查整個句子的語法輸入是否正確。”李林琳舉例說,如果整個句子裡面,有個主語是名詞,加動賓短語,就是名詞+動詞+賓語,這就是一個合理的句法結構,如果少了動詞,語法上就不正確 。

“整體來說,這次比賽是我們長期在AliNLP方面的積累、能力方面的綜合體現。” 李林琳說,比賽中使用的分詞、詞性標注和句法分析等基礎NLP工具都是由該團隊自主研發的AliNLP 平臺。

中文語法錯誤自動診斷會被運用在什麼地方?李林琳說,AliNLP 平臺支持阿裡大生態(新零售、金融、物流、娛樂、旅行等)的每天多達600億次的自然語言處理需求。比如現在大家使用的SNS軟體和對方語音聊天,在一些環境下,不方便聽,或轉換成文字,“這個轉換成文字的過程中,經常會有很多語法錯誤,中文語法錯誤自動診斷就能自動糾錯,使語音轉換的文字更加好理解。” 李林琳說,還有很多網路媒體的內容品質審核,即需要審核文字內容時,也可以運用到這項技術,

AI不僅能看懂英文,還能做到對文章上下文的理解

另外一項比賽,KBP是由NIST(National Institute of Standards and Technology,美國國家標準與技術研究院)指導、美國國防部協辦的賽事,主要任務為從自然書寫的非結構化文本中抽取實體,以及實體之間的關係。

這項測評要求AI演算法在“讀完”一篇英文文章後,構建一個物理世界的命名實體和實體之間關係的知識庫,如“克林頓和希拉蕊之間是夫妻關係”、“克林頓畢業于耶魯法學院”這樣一個個實體的關係。

司羅介紹,阿裡的演算法可以做到對文章上下文的理解。比如,文章出現了Apple,再出現Jobs,就可以辨別出這個Jobs指的是約伯斯,而不是工作。再比如,文章出現了Microsoft,那麼Apple就更有可能是蘋果公司,而不是一種水果。

“另外,我們構建了一個演算法去學習不同領域之間共同的部分,通過遷移學習提升我們學習的準確度。對於不同領域資料,我們取其精華,去其糟粕,進行智慧學習”,司羅說。

在這次測評中,iDST團隊採用經過改良的深度神經網路架構對文本進行理解。改良的架構有三個主要特點:首先該模型可以自動閱讀海量文章(如維琪百科)並從中汲取經驗;其次,該架構可以智慧選擇訓練資料集以保證訓練資料的準確性;最後,我們採用post regularization的辦法保證模型結果的一致性。

對於KBP2017的成績,司羅表示:“很榮幸能夠同全球的同行分享阿裡巴巴的研究成果,人工智慧在機器閱讀理解和知識庫構建上還處在起步階段,我們正在積極和同行業頂尖機構學習交流,推動行業發展。比如我們內部建設的資訊抽取平臺AliIE專案就在同斯坦福大學展開積極合作”。

阿裡巴巴正在將這樣的資訊抽取技術廣泛的應用到實際業務當中,並致力於讓更多的中小開發者從中收益。他們搭建的資訊抽取平臺AliIE擁有最頂尖的AI技術,並從一開始的架構設計就考慮到平臺的開放性和可擴展性。可以讓更多的開發者、研究員共同開發,並將成果回饋給這個社區。

即動賓短語。如果是副詞+名次,就不對了。這哥基礎模組就是讓AI系統學習詞性的使用方法。

“還有基於更深度的句法分析,就是要檢查整個句子的語法輸入是否正確。”李林琳舉例說,如果整個句子裡面,有個主語是名詞,加動賓短語,就是名詞+動詞+賓語,這就是一個合理的句法結構,如果少了動詞,語法上就不正確 。

“整體來說,這次比賽是我們長期在AliNLP方面的積累、能力方面的綜合體現。” 李林琳說,比賽中使用的分詞、詞性標注和句法分析等基礎NLP工具都是由該團隊自主研發的AliNLP 平臺。

中文語法錯誤自動診斷會被運用在什麼地方?李林琳說,AliNLP 平臺支持阿裡大生態(新零售、金融、物流、娛樂、旅行等)的每天多達600億次的自然語言處理需求。比如現在大家使用的SNS軟體和對方語音聊天,在一些環境下,不方便聽,或轉換成文字,“這個轉換成文字的過程中,經常會有很多語法錯誤,中文語法錯誤自動診斷就能自動糾錯,使語音轉換的文字更加好理解。” 李林琳說,還有很多網路媒體的內容品質審核,即需要審核文字內容時,也可以運用到這項技術,

AI不僅能看懂英文,還能做到對文章上下文的理解

另外一項比賽,KBP是由NIST(National Institute of Standards and Technology,美國國家標準與技術研究院)指導、美國國防部協辦的賽事,主要任務為從自然書寫的非結構化文本中抽取實體,以及實體之間的關係。

這項測評要求AI演算法在“讀完”一篇英文文章後,構建一個物理世界的命名實體和實體之間關係的知識庫,如“克林頓和希拉蕊之間是夫妻關係”、“克林頓畢業于耶魯法學院”這樣一個個實體的關係。

司羅介紹,阿裡的演算法可以做到對文章上下文的理解。比如,文章出現了Apple,再出現Jobs,就可以辨別出這個Jobs指的是約伯斯,而不是工作。再比如,文章出現了Microsoft,那麼Apple就更有可能是蘋果公司,而不是一種水果。

“另外,我們構建了一個演算法去學習不同領域之間共同的部分,通過遷移學習提升我們學習的準確度。對於不同領域資料,我們取其精華,去其糟粕,進行智慧學習”,司羅說。

在這次測評中,iDST團隊採用經過改良的深度神經網路架構對文本進行理解。改良的架構有三個主要特點:首先該模型可以自動閱讀海量文章(如維琪百科)並從中汲取經驗;其次,該架構可以智慧選擇訓練資料集以保證訓練資料的準確性;最後,我們採用post regularization的辦法保證模型結果的一致性。

對於KBP2017的成績,司羅表示:“很榮幸能夠同全球的同行分享阿裡巴巴的研究成果,人工智慧在機器閱讀理解和知識庫構建上還處在起步階段,我們正在積極和同行業頂尖機構學習交流,推動行業發展。比如我們內部建設的資訊抽取平臺AliIE專案就在同斯坦福大學展開積極合作”。

阿裡巴巴正在將這樣的資訊抽取技術廣泛的應用到實際業務當中,並致力於讓更多的中小開發者從中收益。他們搭建的資訊抽取平臺AliIE擁有最頂尖的AI技術,並從一開始的架構設計就考慮到平臺的開放性和可擴展性。可以讓更多的開發者、研究員共同開發,並將成果回饋給這個社區。

Next Article
喜欢就按个赞吧!!!
点击关闭提示