文/孫茜茜
2016年3月23日, 一場人機大戰在阿裡雲的年會上上演了。
在阿裡雲總裁胡曉明演講環節, 來自阿裡iDST團隊的“即時語音辨識系統”對戰常伴馬雲身旁的金牌速記師薑毅, 分別給出演講的文本內容, 同時投屏, 現場PK正確率。
姜毅在阿裡雲的同學們眼中是這樣一種存在:“神一般的速錄師, 擁有超人的短時記憶功能, 超級的打字速度和驚人的正確率”。
姜毅曾在世界速記比賽中獲得亞軍, 他能夠在演講者每分鐘300字的語速下, 邊聽邊打字, “話音落、字體現”。
阿裡雲的同學算了一筆賬, 每秒鐘除標點符號、回車、刪除、注釋外,
雙方PK了7分50秒, “即時語音辨識系統”最終以0.67%險勝。
iDST語音技術總監鄢志傑說, 速記員更加信達雅, 但人類很難持續保持更長時間的高強度腦力勞動。 機器雖然犯一些語義理解上的錯誤, 但是可以一字不落地記錄下講話內容。 並且, 在電路通暢的情況下, 機器可以工作24小時。
iDST語音技術總監鄢志傑
ET入住法院, 當起了書記員和法官的“小助手”對法庭中的書記員來說, 他們是否有速記跟不上法庭節奏的痛點?“即時語音辨識系統”是否能夠提供説明?不久後, 這項技術被引入了浙江高院。
據《人民法院報》報導, 2016年5月, 浙江高院率先開發啟用智慧語音辨識系統, 使用人只要點擊事先安裝在電腦桌面上的軟體即實現“一鍵開啟”。 軟體預先設置角色, 語音文字轉換時自動注明發言人角色, 自動區分庭審發言物件及發言內容。
2016年6月7日上午, 西湖區人民法院作為浙江高院智慧語音辨識系統試點,
西湖區人民法院庭審現場
早在2015年11月, 浙江省高院與阿裡就簽署了戰略合作框架協議, 雙方共同開展雲計算和大資料相關領域的技術與應用研究,
據悉, 目前阿裡雲人工智慧ET已經為全國近300家法院、超過6000個法庭提供庭審語音轉寫服務。
2017年12月6日, 福建省高級人民法院正式引入ET。 以智慧語音為切入點, 將語音辨識與大資料分析結合, 挖掘司法大資料的價值, 推進審判體系和審判能力現代化。
福建省高級人民法院與阿裡巴巴集團戰略合作簽約儀式
據悉, 除了對庭審過程進行“原汁原味”的記錄外, ET將擔任法官“小助手”。 結合語音文本、判決文書、歷史案例庫等相關文本資料, 通過大資料採擷、文本挖掘、機器學習建模技術等, 提供相似案例的分析與檢索、案情建模、案由提取、爭議點挖掘、智能預判等, 協助法官判案, 最大限度消除或減少“同案不同判”的現象發生。
數千家智慧法庭是一夕之間冒出來的嗎?數千家智慧法庭是一夕之間冒出來的嗎?鄢志傑說, 不是的, 這離不開技術的成熟度和積累。
單就語音技術而言,阿裡從2014年起就非常嚴肅地在做投入了,不管是人才、資料還是計算上的投入。“技術、演算法,最核心的是離不開操作的人,要不斷去優化、再定義它。”
鄢志傑表示,阿裡雲不是把市場上別人的解決方案集成到阿裡雲的系統中,而是從麥克風的源頭開始做技術。因為“只有這樣,才能做到跟語音辨識系統打通、實現聯合優化;只有這樣,才能確保識別的精准度。”
“我們不需要從麥克風採購做起,我們做所有的採購系統的集成。”
使用者在使用產品的過程中,技術問題會一個個冒出來。比如,原告面前的麥克風能收到被告從喇叭擴出來的聲音。“我們就是專注於解決這樣的問題。” 鄢志傑說,大家在整個鏈條中各司其職,“這樣,我們也更專注”。
“語音辨識真正要遍地開花的時候,需要特別高效的定制能力。” 鄢志傑表示,比如怎麼在保證資料安全的情況下,提高帶有口音的普通話、方言的準確識別率?
除了語音辨識系統,阿裡雲附帶提供定制平臺。在定制平臺上,通過對方言語料的模型進行學習和運算,ET能夠將方言的識別準確率從40%-50%優化到80%-90%。這樣,基層法院也可以享受到ET帶來的便利。
在鄢志傑看來,今天很多人談論自然語言理解,很多時候是為搜尋引擎時代的打字去做理解,而自然語言理解,尤其是口語理解的技術,非常重要。
“我們現在跟語音在一起,一定是包含了語音裡的口語化現象。比如,語氣詞、停頓、猶豫等。在這種情況下,是不是還能做到很好的理解?”
鄢志傑表示,自己的團隊基於阿裡雲的基礎設施,搭建起了整套的、雲端的、超大規模的、語音的聲學模型和語言模型的訓練系統。數十萬小時的資料可以在非常快的時間內完成模型的訓練工作。並且,“基本上半年反覆運算一次主要的聲學模型。”
“這些東西看起來是基礎設施,但一旦到定制的時候,所展現出的效率、領先的訓練速度、定制化的能力是不容小視的。” 鄢志傑說,“演算法+資料+計算的迴圈,就能夠打造任意一個垂直領域、極高的語音辨識準確率的一個標杆。”
阿裡雲的雲計算能力及其在技術上下的硬功夫,如演算法優化,是智慧法庭一夜之間冒出來的基礎的支撐點;合作夥伴,如華宇,經過十幾二十年的業務積累,則擁有大量經過清洗的資料。
牽手華宇,阿裡雲將探索自然語言理解的技術邊界北京華宇軟體股份有限公司(簡稱“華宇”)是阿裡雲在司法領域落地的一位很重要的合作夥伴。
因為有了技術,還需要行業的合作夥伴將其包裝成終端的產品,再落實到細分行業中去。
華宇和阿裡雲在12月19日的雲棲大會·北京峰會上簽訂了合作框架協議,正式建立合作夥伴關係。據悉,雙方將共同為客戶提供基於阿裡雲計算平臺的智慧法院、智慧檢務、智慧司法等政法、司法領域的應用服務。
阿裡雲與華宇簽署合作框架協定
華宇創立於2001年,業務範圍涵蓋法院、檢察院、司法行政、各級黨委和政府部門以及各行業大型企事業單位。根據IDC中國電子政務研究報告,華宇自2006年至今連續11年位元列中國電子政務IT解決方案供應商10強。在法院、檢察院資訊化建設領域,華宇連續多年市場佔有率第一,客戶遍及全國。
此前,阿裡雲和華宇在法院庭審智慧語音辨識領域開展了深入合作。
2016年,華宇旗下的北京華宇元典資訊服務有限公司(簡稱“華宇元典”)成立,專注於為法律服務領域的從業者及相關機構等提供領先的法律資料服務及產品。
在華宇元典總經理鄒紹坤看來,華宇元典有在法律行業的商業管道和客戶優勢,有法律行業的專家和瞭解技術在法律領域落地的技術研發團隊,阿裡雲擁有領先的人工智慧技術、雲計算能力。雙方合作,可以組成一個三角式矩陣,為法律行業的客戶提供服務。
與阿裡雲深度合作,華宇將不僅是技術集成,而是會對現有技術進行充分挖掘,將基於具體的法律場景提出更多技術上的要求。
鄒紹坤認為,證據電子化是很多廠商都能做到的事情,對於法官而言,需要的是“證據邏輯的梳理、整理”。這不僅需要圖像識別,更需要圖像識別技術對被文字壓著的印章、手寫簽名等證據進行局部優化,在此基礎上做證據有效性的分析。
鄒紹坤表示,法律行業本身是一個靠語言交流比較多的行業,所以目前,語音辨識技術應用的更多。
鄢志傑表示,“今天,語音辨識在感知層面可以做到精度非常高;但是認知方面難度很高,如何在司法領域發揮更大的價值?自然語言理解的技術邊界在什麼地方?這是我們下一步要去探索的。”
未來,雙方也可能在圖像識別、人臉識別、自然語言處理方面展開合作。
這離不開技術的成熟度和積累。單就語音技術而言,阿裡從2014年起就非常嚴肅地在做投入了,不管是人才、資料還是計算上的投入。“技術、演算法,最核心的是離不開操作的人,要不斷去優化、再定義它。”
鄢志傑表示,阿裡雲不是把市場上別人的解決方案集成到阿裡雲的系統中,而是從麥克風的源頭開始做技術。因為“只有這樣,才能做到跟語音辨識系統打通、實現聯合優化;只有這樣,才能確保識別的精准度。”
“我們不需要從麥克風採購做起,我們做所有的採購系統的集成。”
使用者在使用產品的過程中,技術問題會一個個冒出來。比如,原告面前的麥克風能收到被告從喇叭擴出來的聲音。“我們就是專注於解決這樣的問題。” 鄢志傑說,大家在整個鏈條中各司其職,“這樣,我們也更專注”。
“語音辨識真正要遍地開花的時候,需要特別高效的定制能力。” 鄢志傑表示,比如怎麼在保證資料安全的情況下,提高帶有口音的普通話、方言的準確識別率?
除了語音辨識系統,阿裡雲附帶提供定制平臺。在定制平臺上,通過對方言語料的模型進行學習和運算,ET能夠將方言的識別準確率從40%-50%優化到80%-90%。這樣,基層法院也可以享受到ET帶來的便利。
在鄢志傑看來,今天很多人談論自然語言理解,很多時候是為搜尋引擎時代的打字去做理解,而自然語言理解,尤其是口語理解的技術,非常重要。
“我們現在跟語音在一起,一定是包含了語音裡的口語化現象。比如,語氣詞、停頓、猶豫等。在這種情況下,是不是還能做到很好的理解?”
鄢志傑表示,自己的團隊基於阿裡雲的基礎設施,搭建起了整套的、雲端的、超大規模的、語音的聲學模型和語言模型的訓練系統。數十萬小時的資料可以在非常快的時間內完成模型的訓練工作。並且,“基本上半年反覆運算一次主要的聲學模型。”
“這些東西看起來是基礎設施,但一旦到定制的時候,所展現出的效率、領先的訓練速度、定制化的能力是不容小視的。” 鄢志傑說,“演算法+資料+計算的迴圈,就能夠打造任意一個垂直領域、極高的語音辨識準確率的一個標杆。”
阿裡雲的雲計算能力及其在技術上下的硬功夫,如演算法優化,是智慧法庭一夜之間冒出來的基礎的支撐點;合作夥伴,如華宇,經過十幾二十年的業務積累,則擁有大量經過清洗的資料。
牽手華宇,阿裡雲將探索自然語言理解的技術邊界北京華宇軟體股份有限公司(簡稱“華宇”)是阿裡雲在司法領域落地的一位很重要的合作夥伴。
因為有了技術,還需要行業的合作夥伴將其包裝成終端的產品,再落實到細分行業中去。
華宇和阿裡雲在12月19日的雲棲大會·北京峰會上簽訂了合作框架協議,正式建立合作夥伴關係。據悉,雙方將共同為客戶提供基於阿裡雲計算平臺的智慧法院、智慧檢務、智慧司法等政法、司法領域的應用服務。
阿裡雲與華宇簽署合作框架協定
華宇創立於2001年,業務範圍涵蓋法院、檢察院、司法行政、各級黨委和政府部門以及各行業大型企事業單位。根據IDC中國電子政務研究報告,華宇自2006年至今連續11年位元列中國電子政務IT解決方案供應商10強。在法院、檢察院資訊化建設領域,華宇連續多年市場佔有率第一,客戶遍及全國。
此前,阿裡雲和華宇在法院庭審智慧語音辨識領域開展了深入合作。
2016年,華宇旗下的北京華宇元典資訊服務有限公司(簡稱“華宇元典”)成立,專注於為法律服務領域的從業者及相關機構等提供領先的法律資料服務及產品。
在華宇元典總經理鄒紹坤看來,華宇元典有在法律行業的商業管道和客戶優勢,有法律行業的專家和瞭解技術在法律領域落地的技術研發團隊,阿裡雲擁有領先的人工智慧技術、雲計算能力。雙方合作,可以組成一個三角式矩陣,為法律行業的客戶提供服務。
與阿裡雲深度合作,華宇將不僅是技術集成,而是會對現有技術進行充分挖掘,將基於具體的法律場景提出更多技術上的要求。
鄒紹坤認為,證據電子化是很多廠商都能做到的事情,對於法官而言,需要的是“證據邏輯的梳理、整理”。這不僅需要圖像識別,更需要圖像識別技術對被文字壓著的印章、手寫簽名等證據進行局部優化,在此基礎上做證據有效性的分析。
鄒紹坤表示,法律行業本身是一個靠語言交流比較多的行業,所以目前,語音辨識技術應用的更多。
鄢志傑表示,“今天,語音辨識在感知層面可以做到精度非常高;但是認知方面難度很高,如何在司法領域發揮更大的價值?自然語言理解的技術邊界在什麼地方?這是我們下一步要去探索的。”
未來,雙方也可能在圖像識別、人臉識別、自然語言處理方面展開合作。