您的位置:首頁>正文

資料視覺化運營商海雲資料發佈唇語識別技術,看嘴型就知道你在說什麼

此前 36氪曾報導過, 海雲資料是一家大資料公司, 其將服務聚焦在資料視覺化和可視分析上, 目的是説明客戶增加收益, 減少成本。 目前海雲資料有“智駕”和“圖易”這兩款核心產品, 説明大企業部署具有行業屬性的大資料分析和決策能力, 將大資料落地到具體的應用場景中。 當前海雲資料的解決方案已經涵蓋了航空、軍事、安全、金融、能源、政府和醫療多個領域。

今日, 海雲資料在“亞洲大資料視覺化分析峰會”上, 發佈了與重慶市公安科研所共同研發的唇語識別科研成果, 能夠對沒有聲音的視頻裡面的人物唇形進行識別並解讀成文字,

開創了中文唇語識別模型的研究先河。

唇語識別技術並不神秘, 國外就已經有所研究。 據國外媒體報導, 牛津大學人工智慧實驗室聯合Google的DeepMind團隊和其他研究員聯合發佈唇語讀程式LipNet, 在GRID語料庫上LipNet的準確高達93.4%。 而Google自己研發的唇語識別技術通過5000萬小時的BBC節目的訓練識別準確度也有很大提高。

這種“讀唇術”難就難在機器需要觀察唇形變化並將其這些細微的變化與具體的發音對號入座。 據海雲資料CEO馮一村介紹, 通過對視頻中的人物的嘴巴上部署大量識別位元點, 海雲資料能夠判斷這些人的嘴型從而判斷出他們所表達的關鍵內容。 而對於說話者的嘴型識別, 經過1萬小時各地新聞聯播的訓練,

海雲資料已經形成一套相對完善的AI模型。 雖然這項技術離投入實戰還有一些距離, 但是其在中文準確度已經能夠達到71%, 英文準確度達到80%。

未來, 這項唇語識別技術將會應用在公共安全、軍事情報、身份識別和殘疾教育這四個領域。

關於產品化, 馮一村表示這是海雲資料接下來在唇語領域即將展開的階段, 在實現產品化之後, 未來海雲資料還會將這項技術落地到具體的應用場景中。

據悉, 目前海雲資料的團隊在300人左右。 2016年年初, 海雲資料完成了1億元人民幣的A輪融資, 投資方為IDG資本。

『本文圖片來自:Yestone 邑石網正版圖庫』

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示