華文網

專注語音技術十年,馳聲科技想用大資料為行業提供更多解決方案

芥末堆 子航 11月13日 報導

馳聲科技CEO林遠東曾在接受芥末堆採訪時說:“我們是一家永遠專注技術的教育公司。

與現在熟知的處於英語語音技術應用領域的馳聲科技不同,2007年公司創立之初的方向其實是對外漢語。林遠東說,“當時,我們注意到外國人學中文的趨勢,恰好在劍橋工程系有智慧語音實驗室,我們認為兩相結合會是非常好的機遇。”

2011年初,馳聲科技開始將目標投向國內市場。那時,林遠東也曾希望像為海外用戶提供中文學習一樣,

為國內使用者提供英語培訓產品。“但與海外沒有成熟的中文學習機構不同,國內英語培訓市場不論是公立還是私立培訓,都有非常成熟的管道和用戶。”基於這個判斷,團隊放棄了自主研發培訓產品,將方向調整自做口語評測技術授權服務。

2014年5月份,馳聲科技從思必馳原口語教育事業部剝離,為國內教育行業提供語音技術與服務。2015年6月,馳聲科技被網龍公司收購。

林遠東告訴芥末堆,馳聲科技目前有兩條主要的業務線,一個是口語評測技術授權,另一個是口語考試的解決方案。

目前,馳聲科技的主要營收來自於口語評測技術授權業務。其120人左右的團隊,70%從事研發工作。正在啟動新一輪的融資的馳聲科技,希望3到4年能夠完成獨立上市。

技術:從標準音比對到建立聲音模型

“我們剛進入這個市場時,國內很多從事英語評測技術服務的選手還沒有進場。

”林遠東表示,語言測試技術經歷了三次技術反覆運算,當馳聲科技2011年切入國內市場時,大多數國內相關技術公司主要在採用第一代技術。

“第一代技術是基於標準音比對的技術,將所有採集到的語音和標準音進行比對,通過測試與標準音發音的區別,從而對發音結果進行評價。”林遠東認為,儘管第一代技術的理念大家能夠理解,且在早期非常流行,

但其致命問題在於不夠準確。他舉例,“假設我們以英國女王的標準音做標準,你會發現一個英語說得不好的中老年女性,其評分可能恒定高於剛上大學的男生,原因便是她的聲線更貼近英國女王。”

林遠東說,馳聲科技切入國內市場時所具有的優勢,便來自于不同於基於比對技術的基於統計模型的口語評測技術。“我們的技術是基於統計模型的一套演算法,

通過輸入足夠多的語音資料建立聲音模型,將學習者的發音與聲音模型進行比對,得出評測結果。”通過輸入大量資料,在聲音模型中會分出不同的維度,例如單詞中的重讀單詞、連續發音、句末升降調等,可以更精確地進行評分。

林遠東告訴芥末堆,馳聲科技目前主要解決三個英語口語評測的應用場景,包括發音能力評估、語用能力評估和後續指導。同時,為有需求的相關企業和機構提供口語測評技術授權。

芥末堆瞭解到,在馳聲科技的口語測評技術授權業務中,馳聲科技會幫助合作企業和機構建設後臺服務介面,維護伺服器、使用者集群和文檔。此外,馳聲科技還會為合作夥伴提供相應的技術諮詢,幫助他們將技術應用到產品之中。

產品:不做純粹的技術提供商

“馳聲科技的變化可能在於,是否可以定位成純粹的語音技術服務提供者。”林遠東說,雖然馳聲科技為使用者提供技術產品,但一直以來都不是純粹的技術提供商。因此,從一開始提供技術產品,到為使用者提供整體解決方案都並非偶然。“我們發現很多時候,我們都在與用戶的交流與技術授權的過程中,幫助用戶完成項目。”

林遠東舉例,在馳聲科技與新東方線上合作的第一個專案中,除了提供語音技術,馳聲科技還協助新東方線上進行頁面的開發,並派工程師到新東方線上,協助其整體產品上線。

林遠東告訴芥末堆,2017年之前,馳聲科技並沒有系統化的為使用者提供技術加解決方案的模式,2017年以後,馳聲科技開始對產品進行系統梳理,為使用者提供整體的技術解決方案。

目前,馳聲科技形成了三個比較明確的解決方案,包括正式的口語考試資格評分、學校口語考試備考和課後口語作業測評。同時,還與惠普、弘基等公司展開了合作。

當下:把握中高考政策紅利

2012年,馳聲科技開始為廣東省湛江市初中英語口語考試提供相應解決方案;2013年到2014年間,馳聲科技還受邀參與了廣西省高考口語考試自動評分技術驗證。

林遠東認為,隨著教育改革的深入,從今年開始,在中高考中實行語文、英語聽說考試的趨勢已經越來越明朗。這也就意味著,對於考試自動評分、課後口語專業測評等解決方案的合作需求會更多。“以口語考試為中心的口語考試解決方案業務,未來會超過我們的技術授權業務。”

據瞭解,截至目前,北京市今年採購馳聲科技的師生校園口語考試備考解決方案的交易額已達兩千萬元。此外,馳聲科技還在為青島、深圳、瀋陽等多個城市的中高考提供技術解決方案。

未來:擁抱大資料時代的人工智慧

“口語測評技術授權業務給我們帶來了巨大的資料,這些資料包括從教育出版社、培訓機構、考試服務類機構獲取的各類資料。”林遠東介紹,馳聲科技對這些資料主要進行三個方向的資料採擷與分析:

口語評測回饋資料整理;

與用戶合作,在為其提供評測技術的基礎上,嘗試解決資料分析的問題;

實施資料流程分析和資料視覺化的技術研究。

林遠東說,在第一個方向中,通過對大量口語評測資料的分析,一方面可以提高馳聲科技的評分性能;另一方面,分析的結果可以為馳聲科技的聲音模型帶來新的要求和維度。第一個方向中,馳聲科技通過對平臺上積累的學習軌跡、學習行為和學習模式的分析,可以説明企業用戶更深度地去理解他們的學習者,並在此基礎上為學習者推薦合適的內容。

林遠東介紹,今年9月,馳聲科技公佈的一項新技術,便是基於資料流程分析和資料視覺化技術研究得到的。通過這項技術,用戶完成練習後,30秒內便能得到評估與回饋。“這種即時資料分析不僅能夠應用於模擬考試,還能應用到課堂上。因為真正意義的課堂練習,老師是需要即時看到回饋,然後做相應的講解。”

此外,林遠東認為,當機器學習掌握相應規律後,大量重複性的或者有既定標準的工作會越來越多地被電腦和人工智慧替代,因此,老師的指導與回饋也可能會被人工智慧所替代。

芥末堆瞭解到,在馳聲科技的口語測評技術授權業務中,馳聲科技會幫助合作企業和機構建設後臺服務介面,維護伺服器、使用者集群和文檔。此外,馳聲科技還會為合作夥伴提供相應的技術諮詢,幫助他們將技術應用到產品之中。

產品:不做純粹的技術提供商

“馳聲科技的變化可能在於,是否可以定位成純粹的語音技術服務提供者。”林遠東說,雖然馳聲科技為使用者提供技術產品,但一直以來都不是純粹的技術提供商。因此,從一開始提供技術產品,到為使用者提供整體解決方案都並非偶然。“我們發現很多時候,我們都在與用戶的交流與技術授權的過程中,幫助用戶完成項目。”

林遠東舉例,在馳聲科技與新東方線上合作的第一個專案中,除了提供語音技術,馳聲科技還協助新東方線上進行頁面的開發,並派工程師到新東方線上,協助其整體產品上線。

林遠東告訴芥末堆,2017年之前,馳聲科技並沒有系統化的為使用者提供技術加解決方案的模式,2017年以後,馳聲科技開始對產品進行系統梳理,為使用者提供整體的技術解決方案。

目前,馳聲科技形成了三個比較明確的解決方案,包括正式的口語考試資格評分、學校口語考試備考和課後口語作業測評。同時,還與惠普、弘基等公司展開了合作。

當下:把握中高考政策紅利

2012年,馳聲科技開始為廣東省湛江市初中英語口語考試提供相應解決方案;2013年到2014年間,馳聲科技還受邀參與了廣西省高考口語考試自動評分技術驗證。

林遠東認為,隨著教育改革的深入,從今年開始,在中高考中實行語文、英語聽說考試的趨勢已經越來越明朗。這也就意味著,對於考試自動評分、課後口語專業測評等解決方案的合作需求會更多。“以口語考試為中心的口語考試解決方案業務,未來會超過我們的技術授權業務。”

據瞭解,截至目前,北京市今年採購馳聲科技的師生校園口語考試備考解決方案的交易額已達兩千萬元。此外,馳聲科技還在為青島、深圳、瀋陽等多個城市的中高考提供技術解決方案。

未來:擁抱大資料時代的人工智慧

“口語測評技術授權業務給我們帶來了巨大的資料,這些資料包括從教育出版社、培訓機構、考試服務類機構獲取的各類資料。”林遠東介紹,馳聲科技對這些資料主要進行三個方向的資料採擷與分析:

口語評測回饋資料整理;

與用戶合作,在為其提供評測技術的基礎上,嘗試解決資料分析的問題;

實施資料流程分析和資料視覺化的技術研究。

林遠東說,在第一個方向中,通過對大量口語評測資料的分析,一方面可以提高馳聲科技的評分性能;另一方面,分析的結果可以為馳聲科技的聲音模型帶來新的要求和維度。第一個方向中,馳聲科技通過對平臺上積累的學習軌跡、學習行為和學習模式的分析,可以説明企業用戶更深度地去理解他們的學習者,並在此基礎上為學習者推薦合適的內容。

林遠東介紹,今年9月,馳聲科技公佈的一項新技術,便是基於資料流程分析和資料視覺化技術研究得到的。通過這項技術,用戶完成練習後,30秒內便能得到評估與回饋。“這種即時資料分析不僅能夠應用於模擬考試,還能應用到課堂上。因為真正意義的課堂練習,老師是需要即時看到回饋,然後做相應的講解。”

此外,林遠東認為,當機器學習掌握相應規律後,大量重複性的或者有既定標準的工作會越來越多地被電腦和人工智慧替代,因此,老師的指導與回饋也可能會被人工智慧所替代。