華文網

對話3位元語音交互專家:人機交互能否給人類一個更好的未來?

伴隨著去年三月AlphaGo與李世石人機大戰的開始與落幕,人工智慧受到了前所未有的關注與追捧。各類演算法的研發與資料的積累,加之資本的不斷投入以及用戶需求的持續推動,

促進人工智慧行業的爆發。

技術發展的關鍵在於落地,“語音”作為目前人工智慧領域落地最為成熟的技術,以準確率可達95%以上的識別水準,已經逐漸步入商業化階段。而語音交互的實現主要取決於兩點:語音辨識及語義理解。

語音辨識是指人與機器以語音對話方式,將人類的語音中的詞彙內容轉換為電腦可讀輸入。語音辨識只是語音交互的初始階段,語義的理解才是關鍵所在。

語義理解是NLP(自然語言處理)技術的一個重要組成部分,而時下正火的NLP技術也是人工智慧面臨的最為困難的問題之一。

近日,IT耳朵採訪到了目前專注於語音交互領域的三家創業企業人物:三角獸CTO亓超、思必馳NLP技術負責人樊帥、以及驀然認知CEO戴帥湘(排名不分先後),瞭解國內目前的語音交互領域發展現狀,以及這一行業未來發展的看法。

(從左至右依次為:三角獸CTO亓超、思必馳NLP技術負責人樊帥、驀然認知CEO戴帥湘)

尚未出現絕對的領航者

技術上的突破無疑是分占市場的最佳切入點。“隨著技術上的逐漸突破,語音辨識已經發展的足夠成熟,它只是人機交互過程中的最初階段,因此不再具備一定的行業壁壘及競爭優勢,

而這股行業浪潮中,語義卻是剛剛開始。”驀然認知的戴帥湘說道。

語義的理解將人機交互推到一個新的發展階段,大多企業都明白,語音的識別、大資料的整合以及演算法模型的構建,是能夠讓機器“聽得懂”的關鍵所在。甚至在人機交互過程中所面臨的環境噪音、發音不准、語言歧義等問題,也都相應催生了新的技術演算法。

如此看來,雖然語義理解領域的技術門檻較高,但目前仍未出現絕對領航者。

資料的積累都是從0到1的過程

在這三次的專訪中,我都問過他們關於“冬天能穿多少穿多少,夏天能穿多少穿多少”的玩笑問題。在與機器的交互過程中,我們所希望看到的,不僅局限於任務型的對輪對話,

難免會有調戲的成分在裡面。思必馳的樊帥表示“機器對於這類玩笑的回應,不僅基於規則的指定,還有資料的完善。”

而資料始終沒有盡頭,就像從0不斷趨近於1的這個過程。從最初資料的匱乏、資料標注、建模的困難都是這個從0到1的過程裡的技術難點所在,針對性的去做建模、分析、資料完善,只能達到可用狀態,若要機器變的“聰明”,則需要一個從1到N的不斷學習和優化的過程,計算能力的提升以及新演算法的實現,才能使資料模型得到更好的釋放。

正如亓超所說,機器是喜歡資料的,用機器喜歡的方式去解決問題,似乎更加高效、公平。不論是哪個領域的人機交互,機器並非都要被動地去回答問題,而是能夠主動的、有針對性的提出意見或建議,才是人機交互最自然的狀態。

關於未來市場的爭奪

和一些國外大公司有能力收購語音交互的整個生態鏈不同,國內的大多數企業在自主研發的同時,兼顧市場的爭奪,看起來似乎曲折很多。目前,國內很多企業都十分統一的選擇在車載、家居、可穿戴設備領域佈局, 這場同行業之間的爭相效仿與激烈競爭的結果,無非是將最初的創新格局徹底打破,抓住用戶的使用痛點,尋找新的出路才是一個企業得以存活下去的資本。

智慧時代的重點之一是人機交互,而語音交互憑藉自然的交互體驗、較為集中的學習成本成為發展的首選方向。目前,國內有越來越多的語音交互創業公司正在慢慢崛起,這也意味著將會有更多的人在這片領域站穩腳跟。即便這種全新的對話模式還有很長的路要走,但在這浮躁的市場中多一份務實,語音交互產業所形成的趨勢,也是值得我們期待和關注的。

計算能力的提升以及新演算法的實現,才能使資料模型得到更好的釋放。

正如亓超所說,機器是喜歡資料的,用機器喜歡的方式去解決問題,似乎更加高效、公平。不論是哪個領域的人機交互,機器並非都要被動地去回答問題,而是能夠主動的、有針對性的提出意見或建議,才是人機交互最自然的狀態。

關於未來市場的爭奪

和一些國外大公司有能力收購語音交互的整個生態鏈不同,國內的大多數企業在自主研發的同時,兼顧市場的爭奪,看起來似乎曲折很多。目前,國內很多企業都十分統一的選擇在車載、家居、可穿戴設備領域佈局, 這場同行業之間的爭相效仿與激烈競爭的結果,無非是將最初的創新格局徹底打破,抓住用戶的使用痛點,尋找新的出路才是一個企業得以存活下去的資本。

智慧時代的重點之一是人機交互,而語音交互憑藉自然的交互體驗、較為集中的學習成本成為發展的首選方向。目前,國內有越來越多的語音交互創業公司正在慢慢崛起,這也意味著將會有更多的人在這片領域站穩腳跟。即便這種全新的對話模式還有很長的路要走,但在這浮躁的市場中多一份務實,語音交互產業所形成的趨勢,也是值得我們期待和關注的。