華文網

DeepBrain 李傳豐:當語義技能商店應用達到百萬量級的時候,語音交互時代才會真正成熟 | WARE 2017

7 月 15 日,在由硬體創新社區深圳灣全程策劃出品的「WARE 2017 語音智慧平臺與應用峰會 第 II 季」上 ,DeepBrain 聯合創始人兼 CMO 李傳豐發表了「創業公司在語音交互領域的發展機遇在哪裡?」為主題的演講,

為我們展現了以語義技能為核心的智慧生態,應該去關注哪些落地場景及如何搭建應用框架。

DeepBrain 核心團隊是國內最早專注于自然語言處理技術(NLP)領域的團隊之一,曾在 2011 年蘋果發佈集成了 Siri 智慧語音助手後,推出過國內第一款基於智慧手機的中文語音助手——智慧 360,並積累了千萬級的用戶。該團隊在 2014 年還做出了國內第一款語音智慧音箱——小智超級音箱,比 Echo 的推出還要早半年。

物聯網四大落地場景,語音交互成新流量入口

在演講中,李傳豐表示 ,DeepBrain 認為智慧手機並不是一個強語音交互場景。目前,將手機作為主要應用場景的 Siri、Cortana 等語音助手,並沒有很好地凸顯出產品的智慧性,而後進場的 Alexa 在智慧音箱這個純語音交互的場景上火了。

DeepBrain 團隊很早便意識到了語義開放平臺的必要性。 2013 年,在智慧硬體還不那麼熱火時 ,DeepBrain 團隊發佈語義開放平臺,並做了一個語音版的 WiFi 轉紅外遙控器。 2014 年 6 月發佈了智慧音箱,並在眾籌平臺音訊類產品中獲得優異的成績。除了音箱 ,DeepBrain 後來還嘗試開始將語音交互技術植入智慧型機器人等硬體嘗試做場景化的智慧產品。

李傳豐認為,物聯網語音交互有四大落地場景,分別是智慧家居、兒童、黑白電以及車載(包括前裝與後裝)。基於成本考慮,在較長時間內,終端價格 100 元以上可能才會率先語音化。

在整個物聯網的發展推動下,語音交互將會成為下一場新流量入口。現有的交互形式,包括鍵盤、滑鼠、以及觸控式螢幕等,在基於視覺的同時還需佔用雙手,這並不適用於需要時刻手握方向盤的車載,以及忙著做家務的家居環境。

而語音交互能方便的解放雙手,使得用戶在專注於手頭工作的同時,能通過語音方式下達任務。正是基於這樣的市場分析及考慮 ,DeepBrain 於今年 5 月推出了以語義技能生態為核心的智慧雲大腦。

為硬體廠商提供五大能力,語義技能生態是核心

李傳豐介紹 ,DeepBrain 能夠為硬體廠商提供五大能力,即語義技能商店 、AI 人機對話引擎、機器人功能元件、精細化大資料及家居互聯網服務。其中,語義技能商店這一塊,是打造語義技能生態計畫中關鍵的一環。

在產品進入市場之前,首先要調研市場需求,找准產品的精准定位。例如:這款產品的使用者是男性還是女性?家用還是辦公場景?外觀怎麼設計?內容服務怎麼搭建?用戶運營以及如何推廣?

如何通過嫁接在硬體之上的智慧服務留住使用者,伴隨軟體、硬體的升級形成良性的商業鏈迴圈,是傳統廠商 AI 轉型升級的共性需求。

語義技能生態便是 AI 服務的基石,通過引入開發者,各行業各領域的開發者開發出更適用於該場景下符合用戶期望的語義技能應用。李傳豐認為目前的語音助手並沒有很好的體現出開放性與智慧性,例如你問 Siri 有多少種功能?大家不知道,因為它的技能並沒有一個很好的呈現方式。

消費者並不知道語音助手有多少功能,也不知道問哪些問題會有準確的結果,哪些問題是得不到具體回饋的。這也是目前語音助手經常陷入困境的原因:用戶使用期望很高,結果使用起來沒有結果。當有一天用戶 90% 以上的問題都有了精准的結果的時候,語音交互智慧時代就真正到來了。

李傳豐認為,未來基於語音交互的語義技能,必須要能夠達到幾萬、幾十萬甚至上百萬種,才能促使語音交互時代作業系統真正走向成熟,而這個過程,可能還需要五到十年。

目前 DeepBrain 的語義技能平臺已經進駐了上千名開發者,開發了超過 1000 種以智慧家居、音訊、娛樂及兒童教育為主的語義技能,預計今年年底這個數字會達到 3000 種。而如何應用 NLP技術,建造一個能幫助開發者縮短開發時間的開放生態平臺,服務語音交互產業鏈廠商,助力行業產品及場景落地,引導用戶將預期調整到合理的範圍,就是 DeepBrain 目前在做的事。

在產品進入市場之前,首先要調研市場需求,找准產品的精准定位。例如:這款產品的使用者是男性還是女性?家用還是辦公場景?外觀怎麼設計?內容服務怎麼搭建?用戶運營以及如何推廣?

如何通過嫁接在硬體之上的智慧服務留住使用者,伴隨軟體、硬體的升級形成良性的商業鏈迴圈,是傳統廠商 AI 轉型升級的共性需求。

語義技能生態便是 AI 服務的基石,通過引入開發者,各行業各領域的開發者開發出更適用於該場景下符合用戶期望的語義技能應用。李傳豐認為目前的語音助手並沒有很好的體現出開放性與智慧性,例如你問 Siri 有多少種功能?大家不知道,因為它的技能並沒有一個很好的呈現方式。

消費者並不知道語音助手有多少功能,也不知道問哪些問題會有準確的結果,哪些問題是得不到具體回饋的。這也是目前語音助手經常陷入困境的原因:用戶使用期望很高,結果使用起來沒有結果。當有一天用戶 90% 以上的問題都有了精准的結果的時候,語音交互智慧時代就真正到來了。

李傳豐認為,未來基於語音交互的語義技能,必須要能夠達到幾萬、幾十萬甚至上百萬種,才能促使語音交互時代作業系統真正走向成熟,而這個過程,可能還需要五到十年。

目前 DeepBrain 的語義技能平臺已經進駐了上千名開發者,開發了超過 1000 種以智慧家居、音訊、娛樂及兒童教育為主的語義技能,預計今年年底這個數字會達到 3000 種。而如何應用 NLP技術,建造一個能幫助開發者縮短開發時間的開放生態平臺,服務語音交互產業鏈廠商,助力行業產品及場景落地,引導用戶將預期調整到合理的範圍,就是 DeepBrain 目前在做的事。