您的位置:首頁>正文

Sonos王漢華:智慧音箱乃AI之爭,未來應開放平臺

­ 搜狐科技/崔家樂

­ 2014年12月, 亞馬遜Echo發佈後, 通過語音交互的智慧音箱便逐漸流行起來。 Echo面世僅4個月後, 京東第一款叮咚音箱立項。 今年4月, 騰訊推出“騰訊叮噹”入局智慧語音, 之後三天, 百度和小魚在家聯合發佈新款人工智慧視頻通話機器人“分身魚”。 7月5日, 百度AI開發者大會, DuerOS開放平臺正式亮相。 同日, 阿裡發佈了自主研發的AliGenie平臺及智慧音箱“天貓精靈X1”。

­ 如今, BATJ各大陣營都已聚齊智慧音箱領域。 同時, 聯想、小米等也都悉數到場, 發佈會一個接著一個, 目前國內在做智慧音箱的企業已經超過百家, 眾多廠商以及相關的硬體企業或技術提供商也都躍躍欲試,

不斷衝擊著這個市場, 智慧音箱儼然已成下一個風口。 而智能音箱為何在今年如此火爆?背後有什麼利益因素?國內外相比有何差距?未來的智慧音箱應該如何發展?關於這些問題, 搜狐科技有幸採訪了Sonos大中華區總裁王漢華先生。

­ 語音交互促使智慧音箱成為智慧家居入口

­ 科技在過去20年發生了巨變, 逐漸影響到個人、影響到辦公, 但是對於家庭的影響卻不是太大。 不像智慧機和功能機翻天覆地的變化, 也不像特斯拉與傳統汽車一樣發生本質上的變化, 家用電器幾乎沒有發生什麼變化, 有的只是電視機更大一些, 螢幕更薄一些, 色彩更鮮豔一些, 但是體驗幾乎沒有創新。 隨著語音交互的出現, 智慧家居的入口逐漸來到。

­ 雖然對於智慧家居的入口產品的看法存在著很多假設, 從最初的閘道、到後來的電視、還有可能是全新的電器平臺, 比如國內廠商海爾的U+平臺等等, 都有廠商進行過嘗試。 但是當國外以Amazon Alexa Echo代表的產品沖出來之後,

越來越多人認為這個會是將來的入口, 其中一個主要的原因是人機交互技術的變化。 技術發展的最終目的仍然是提供更多的方便性給人類, 從最初的鍵盤交互, 到後來移動時代逐漸流行的觸摸交互, 方式正在變得更加簡單化。 然而進入智慧時代後, 人機交互最方便的仍然是聲音。

­ 智慧音箱背後是一個巨大的生態系統

­ 以語音的交互為主要內容, 但智慧音箱的背後其實是一個巨大的生態系統, 包括端、雲以及服務。 主要四個方面, 即是語音辨識、語義分析、內容回饋、聲音類比。 從聽得見到聽得懂、到提供內容到後通過智慧音箱發出來, 四個環節都有核心技術。

­ 對於Sonos而言, 重點集中在聲音識別, 以及播放音質上面。

王漢華表示, Sonos有著15年累計下來的技術性積累, 比如在麥克風陣列上, 市場上也有提供標準的麥克風陣列的方案, 但是現在的很多方案都會是標量的麥克風陣列, 一個是多少的問題, 兩組的、四組的、六組的, 還有大小的指標, 但是提供不了方向。 而Sonos做的是向量的麥克風陣列, 不光能知道聲音從哪兒發出來, 麥克風陣列會調整搜集聲音的方向, 這個是核心的技術。 同時對於所有的智慧音箱, 核心的功能應用依舊是聽音樂, 而在這一點, Sonos無疑是有著15年特別是家庭音響上面有積累的公司。

­ 同時, 下半年Sonos也會推出帶有語音交互的智慧音箱, 目前是與亞馬遜合作, 在聲控方面用亞馬遜的Alexa, 整合Alexa整合的內容。 而在國內,

目前仍在和科大訊飛、百度等進行商討。

­ 智慧音箱乃AI之爭, 未來應該是開放平臺

­ 智慧音箱之爭背後實質是人工智慧之爭, 大資料的支援與訓練和調用頻率對於一個人工智慧產品的進化有著非常重要的作用。 在國內, 毋庸置疑, 各類資料依舊掌握在BAT三大巨頭的手中, 百度掌握著大量的搜索資料, 騰訊掌握著社交與內容是資料, 阿裡則掌握了大量的電商與生活服務資料。 這是巨頭的優勢, 但也是巨頭極力想要爭奪的, 最近BAT等紛紛推出智慧音箱, 就是因為把它當作了諸多服務和獲取使用者資料的最佳入口。

­ 同時從這個角度來看, Echo模式是有局限性的, 儘管Echo產品銷售了千萬台, 並且亞馬遜Alexa本身正在成為開放平臺, 但只是基於亞馬遜自己的生態。

­ 王漢華表示,未來的智慧音箱應該是一個操作平臺,一個開放性的HomeOS。智慧音箱上面會有不同的application,就像手機上有不同的APP一樣,通過SDK接入和協議接入,可以有更多的硬體產品連接。在提高自家的語音系統使用範圍的同時,也可以積累更多的資料。

­ 中外相比有差距,但不應低估智慧音箱的發展

­ 王漢華表示目前國內的智慧音箱與國外仍有很大差距,首先是在反應時間上,亞馬遜傑夫·貝佐斯曾說如果一個產品的response time高於3秒鐘的話,這個產品就失敗了。人和人對話的時候,一個問題問過去,可能思考3秒鐘對方是可以接受的,如果超過3秒鐘覺會很不自然。其次在回答準確率上,國內的智慧音箱普遍不好。王漢華認為,識別的準確率在80%以上才算是合格。在核心技術方面,國內也有差距,目前很多人仍然是在做標量的麥克風陣列,導致識別率不高,同時由於漢語的特殊性以及方言的多種多樣,導致演算法上對於語言的理解仍然有很大問題。

­ 一個產品的週期很難預測,沒有任何人能夠知道這個產品現在很火,明年會怎麼樣。在語音交互的發展中,智慧音箱也許不是唯一的終端,但想必也不可缺少。比爾·蓋茨說過一句很經典的話,“任何技術短期之內都是高估它的,長期都是低估它的”。王漢華認為我們不要犯這個錯誤,長期不要低估它,智慧音箱也許就會變成智慧家居入口級的產品。

­

但只是基於亞馬遜自己的生態。

­ 王漢華表示,未來的智慧音箱應該是一個操作平臺,一個開放性的HomeOS。智慧音箱上面會有不同的application,就像手機上有不同的APP一樣,通過SDK接入和協議接入,可以有更多的硬體產品連接。在提高自家的語音系統使用範圍的同時,也可以積累更多的資料。

­ 中外相比有差距,但不應低估智慧音箱的發展

­ 王漢華表示目前國內的智慧音箱與國外仍有很大差距,首先是在反應時間上,亞馬遜傑夫·貝佐斯曾說如果一個產品的response time高於3秒鐘的話,這個產品就失敗了。人和人對話的時候,一個問題問過去,可能思考3秒鐘對方是可以接受的,如果超過3秒鐘覺會很不自然。其次在回答準確率上,國內的智慧音箱普遍不好。王漢華認為,識別的準確率在80%以上才算是合格。在核心技術方面,國內也有差距,目前很多人仍然是在做標量的麥克風陣列,導致識別率不高,同時由於漢語的特殊性以及方言的多種多樣,導致演算法上對於語言的理解仍然有很大問題。

­ 一個產品的週期很難預測,沒有任何人能夠知道這個產品現在很火,明年會怎麼樣。在語音交互的發展中,智慧音箱也許不是唯一的終端,但想必也不可缺少。比爾·蓋茨說過一句很經典的話,“任何技術短期之內都是高估它的,長期都是低估它的”。王漢華認為我們不要犯這個錯誤,長期不要低估它,智慧音箱也許就會變成智慧家居入口級的產品。

­

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示