搜狐科技/崔家樂
2014年12月, 亞馬遜Echo發佈後, 通過語音交互的智慧音箱便逐漸流行起來。 Echo面世僅4個月後, 京東第一款叮咚音箱立項。 今年4月, 騰訊推出“騰訊叮噹”入局智慧語音, 之後三天, 百度和小魚在家聯合發佈新款人工智慧視頻通話機器人“分身魚”。 7月5日, 百度AI開發者大會, DuerOS開放平臺正式亮相。 同日, 阿裡發佈了自主研發的AliGenie平臺及智慧音箱“天貓精靈X1”。
如今, BATJ各大陣營都已聚齊智慧音箱領域。 同時, 聯想、小米等也都悉數到場, 發佈會一個接著一個, 目前國內在做智慧音箱的企業已經超過百家, 眾多廠商以及相關的硬體企業或技術提供商也都躍躍欲試,
語音交互促使智慧音箱成為智慧家居入口
科技在過去20年發生了巨變, 逐漸影響到個人、影響到辦公, 但是對於家庭的影響卻不是太大。 不像智慧機和功能機翻天覆地的變化, 也不像特斯拉與傳統汽車一樣發生本質上的變化, 家用電器幾乎沒有發生什麼變化, 有的只是電視機更大一些, 螢幕更薄一些, 色彩更鮮豔一些, 但是體驗幾乎沒有創新。 隨著語音交互的出現, 智慧家居的入口逐漸來到。
雖然對於智慧家居的入口產品的看法存在著很多假設, 從最初的閘道、到後來的電視、還有可能是全新的電器平臺, 比如國內廠商海爾的U+平臺等等, 都有廠商進行過嘗試。 但是當國外以Amazon Alexa Echo代表的產品沖出來之後,
智慧音箱背後是一個巨大的生態系統
以語音的交互為主要內容, 但智慧音箱的背後其實是一個巨大的生態系統, 包括端、雲以及服務。 主要四個方面, 即是語音辨識、語義分析、內容回饋、聲音類比。 從聽得見到聽得懂、到提供內容到後通過智慧音箱發出來, 四個環節都有核心技術。
對於Sonos而言, 重點集中在聲音識別, 以及播放音質上面。
同時, 下半年Sonos也會推出帶有語音交互的智慧音箱, 目前是與亞馬遜合作, 在聲控方面用亞馬遜的Alexa, 整合Alexa整合的內容。 而在國內,
智慧音箱乃AI之爭, 未來應該是開放平臺
智慧音箱之爭背後實質是人工智慧之爭, 大資料的支援與訓練和調用頻率對於一個人工智慧產品的進化有著非常重要的作用。 在國內, 毋庸置疑, 各類資料依舊掌握在BAT三大巨頭的手中, 百度掌握著大量的搜索資料, 騰訊掌握著社交與內容是資料, 阿裡則掌握了大量的電商與生活服務資料。 這是巨頭的優勢, 但也是巨頭極力想要爭奪的, 最近BAT等紛紛推出智慧音箱, 就是因為把它當作了諸多服務和獲取使用者資料的最佳入口。
同時從這個角度來看, Echo模式是有局限性的, 儘管Echo產品銷售了千萬台, 並且亞馬遜Alexa本身正在成為開放平臺, 但只是基於亞馬遜自己的生態。
王漢華表示,未來的智慧音箱應該是一個操作平臺,一個開放性的HomeOS。智慧音箱上面會有不同的application,就像手機上有不同的APP一樣,通過SDK接入和協議接入,可以有更多的硬體產品連接。在提高自家的語音系統使用範圍的同時,也可以積累更多的資料。
中外相比有差距,但不應低估智慧音箱的發展
王漢華表示目前國內的智慧音箱與國外仍有很大差距,首先是在反應時間上,亞馬遜傑夫·貝佐斯曾說如果一個產品的response time高於3秒鐘的話,這個產品就失敗了。人和人對話的時候,一個問題問過去,可能思考3秒鐘對方是可以接受的,如果超過3秒鐘覺會很不自然。其次在回答準確率上,國內的智慧音箱普遍不好。王漢華認為,識別的準確率在80%以上才算是合格。在核心技術方面,國內也有差距,目前很多人仍然是在做標量的麥克風陣列,導致識別率不高,同時由於漢語的特殊性以及方言的多種多樣,導致演算法上對於語言的理解仍然有很大問題。
一個產品的週期很難預測,沒有任何人能夠知道這個產品現在很火,明年會怎麼樣。在語音交互的發展中,智慧音箱也許不是唯一的終端,但想必也不可缺少。比爾·蓋茨說過一句很經典的話,“任何技術短期之內都是高估它的,長期都是低估它的”。王漢華認為我們不要犯這個錯誤,長期不要低估它,智慧音箱也許就會變成智慧家居入口級的產品。
但只是基於亞馬遜自己的生態。 王漢華表示,未來的智慧音箱應該是一個操作平臺,一個開放性的HomeOS。智慧音箱上面會有不同的application,就像手機上有不同的APP一樣,通過SDK接入和協議接入,可以有更多的硬體產品連接。在提高自家的語音系統使用範圍的同時,也可以積累更多的資料。
中外相比有差距,但不應低估智慧音箱的發展
王漢華表示目前國內的智慧音箱與國外仍有很大差距,首先是在反應時間上,亞馬遜傑夫·貝佐斯曾說如果一個產品的response time高於3秒鐘的話,這個產品就失敗了。人和人對話的時候,一個問題問過去,可能思考3秒鐘對方是可以接受的,如果超過3秒鐘覺會很不自然。其次在回答準確率上,國內的智慧音箱普遍不好。王漢華認為,識別的準確率在80%以上才算是合格。在核心技術方面,國內也有差距,目前很多人仍然是在做標量的麥克風陣列,導致識別率不高,同時由於漢語的特殊性以及方言的多種多樣,導致演算法上對於語言的理解仍然有很大問題。
一個產品的週期很難預測,沒有任何人能夠知道這個產品現在很火,明年會怎麼樣。在語音交互的發展中,智慧音箱也許不是唯一的終端,但想必也不可缺少。比爾·蓋茨說過一句很經典的話,“任何技術短期之內都是高估它的,長期都是低估它的”。王漢華認為我們不要犯這個錯誤,長期不要低估它,智慧音箱也許就會變成智慧家居入口級的產品。