您的位置:首頁>數碼>正文

最近大火的智慧音箱們,究竟如何?科學測評告訴你!

12月4日, 中國電子科技集團公司第三研究所(簡稱“中電三所”)聯合中國電子學會消費者電子分會聯合發佈了, 以“娛心悅耳, 音智雙全”為主題的智慧音箱評測發佈會。 會上發佈了目前市場關注度較為集中的五款智慧音箱的評測方法與結果。 此次評測以中電三所下屬國家廣播電視產品品質監督檢驗中心、北京中電慧聲科技有限公司、三所科技創新中心語音與智慧聲學實驗室為技術支援, 針對智慧音箱交互性水準、聲性能、拆機分析三大方面展開了深度評測。

智慧音箱須具備擴聲、語音交互、資訊傳輸以及智慧化附加功能。 本次評測選擇了叮咚、小米、若琪月石、問問音箱、天貓精靈等五款主流智能音箱, 中電三所作為國內權威電聲科研機構, 組織行業專家設計評價方案、依託專業的實驗設備和自身豐富的行業經驗, 創新評測方法, 從交互性、聲性能、拆機分析三維度對樣品進行了評測。

在交互性能客觀測試方面, 通過主客觀兩個角度, 分別從識別準確率、回應時間、喚醒率, 以及交互體驗、對話判斷、執行回應、學習深度、主觀感受八項評測項目對智慧音箱交互性水準做出準確評價。 更創建了自有語料庫, 兼顧關鍵字命令操控和網路智慧檢索, 根據發音人性別、年齡、地域構成不同, 錄製了35 位發生者音訊, 經過後期製作完成 2100 餘條語料庫命令, 最終篩選出1000餘條語音命令作為客觀測試信號源, 使評測結果更客觀更科學更具參考價值。 智慧交互性能客觀分別在三種狀態下進行, 一種是不加任何干擾、雜訊;二是只加干擾、不加雜訊;三是只加雜訊、不加干擾。 如下是三種狀態下五款智慧音箱的識別準確率測試結果。

可以看到在干擾的狀態下, 對音箱的語音辨識率準確性影響是很大的, 導致它識別率下降、變差。 在測試結果中, 分別給出了平均值和中位值。 由於測試樣本聲音差異較大, 導致測試結果較為離散且有極端值, 甚至0%和100%的識別率出現, 極端值比較大, 所以用平均值代表整體趨勢。 離散和極端值的出現, 從也反映出本次評測樣本選擇比較合理, 沒有全部選擇標準普通話樣本。

回應時間測試使用語料庫中標準普通話語音命令, 測試結果選取了回應時間的最大值而非選平均值,

因為考慮到回應時間越長用戶使用體驗越差。 從測試結果上看, 在網路流暢的狀態下, 不同的測試環境對回應時間的影響並不明顯, 這與各個音箱介入軟體的平臺完全語音語義理解部分功能有關。

喚醒率與智慧音箱硬體麥克風陣列、軟體演算法關係密切。 在2.5米處淨通道、干擾狀態、雜訊狀態下喚醒率均為100%,4米處喚醒率下降。通過拉距測試得知,距離影響喚醒的成功率,並且在喚醒之後的語音辨識率更低。例如:用戶說“天貓精靈”,它回答,用戶再問它問題,它可能就無法正確回答。鑒於目前的情況下,我們要真的實現“動口不動手”,還是要離音箱更近一點,聲音再大一點。

交互性主觀評價採用單刺激連續品質評價方法(SSCQE方法),評價交互體驗、主觀感受、對話判斷、學習深度、執行回應等五項評價指標,五項加權後標準差為S,經測試五款音箱標準差分別為:S叮咚=0.79,S問問=0.45, S若琪=0.34,S天貓=0.36, S小愛=0.57。

智慧交互性能評測結論顯示,多聲源干擾對於智慧音箱語音辨識能力影響很大,如何甄別確實需要科學演算法解決,且掩蔽效應如何合理設計優化演算法,是智慧音箱R&D正在努力的方向。當前各智慧音箱支援的智慧搜索類語音命令庫範圍還需要極大升級,很多命令都是回復,“不知道”或者“目前無此功能”。這直接導致用戶的厭煩情緒,間接影響了智慧音箱發展前景。智慧音箱的聯網優化需要進一步提高。

聲性能測試方面,一個完美的音箱,應該在各個頻段都具備飽滿、平坦的特點,有些更注重飽滿,有些更注重平坦。依據GB/T 12060.5-2011《聲系統設備 第5部分:揚聲器主要性能測試方法》標準,在尖劈全消音室對音箱進行客觀頻響測試、失真測試、最大聲壓級測試。

以上是五款音箱的回應曲線與失真曲線。小米音箱人耳可聞的失真,最大聲壓級是70dB,可以保證播放語音類信號的時候聲音洪亮,高頻的時候有明顯下降,會造成小米音箱播放中高頻如琵琶,會聲音發悶,不具備聲音明亮感;若琪音箱有效頻段可以有效覆蓋中高頻段,但低頻失真過大;叮咚智慧音箱採用四個全頻單元,失真在較小範圍內,在輔助單元的説明下最大聲壓級可以達到76dB,無法完美展示含有中高頻段的音樂;問問保證了有效覆蓋中高頻,失真控制在較小範圍內,較高頻段存在較大失真,造成聽取較高頻段的聲音時候出現刺耳音;天貓從中頻段開始有下降,全頻段都有較大失真,最大聲壓級只有66dB,這款音箱在工藝設計上對音質有較大的損失。

通過以上資料統計,五款音箱有效頻帶都在100Hz以下,均可完美地表現語音交互效果,但市面上的智慧音箱音質還與傳統音箱有較大的差距。

依據GB/T 12060.13-2011《聲系統設備 第13部分:揚聲器聽音試驗》、GB/T 15000 《標準樣品工作導則》、GB/T 10240-88《電聲產品聲音品質主觀評價用節目源編輯製作規範》邀請業內專家與受訓普通聽眾共同對音箱進行低頻力度、中頻平坦度、高頻飽滿度、保真度、擬合度五項測試進行主觀評價。通過擬人聲和音樂欣賞兩方面,判斷語音清晰及洪亮程度,以及音質優劣。

在拆機分析方面,將基本硬體平臺拆分為五個模組,分別是麥克風陣列、主控晶片DSP、擴聲單元、數位功放、通信模組。對五款產品每個模組的材料選用進行了橫向對比,展現了科研機構的專業性和嚴謹性。

1.麥克風陣列,主要目的是拾取語音,載入數位音訊處理演算法可以實現降噪、回聲抑制、去混響、聲源定位,解決遠場拾音問題,與遠講語音辨識演算法相匹配。

(1)小米AI麥克風陣列,六全向矽麥克風,I2S介面數位矽麥。

(2)天貓精靈麥克風陣列,六全向矽麥克風,TI ADC3101介面。

(3)叮咚麥克風陣列,7+1麥克風陣列,科勝訊CX20810-11Z介面。

(4)出門問問麥克風陣列,雙麥克風,科勝訊CX20921介面。

(5)月石智慧語音機器人麥克風陣列,六全向矽麥克風。

2.主控晶片,完成的功能是對語音語義的解析理解。與手機等移動設備相類似,包括處理器、記憶體、記憶體等核心部件。主控單元主要完成前端語音信號的整合以及後端語音拾取進行整合。主控單元的選擇需要在滿足語音交互回應速度的前提下,儘量壓縮成本和功耗。

被測的五款樣品主控單元如下表:

3.擴聲單元,提供使用者認可的音質。智慧音箱擴聲部分設計有一定的限制,在發聲單元的選擇上,受到音箱尺寸限制,低音不足,輔助低音被動輻射器。另外,全雙工的工作要求限制了音箱的最大音量,發聲單元功率太大會影響音箱拾取用於語音的靈敏度。五款音箱擴聲單元選用如下:

(1)小米AI

小米的主擴使用的是2.25寸全頻揚聲器,從低頻一直到高頻。配套了兩個對稱的32平方釐米的輔助低音被動輻射器。國內外知名音箱產品多數帶有導向管,用導向管來補償低音。但是導向管補償低音的時候會帶來風噪,無論前置還是後置都有風噪進入到音箱,就影響到低頻帶來雜訊。而小米是採用45度的導向錐,改變了中高頻的傳播方向。

(2)天貓精靈

天貓精靈使用全頻揚聲器,帶了兩個對稱的輔助低音被動輻射器組成。

(3)叮咚

叮咚智慧音箱是4個1.5寸的全頻帶單元的,主擴。3寸1個低音單元,裡面採用U形的導向管,同時在喇叭前面加了一個導音錐。

(4)出門問問

出門問問是1寸高音單元,有50W大功率,3寸低音單元,兩側配有兩片被動輻射器,共振增強低音效果。

(5)月石智慧語音機器人

月石智慧音箱,兩個6歐的3W的揚聲器,也配備了兩個波動輻射器。

4.數位功放模組,揚聲器需要好的功放來支撐將我們播放的音訊盡可能真實、低失真的傳導到發聲單元上。

功放單元五款產品中基本四款都是選用的TI公司的功放晶片,四款功放晶片不盡相同,其中有兩種介面,小米選用的功放晶片具有I2S介面,即數位的音訊介面,不需要經過第二次轉換,並且該功能晶片支援多種速率,可以使用軟體介面進行部分控制;天貓精靈的功放晶片略為簡單;月石智慧音箱功放晶片是一個類比信號輸入,搭載了TI公司的主控晶片。

5.通訊模組是連接語音開放平臺,獲取內容資源,使用WIFI/藍牙技術連接,提升手機的音質,讓音樂得到分享。廠家可以通過豐富內容資源,增加使用者粘性。

此次評測結果顯示,五款智慧音箱在交互性能與音質綜合評分上都略有不足。同時也證明了並非越貴的產品性能越好。優秀的智慧音箱產品應該兼顧智慧與音質雙方面,但目前行業浮躁的氣氛使得製造商忽略了產品品質與使用體驗。希望通過此次評測能夠改變行業風向,同時告訴消費者好的智慧音箱的標準,瞭解智慧音箱優劣。

此前,中電三所泰瑞特研究曾對10款頭戴式耳機進行評測並成立音質評價實驗室,後續還將針對降噪耳機等不同類型電聲產品持續開展系列評測活動,致力於利用專業評測結果向消費者推薦優秀的電聲產品,踐行品質為先的理念,不斷推動行業產品革新和技術進步。

聽感僅代表作者個人,歡迎留言討論。

在2.5米處淨通道、干擾狀態、雜訊狀態下喚醒率均為100%,4米處喚醒率下降。通過拉距測試得知,距離影響喚醒的成功率,並且在喚醒之後的語音辨識率更低。例如:用戶說“天貓精靈”,它回答,用戶再問它問題,它可能就無法正確回答。鑒於目前的情況下,我們要真的實現“動口不動手”,還是要離音箱更近一點,聲音再大一點。

交互性主觀評價採用單刺激連續品質評價方法(SSCQE方法),評價交互體驗、主觀感受、對話判斷、學習深度、執行回應等五項評價指標,五項加權後標準差為S,經測試五款音箱標準差分別為:S叮咚=0.79,S問問=0.45, S若琪=0.34,S天貓=0.36, S小愛=0.57。

智慧交互性能評測結論顯示,多聲源干擾對於智慧音箱語音辨識能力影響很大,如何甄別確實需要科學演算法解決,且掩蔽效應如何合理設計優化演算法,是智慧音箱R&D正在努力的方向。當前各智慧音箱支援的智慧搜索類語音命令庫範圍還需要極大升級,很多命令都是回復,“不知道”或者“目前無此功能”。這直接導致用戶的厭煩情緒,間接影響了智慧音箱發展前景。智慧音箱的聯網優化需要進一步提高。

聲性能測試方面,一個完美的音箱,應該在各個頻段都具備飽滿、平坦的特點,有些更注重飽滿,有些更注重平坦。依據GB/T 12060.5-2011《聲系統設備 第5部分:揚聲器主要性能測試方法》標準,在尖劈全消音室對音箱進行客觀頻響測試、失真測試、最大聲壓級測試。

以上是五款音箱的回應曲線與失真曲線。小米音箱人耳可聞的失真,最大聲壓級是70dB,可以保證播放語音類信號的時候聲音洪亮,高頻的時候有明顯下降,會造成小米音箱播放中高頻如琵琶,會聲音發悶,不具備聲音明亮感;若琪音箱有效頻段可以有效覆蓋中高頻段,但低頻失真過大;叮咚智慧音箱採用四個全頻單元,失真在較小範圍內,在輔助單元的説明下最大聲壓級可以達到76dB,無法完美展示含有中高頻段的音樂;問問保證了有效覆蓋中高頻,失真控制在較小範圍內,較高頻段存在較大失真,造成聽取較高頻段的聲音時候出現刺耳音;天貓從中頻段開始有下降,全頻段都有較大失真,最大聲壓級只有66dB,這款音箱在工藝設計上對音質有較大的損失。

通過以上資料統計,五款音箱有效頻帶都在100Hz以下,均可完美地表現語音交互效果,但市面上的智慧音箱音質還與傳統音箱有較大的差距。

依據GB/T 12060.13-2011《聲系統設備 第13部分:揚聲器聽音試驗》、GB/T 15000 《標準樣品工作導則》、GB/T 10240-88《電聲產品聲音品質主觀評價用節目源編輯製作規範》邀請業內專家與受訓普通聽眾共同對音箱進行低頻力度、中頻平坦度、高頻飽滿度、保真度、擬合度五項測試進行主觀評價。通過擬人聲和音樂欣賞兩方面,判斷語音清晰及洪亮程度,以及音質優劣。

在拆機分析方面,將基本硬體平臺拆分為五個模組,分別是麥克風陣列、主控晶片DSP、擴聲單元、數位功放、通信模組。對五款產品每個模組的材料選用進行了橫向對比,展現了科研機構的專業性和嚴謹性。

1.麥克風陣列,主要目的是拾取語音,載入數位音訊處理演算法可以實現降噪、回聲抑制、去混響、聲源定位,解決遠場拾音問題,與遠講語音辨識演算法相匹配。

(1)小米AI麥克風陣列,六全向矽麥克風,I2S介面數位矽麥。

(2)天貓精靈麥克風陣列,六全向矽麥克風,TI ADC3101介面。

(3)叮咚麥克風陣列,7+1麥克風陣列,科勝訊CX20810-11Z介面。

(4)出門問問麥克風陣列,雙麥克風,科勝訊CX20921介面。

(5)月石智慧語音機器人麥克風陣列,六全向矽麥克風。

2.主控晶片,完成的功能是對語音語義的解析理解。與手機等移動設備相類似,包括處理器、記憶體、記憶體等核心部件。主控單元主要完成前端語音信號的整合以及後端語音拾取進行整合。主控單元的選擇需要在滿足語音交互回應速度的前提下,儘量壓縮成本和功耗。

被測的五款樣品主控單元如下表:

3.擴聲單元,提供使用者認可的音質。智慧音箱擴聲部分設計有一定的限制,在發聲單元的選擇上,受到音箱尺寸限制,低音不足,輔助低音被動輻射器。另外,全雙工的工作要求限制了音箱的最大音量,發聲單元功率太大會影響音箱拾取用於語音的靈敏度。五款音箱擴聲單元選用如下:

(1)小米AI

小米的主擴使用的是2.25寸全頻揚聲器,從低頻一直到高頻。配套了兩個對稱的32平方釐米的輔助低音被動輻射器。國內外知名音箱產品多數帶有導向管,用導向管來補償低音。但是導向管補償低音的時候會帶來風噪,無論前置還是後置都有風噪進入到音箱,就影響到低頻帶來雜訊。而小米是採用45度的導向錐,改變了中高頻的傳播方向。

(2)天貓精靈

天貓精靈使用全頻揚聲器,帶了兩個對稱的輔助低音被動輻射器組成。

(3)叮咚

叮咚智慧音箱是4個1.5寸的全頻帶單元的,主擴。3寸1個低音單元,裡面採用U形的導向管,同時在喇叭前面加了一個導音錐。

(4)出門問問

出門問問是1寸高音單元,有50W大功率,3寸低音單元,兩側配有兩片被動輻射器,共振增強低音效果。

(5)月石智慧語音機器人

月石智慧音箱,兩個6歐的3W的揚聲器,也配備了兩個波動輻射器。

4.數位功放模組,揚聲器需要好的功放來支撐將我們播放的音訊盡可能真實、低失真的傳導到發聲單元上。

功放單元五款產品中基本四款都是選用的TI公司的功放晶片,四款功放晶片不盡相同,其中有兩種介面,小米選用的功放晶片具有I2S介面,即數位的音訊介面,不需要經過第二次轉換,並且該功能晶片支援多種速率,可以使用軟體介面進行部分控制;天貓精靈的功放晶片略為簡單;月石智慧音箱功放晶片是一個類比信號輸入,搭載了TI公司的主控晶片。

5.通訊模組是連接語音開放平臺,獲取內容資源,使用WIFI/藍牙技術連接,提升手機的音質,讓音樂得到分享。廠家可以通過豐富內容資源,增加使用者粘性。

此次評測結果顯示,五款智慧音箱在交互性能與音質綜合評分上都略有不足。同時也證明了並非越貴的產品性能越好。優秀的智慧音箱產品應該兼顧智慧與音質雙方面,但目前行業浮躁的氣氛使得製造商忽略了產品品質與使用體驗。希望通過此次評測能夠改變行業風向,同時告訴消費者好的智慧音箱的標準,瞭解智慧音箱優劣。

此前,中電三所泰瑞特研究曾對10款頭戴式耳機進行評測並成立音質評價實驗室,後續還將針對降噪耳機等不同類型電聲產品持續開展系列評測活動,致力於利用專業評測結果向消費者推薦優秀的電聲產品,踐行品質為先的理念,不斷推動行業產品革新和技術進步。

聽感僅代表作者個人,歡迎留言討論。

Next Article
喜欢就按个赞吧!!!
点击关闭提示