華文網

看懂黑科技丨“鸚鵡學舌”是如何欺騙智慧音箱的?

聚焦資訊技術領域 為產業發聲

導讀

據英國《太陽報》9月20日報導,近日,一隻鸚鵡居然通過模仿主人的聲音在亞馬遜官網上成功下單,《太陽報》網站上的一段視頻顯示,鸚鵡叫了聲“亞曆克薩”,

然後揚聲器開始亮起藍燈,表示它正在聽從用戶的需求。巴迪隨後胡言亂語一番,機器回復到:“你想訂什麼呢?”當時主人並沒有把這事太放在心上,直到她收到一份訂單顯示,已經訂購了一些金色的禮品盒。對此,主人表示不可思議。“鸚鵡學舌”到底是如何欺騙智慧音箱,從而購物成功的呢?

智能音箱的“辨人”秘訣

據瞭解,“亞馬遜回聲”是一款語音控制智慧音箱,內置亞馬遜開發的“亞曆克薩”語音助理功能。用戶通過向“亞曆克薩”發出命令來訪問一系列服務,比如實現智慧家居控制、語音購物、音訊音樂播放等功能。使用者不用掃描二維碼,不用輸入密碼,就能購物,極大地提高了用戶體驗感,此外,它還能夠根據聲音條件識別出不同的使用者,

以此保證使用的安全性和私密性。而這一切全都依賴於“聲紋識別”功能。

與語音辨識不同,聲紋識別的目的不是識別語音的內容,而是識別說話人的身份。每個人的說話特性都具有其獨特的特徵,而決定這種獨特特徵的因素有:聲腔的差異,比如咽喉、鼻腔、口腔這些器官的形狀、尺寸和位置,另一個是發聲的操作方式,主要是指唇、口齒、舌頭等部位在發聲時的相互作用。

這些因素導致不同的人說話,其聲音不同,而這些不同正成為智慧音箱識別不同人的基礎。

智能音箱是如何“辨人”的

聲紋識別有兩類,即說話人辨認和說話人確認。前者用以判斷某段語音是若干人中的哪一個所說的,

是“多選一”問題;而後者用以確認某段語音是否是指定的某個人所說的,是“一對一判別”問題。不同的任務和應用會使用不同的聲紋識別技術,如縮小刑偵範圍時可能需要辨認技術,而銀行交易時則需要確認技術。不管是辨認還是確認,都需要先對說話人的聲紋進行建模,在此事件中,鸚鵡學習主人說話,智慧音箱識別出來,屬於說話人辨認。

根據百度工程師曾在參加綜藝節目《最強大腦》時的介紹,

一個基本的聲紋識別過程主要包括聲紋註冊和聲紋測試階段:在聲紋註冊階段,每個可能的使用者都會錄製足夠的語音然後進行說話人特徵的提取,從而形成聲紋模型庫。這個模型庫就像字典,所有可能的字都會在該字典中被收錄。在聲紋測試階段,測試者會錄製一定的語音,然後進行說話人特徵提取,提取完成後,就會與聲紋模型庫中的所有註冊者進行相似度計算。

聲紋特徵是類似於虹膜、指紋等一種具有獨特性的生物特徵。一般而言,人正常說話時的聲紋狀態是相對穩定的,但身體狀況、年齡、情緒等情況的干擾,會導致聲紋特性的變化。比如一個人感冒了,鼻腔堵塞從而導致聲紋特性不一致,那機器可能也不能識別成功。

“鸚鵡學舌”如何騙過智能音箱

英國生物學家查理斯·達爾文在書寫《人類起源》時,曾思考人類是如何學會說話的,他寫道“鳥類發聲在好幾個方面為人類語言的發展提供了最近的類比。”他認為語言可能起源於鳥鳴。人通過咽喉部的氣流強弱、聲帶振動從而控制所發出的聲音,而鸚鵡能學會人說話,秘密就在於它特殊的生理構造:鳴管和舌頭。鸚鵡的舌頭比其它鳥類圓滑柔軟,能發出比較複雜的聲音,類似人類的語言,但鸚鵡的發聲器與人類的聲帶有所不同,鸚鵡的發聲器叫鳴管,位於氣管與支氣管的交界處,由最下部的3~6個氣管膨大變形後與其左右相鄰的三對變形支氣管共同構成。

當然,鸚鵡會說話只是因為條件反射,並不具備思維能力。人如果系統地發出同一句話,或是一個聲音,久了它們也就能跟著模仿了。例如人們在訓練一隻鸚鵡時,把敲門與“請進來”二者的聲音聯繫在一起刺激鸚鵡,鸚鵡就會把這些信號儲存起來,經過反復刺激,繼而形成條件反射。只要當它聽到敲門聲,接著就會大喊:“請進來。”有時外面在敲木板,它也會大喊:“請進來。”在此事件中,鸚鵡聽到主人不斷的重複購物的詞彙,長此以往便學會了如何控制智慧音箱。看來,以後要讓鸚鵡“不敗家”,還要背著鸚鵡購物才行......

聲明:

黃河連線系太原九州連線文化傳媒有限公司旗下品牌

本平臺法律顧問為山西晉商律師事務所

黃河連線原創文章,轉載請注明出處

往期文章閱讀:

木蘭觀察丨趙鵬:就業應“去標籤化”

木蘭觀察丨山西應如何發展大資料與智慧城市?

木蘭觀察丨“破門而入”的醫療大資料將如何改變你我的生活?

聲紋特徵是類似於虹膜、指紋等一種具有獨特性的生物特徵。一般而言,人正常說話時的聲紋狀態是相對穩定的,但身體狀況、年齡、情緒等情況的干擾,會導致聲紋特性的變化。比如一個人感冒了,鼻腔堵塞從而導致聲紋特性不一致,那機器可能也不能識別成功。

“鸚鵡學舌”如何騙過智能音箱

英國生物學家查理斯·達爾文在書寫《人類起源》時,曾思考人類是如何學會說話的,他寫道“鳥類發聲在好幾個方面為人類語言的發展提供了最近的類比。”他認為語言可能起源於鳥鳴。人通過咽喉部的氣流強弱、聲帶振動從而控制所發出的聲音,而鸚鵡能學會人說話,秘密就在於它特殊的生理構造:鳴管和舌頭。鸚鵡的舌頭比其它鳥類圓滑柔軟,能發出比較複雜的聲音,類似人類的語言,但鸚鵡的發聲器與人類的聲帶有所不同,鸚鵡的發聲器叫鳴管,位於氣管與支氣管的交界處,由最下部的3~6個氣管膨大變形後與其左右相鄰的三對變形支氣管共同構成。

當然,鸚鵡會說話只是因為條件反射,並不具備思維能力。人如果系統地發出同一句話,或是一個聲音,久了它們也就能跟著模仿了。例如人們在訓練一隻鸚鵡時,把敲門與“請進來”二者的聲音聯繫在一起刺激鸚鵡,鸚鵡就會把這些信號儲存起來,經過反復刺激,繼而形成條件反射。只要當它聽到敲門聲,接著就會大喊:“請進來。”有時外面在敲木板,它也會大喊:“請進來。”在此事件中,鸚鵡聽到主人不斷的重複購物的詞彙,長此以往便學會了如何控制智慧音箱。看來,以後要讓鸚鵡“不敗家”,還要背著鸚鵡購物才行......

聲明:

黃河連線系太原九州連線文化傳媒有限公司旗下品牌

本平臺法律顧問為山西晉商律師事務所

黃河連線原創文章,轉載請注明出處

往期文章閱讀:

木蘭觀察丨趙鵬:就業應“去標籤化”

木蘭觀察丨山西應如何發展大資料與智慧城市?

木蘭觀察丨“破門而入”的醫療大資料將如何改變你我的生活?