隨著互聯網科技的發展, 網路已經是人們日常生活裡密不可分的部分。 在移動互聯網大行其道的當下, 生活中許多行為都開始和互聯網發生關係。 比如, 社交、購物、網路支付等等。
隨之而來的便是個人身份在互聯網中的驗證問題, 系統如何保證一個行為是用戶自己做出的, 而不是由別人操作的, 從互聯網發展開始到現在這都是一個大問題。
從以前的密碼、金鑰等傳統方法, 到如今的動態密碼、手機驗證碼, 都是科技發展的結果。 但人們總是傾向於用更簡單的方法來解決問題, 比如, 能用手指按一下就通過驗證又何必要多輸入幾個數位。 特別是在移動互聯網發展的當下, 各種各樣的驗證方式, 都是在安全的前提下趨於簡單化的。 比如, 一鍵的手機驗證碼, 六位元數的支付密碼等。
但總體而言, 傳統的密碼、金鑰等難以記住和輸入並且容易被非法盜用,
其中, 聲音就是一種可以反應我們本身特性的生物特徵, 參考指紋, 我們叫它“聲紋”
所謂聲紋(Voiceprint), 是用電聲學儀器顯示的攜帶言語資訊的聲波頻譜。 和手指上的指紋一樣, 每個人都聲音特性都是不一樣的。 也正因如此, 聲紋識別技術也被大量的應用到智慧手機上。
現代科學研究表明, 聲紋不僅具有特定性, 而且有相對穩定性的特點。 成年以後, 人的聲音可保持長期相對穩定不變。 實驗證明, 無論講話者是故意模仿他人聲音和語氣, 還是耳語輕聲講話, 即使模仿得惟妙惟肖, 其聲紋卻始終不相同。
比如生活中的“未見其人, 先聞其聲”、“聽聲辨人”等, 當你拿起電話對方一聲“喂”, 你就能知道打電話來的是女友還是前女友。 當然, 這是依靠個人音色來辨識的。 不過, 電腦聲紋識別技術就是這個樣子的, 只是電腦在對個人聲紋建模的時候, 其驗證的嚴格程度比我們日常用耳要精細很多。
現在聲紋技術在智慧手機上的應用還不是很多, 至少沒有指紋識別那麼的普及。 幾年前指紋識別還是高端機的配置,
聲紋識別技術在其他場景的應用我們就不多說了, 我們主要看它在移動智慧手機這一塊的應用。 目前在智慧手機這邊, 對於聲紋識別的內容部分, 還沒有發展到可以自訂的程度。 大多數是軟體提供一串數位供使用者朗讀, 軟體進行記錄並通在後臺進行建模, 至於演算法細節內容可以自行穀歌。
當然, 在人工智慧發展的當下, 聲紋識別是可以進行內容自訂識別的, 只要輸入足夠多的個人聲音標本供機器學習, 那不管你說什麼都能識別驗證。 只是,在智慧手機這一塊還沒有普及過來,這背後是成本和技術考量。
那聲紋技術作為一種安全身份驗證手段,不可避免的也會面臨著非法的攻擊。比如,熟人模仿、錄音重放、軟體合成等,但都有解決方案
熟人模仿這一塊,雖然有時候我們很難用耳朵來識別模仿秀,但電腦是可以識別的,就像眼鏡看不到的顏色,但PS可以選中。而對於錄音重放,通常使用活體檢測與內容識別來進行防範,活體堅持當前生源來源是錄音器還是人,內容識別是第一次驗證時就用指定內容,那隨意的錄音就不能通過。
軟體合成就是大威脅了,近年來的類似穀歌的WavNet和Adobe Project VoCo等技術,極大的提高了合成聲音的相似度。畢竟都是記錄、驗證都是電腦。那這也是為了這項技術的發展方向和人工智慧發展的必要。
聲紋識別技術的使用比較便捷,容易攜帶,根本就不會忘記,而且使用的設備也簡單,只需要對著麥克風簡單說幾句就可以了,也極大的提高了使用的B格。隨著使用者的資料資源增多,系統和使用者對聲紋識別的要求也越來越高,首先要求判斷時間短,內容自訂等等。當然,機器也可以利用移動互聯網的大資料來進行深度學習提高自己的效率,準確度。
在未來,聲紋識別技術可能在智慧手機端普及開來。但我們要說的是,其實真正阻礙其發展的可能不是技術的問題,而是人的問題。比如,人的聲音是善變的,會隨著身體狀況、年齡、情緒等變化。其次,也不太符合人的使用場景,比如在地鐵、街上等公共場合。
只是,在智慧手機這一塊還沒有普及過來,這背後是成本和技術考量。那聲紋技術作為一種安全身份驗證手段,不可避免的也會面臨著非法的攻擊。比如,熟人模仿、錄音重放、軟體合成等,但都有解決方案
熟人模仿這一塊,雖然有時候我們很難用耳朵來識別模仿秀,但電腦是可以識別的,就像眼鏡看不到的顏色,但PS可以選中。而對於錄音重放,通常使用活體檢測與內容識別來進行防範,活體堅持當前生源來源是錄音器還是人,內容識別是第一次驗證時就用指定內容,那隨意的錄音就不能通過。
軟體合成就是大威脅了,近年來的類似穀歌的WavNet和Adobe Project VoCo等技術,極大的提高了合成聲音的相似度。畢竟都是記錄、驗證都是電腦。那這也是為了這項技術的發展方向和人工智慧發展的必要。
聲紋識別技術的使用比較便捷,容易攜帶,根本就不會忘記,而且使用的設備也簡單,只需要對著麥克風簡單說幾句就可以了,也極大的提高了使用的B格。隨著使用者的資料資源增多,系統和使用者對聲紋識別的要求也越來越高,首先要求判斷時間短,內容自訂等等。當然,機器也可以利用移動互聯網的大資料來進行深度學習提高自己的效率,準確度。
在未來,聲紋識別技術可能在智慧手機端普及開來。但我們要說的是,其實真正阻礙其發展的可能不是技術的問題,而是人的問題。比如,人的聲音是善變的,會隨著身體狀況、年齡、情緒等變化。其次,也不太符合人的使用場景,比如在地鐵、街上等公共場合。