您的位置:首頁>科技>正文

助聽設備降噪技術新思路?

研究人員開發出一種深度學習系統, 能夠説明電腦在嘈雜環境下識別和分離語音。 和以往的降噪機制不同, 這次, 是真的完全將聲音剝離解析, 理論上, 只要我們願意, 我們可以在任何嘈雜環境中聽到我們想要的聲音。 這種技術一旦商業化, 將促使助聽器或人工耳蝸進行重大升級。

研究人員通過自我學習機制的人工智慧系統, 類比出人類大腦的“雞尾酒會效應”, 所謂“雞尾酒會效應”, 就是在嘈雜環境中, 兩人的談話會忽略背景中的其他對話或噪音。 對於健聽人士來說, 這是一種天生的聲音選擇能力,

我們的大腦自然會判斷有用的資訊。

但是對於聽障人士來說, 在嘈雜環境下分辨資訊是有困難的, 這主要是由於我們的助聽設備分析聲音降噪機制限制和我們大腦的判斷能力缺失, 雖然雙側同時有效干預能讓我們在嘈雜環境下更好的聆聽, 但仍有部分人無法識別多人語言環境中的其中一人講話。

穀歌採用了一種獨特的視聽模式, 將視頻中多人對話的語言剝離分析, 通過演算法, 分離單音軌視頻中的語音, 然後手動選擇這個人的語音, 那麼你就會只聽到這個人的語音, 同時可以適當開啟其他聲音, 調節到不影響聽主要語音的程度。 這聽起來並不難, 但傳統上我們需要手動剝離音軌, 而穀歌的研發,

則是完全交給了人工智慧, 這樣可以在極短時間內, 完成全部操作。

聽覺系統

人類聽覺系統及其複雜, 當我們在雜訊中交談時, 我們可以完全忽略雜訊, 這並非我們聽不到雜訊, 而是不想聽, 這種可以自我選擇的能力有著非常複雜的機制。 如果由人工智慧來模仿大腦, 在一個充滿干擾的環境中(例如到處都有其他的人在說話), 將注意力集中在一個單獨的物體(例如某一個人)的時候會發生什麼?

人工智慧模型通常很難以相同的效果調整外部輸入, 特別是當包含多個聲音的音訊流時更是如此。 這已被證明是語音辨識領域的主要挑戰, 這是當今神經網路的主要應用領域之一。

Next Article
喜欢就按个赞吧!!!
点击关闭提示