您的位置:首頁>科技>正文

Google發佈視聽語音分離技術 可取出影片中的人物語言

玩懂手機網4月14日消息, 穀歌發佈了一個叫做Audio-Visual Speech Separation視聽語音分離技術, 能夠通過分析影片中人物聲音的特徵, 將影片中人物聲音分離成獨立音軌, 可以讓觀眾自由選擇聽哪位人物的聲音。

穀歌研發團隊在《Looking to Listen at the Cocktail Party》中, 表示通過深度學習聲音, 圖像模型分離語音的技術, 對影片中特定人物的音質進行強化, 並消除其它人的聲音和環境音。

這個技術可以可以分析影片中的圖像和聲音, 通過自動辨別人物表情的變化, 提升辨別的精准度, 同時它也能應用於一般單聲道影片, 系統會自動辨別影片中的人物與聲音, 觀眾需要做的只要點選影片中出現的人臉, 就能夠聽到他的聲音。

Next Article
喜欢就按个赞吧!!!
点击关闭提示