您的位置：首頁>科技>正文

Google發佈視聽語音分離技術可取出影片中的人物語言

玩去玩來 2018-04-14 0

玩懂手機網4月14日消息，穀歌發佈了一個叫做Audio-Visual Speech Separation視聽語音分離技術，能夠通過分析影片中人物聲音的特徵，將影片中人物聲音分離成獨立音軌，可以讓觀眾自由選擇聽哪位人物的聲音。

穀歌研發團隊在《Looking to Listen at the Cocktail Party》中，表示通過深度學習聲音，圖像模型分離語音的技術，對影片中特定人物的音質進行強化，並消除其它人的聲音和環境音。

這個技術可以可以分析影片中的圖像和聲音，通過自動辨別人物表情的變化，提升辨別的精准度，同時它也能應用於一般單聲道影片，系統會自動辨別影片中的人物與聲音，觀眾需要做的只要點選影片中出現的人臉，就能夠聽到他的聲音。

同類文章

精品文章

喜欢就按个赞吧!!!

打開Facebook專頁 >>

点击关闭提示

Google發佈視聽語音分離技術 可取出影片中的人物語言