您的位置:首頁>科技>正文

人工智慧大爆發!語音辨識才是敲門磚!

在此前結束的兩會政府報告中, 人工智慧首次被提及, 讓這個本就在風口的行業再次引來矚目。 人工智慧最早被運用於電腦領域, 後隨著科技發展與人類需求, 才開始逐漸滲透到其他行業。 根據去年發佈的《全球人工智慧報告》, 人工智慧的主要應用集中在個人助理、安防、自駕領域、醫療健康、電商零售、金融、教育這七個方面。

人工智慧爆發 智慧語音技術被廣泛應用

▲李世石大戰穀歌AlphaGo

2016年是人工智慧爆發元年, 年初穀歌“AlphaGo”以4:1大勝李世石, 年末化身“Master”無一敗局橫掃圍棋屆, 其爆發速度可見一斑。 而作為最常見的人工智慧技術——語音助理也早已經在手機、電視、電腦等數碼設備上被廣泛應用, 我們熟知的蘋果Siri, 微軟Cortana以及備受好評的亞馬遜Alexa 都是人工智慧技術的具體展現。

▲小米人工智慧語音電視

而在電視行業, 率先將人工智慧技術系統運用並推廣普及的當屬小米公司。 2016年9月27日, 小米發佈了旗下首款人工智慧電視小米電視3S, 搭載“PatchWall 拼圖牆”人工智慧系統, 通過大資料的收集以及深度學習感知不同家庭人員的偏好, 快速精准的推送適合的個性內容, 將千人有千面變為現實。 而在上周, 也就是2017年3月21日,

小米再次在人工智慧上邁出了一大步, 全新系列電視產品小米電視4A搭載了人工智慧語音功能, 將智慧語音與液晶電視完美結合。 一直以來讓機器聽懂人類語言這個夢想, 在小米電視4A上得到了初步實現。

科技巨頭大力發展人工智慧語音技術

人工智慧語音的實現通常有兩種方式。 第一種, 通過固定的程式邏輯, 多次執行類似“if...then”這樣的規則, 另一種則是通過“深度學習”演算法, 不斷進行自身優化。 毫無疑問, 後者是目前人工智慧語音的發展趨勢。

▲蘋果蘋果Siri

科技巨頭蘋果也在大力發展語音辨識技術, 截止2016年已經先後收購了15家人工智慧公司, 蘋果Siri也因此不斷升級進化。 目前, 蘋果Siri已經能夠識別36個國家的21種本地語言, 包括中國上海話、四川話以及東北話, 是目前識別語言最多的智慧語音助理。 近期還有消息傳出, 蘋果將對Siri進行一次革命性的升級, 升級成功後的蘋果Siri將能夠聯繫上下文背景, 對用戶的提問做出精准的回復。 另外, Siri還能控制連結到蘋果智慧家居平臺HomeKit上的所有設備,

諸如“打開二樓所有的燈”“把臥室空調溫度調到27°”等命令, 蘋果Siri都能做出正確的回饋。 目前, 這種類似人類神經網路的語音辨識演算法已經被廣泛應用。

▲亞馬遜Aleax

亞馬遜就將神經網路演算法成功運用到了的Aleax上, 通過麥克風收集各種聲音, 然後進行特徵提取,即使是在人員眾多的場合,Aleax也能通過連續的語音合成技術,準確的將聲音轉換為文本,然後轉換成音素和波形,最後經過演算法處理,實現精准無誤的回答,成功解決“雞尾酒會問題”(既說話的人數為兩人或者多人時,語音辨識率就會極大降低)。此外,亞馬遜最近還為Aleax增加了主動和使用者對話這個新功能,在有新資訊推送或者事情處理完畢都會主動得到Aleax的語音提醒,這些不可思議的神奇功能讓諸多語音產品在它面前黯然失色。小到家庭關燈,大到遠端啟動汽車,亞馬遜Aleax已然成為智慧語音行業的霸主。

▲微軟Cortana

而微軟Cortana與上述兩者有所不同,在與Cortana的語音交互中,它表現的更像是一個充滿“人性”的助手,其機智的回答總會讓你忍俊不禁。唱歌、聊天、講笑話,模仿、遊戲、繞口令,微軟Cortana帶有感情色彩且詼諧幽默的回答或是微軟實現真人語音交流的第一步。當然,微軟Cortana最大特點還是跨平臺使用,上午在家告訴小娜晚上要買麵包,當你晚上回來路過超市時,小娜就會通過手機提醒你;當你有一個會議的日程,小娜會在開會期間自動將你的手機設置為靜音模式……

人工智慧未來發展大有可期

語音辨識作為人工智慧技術的組成部分,現已經基本擺脫早期答非所問的尷尬局面,精准的自然語言處理能力以及清晰的邏輯判斷能力,讓它能夠輕鬆自如的應付多輪語音交互以及方言口音識別。小米電視4A更是結合了自身的人臉演算法、圖像理解等人工智慧技術,會上小米王川針對電影《從你的全世界路過》進行了演示,“跳轉到41分31秒”、“這是誰”、“這是什麼手機”、“嶽雲鵬追車的畫面”、“鄧超和張天愛第一次出現的鏡頭”等複雜的語音指令,小米電視4A都給出了精准的答覆。小米王川也在發佈會上坦言,目前這只是一些“探索性的工作,還沒有真正量產化”。言下之意,目前僅這一部電影可完美實現“人工智慧語音”功能。儘管該技術尚有局限性,但是其未來發展前景值得期待。

在前不久舉行的2017MWC上,軟銀CEO孫正義就表示,未來30年,是機器人與人類共舞的時代。可以想像一下身處在未來人工智慧時代的我們,清晨被音樂喚醒,出門被提醒帶鑰匙和錢包,汽車是自動駕駛,與遠方朋友交流是虛擬影像……,無處不在的人工智慧技術以及觸手可及的人工智慧設備將越來越懂得人類的情感與需求。

然後進行特徵提取,即使是在人員眾多的場合,Aleax也能通過連續的語音合成技術,準確的將聲音轉換為文本,然後轉換成音素和波形,最後經過演算法處理,實現精准無誤的回答,成功解決“雞尾酒會問題”(既說話的人數為兩人或者多人時,語音辨識率就會極大降低)。此外,亞馬遜最近還為Aleax增加了主動和使用者對話這個新功能,在有新資訊推送或者事情處理完畢都會主動得到Aleax的語音提醒,這些不可思議的神奇功能讓諸多語音產品在它面前黯然失色。小到家庭關燈,大到遠端啟動汽車,亞馬遜Aleax已然成為智慧語音行業的霸主。

▲微軟Cortana

而微軟Cortana與上述兩者有所不同,在與Cortana的語音交互中,它表現的更像是一個充滿“人性”的助手,其機智的回答總會讓你忍俊不禁。唱歌、聊天、講笑話,模仿、遊戲、繞口令,微軟Cortana帶有感情色彩且詼諧幽默的回答或是微軟實現真人語音交流的第一步。當然,微軟Cortana最大特點還是跨平臺使用,上午在家告訴小娜晚上要買麵包,當你晚上回來路過超市時,小娜就會通過手機提醒你;當你有一個會議的日程,小娜會在開會期間自動將你的手機設置為靜音模式……

人工智慧未來發展大有可期

語音辨識作為人工智慧技術的組成部分,現已經基本擺脫早期答非所問的尷尬局面,精准的自然語言處理能力以及清晰的邏輯判斷能力,讓它能夠輕鬆自如的應付多輪語音交互以及方言口音識別。小米電視4A更是結合了自身的人臉演算法、圖像理解等人工智慧技術,會上小米王川針對電影《從你的全世界路過》進行了演示,“跳轉到41分31秒”、“這是誰”、“這是什麼手機”、“嶽雲鵬追車的畫面”、“鄧超和張天愛第一次出現的鏡頭”等複雜的語音指令,小米電視4A都給出了精准的答覆。小米王川也在發佈會上坦言,目前這只是一些“探索性的工作,還沒有真正量產化”。言下之意,目前僅這一部電影可完美實現“人工智慧語音”功能。儘管該技術尚有局限性,但是其未來發展前景值得期待。

在前不久舉行的2017MWC上,軟銀CEO孫正義就表示,未來30年,是機器人與人類共舞的時代。可以想像一下身處在未來人工智慧時代的我們,清晨被音樂喚醒,出門被提醒帶鑰匙和錢包,汽車是自動駕駛,與遠方朋友交流是虛擬影像……,無處不在的人工智慧技術以及觸手可及的人工智慧設備將越來越懂得人類的情感與需求。

Next Article
喜欢就按个赞吧!!!
点击关闭提示