您的位置:首頁>科技>正文

在這個行業首次聚焦語音智慧的主題峰會上,我們思考語音技術對智慧硬體提出的新挑戰 | WARE 2017

幾年前, 我們談起人工智慧或者機器人的時候, 首先想到的可能還是 AI、終結者、駭客帝國、裡虛幻的形象。 我們以為人工智慧還只是存在於科幻電影裡, 但當我們一次一次的被這些大片震撼時, 我們發現, 其實, 人工智慧, 已經走進了我們的生活裡。

如今, 以 Alexa 為代表的語音智慧終端機設備, 憑藉著「智慧」與「連接」, 逐漸出現在大眾的視野。 有人把它看成是鋼鐵俠中 JARVIS 那樣的虛擬管家, 也有人認為它提供了新的對話模式和交互介面…… 而應運而生的各種平臺、技術、集成方案, 也讓這個生態更加的繁榮。

2015 年 4 月 11 日,

我們在深圳舉辦了第一屆以硬體創新為主題的千人大會(查看大會圖文回顧);去年的 4 月 16 日, 在「WARE 2016 新硬體生態大會」上, 我們重新定義了「新硬體」(查看大會圖文回顧)。 時隔一年, WARE 大會將迎來一些新的變化, 我們將大會拆分了分期舉辦的、更加聚焦的多場分論壇, 緊跟科技創新和硬體行業的變化與趨勢, 並著眼技術和產品的商業化落地。

2017 年 4 月 15 日, 我們在深圳灣召開的「WARE 2017 語音智慧平臺與應用峰會」, 是「WARE 2017」的系列峰會之一, 也是行業首次聚焦語音智慧平臺與應用的主題會議。

本次會議, 深圳灣邀請到了來自國內外的語音技術提供商、硬體廠商的專家, 包括搜狗公司語音交互技術中心總經理王硯峰、瑞聲科技研發總監張金宇、Amazon Alexa 資深架構師 Travis Grizzel、Omate 品牌創始⼈兼 CEO Laurent Le Pen、優必選 Alpha 產品線負責人梁嘉豪、古古美美品牌創始人童建超, 為與會的行業精英分享最新的語音智慧平臺技術和硬體產品開發經驗。

搜狗王硯峰:面對 3/1000 的語音智慧市場, 語音助手核心要解決體驗問題

我們在使用語音產品時, 語音技術只是讓設備「聽得見」我們的聲音, 但是要讓設備「聽得懂」使用者話中的資訊, 並且能夠準確的回答用戶提出的問題, 那就是另外一回事了。

所以, 王硯峰總結:「語言才是思想和知識的載體, 語音只是圍繞在語言這個核心上面的路徑, 未來人工智慧能領域的發展重心,

一定會慢慢地從語音偏向語言。 」

現在小米、魅族、百度等各個移動平臺上的語音系統日活總數是 200 萬, 而智能手機的量是 8.7 億台, 智慧手機使用語音助手的比例還不到 3/1000, 這是一個令人尷尬的數字。 如何解決用戶的實際問題, 提升用戶體驗的滿足感, 王硯峰給出了如下幾條建議:

第一, 優化語音辨識準確率, 這包括遠場識別、雜訊處理、口音處理等多個方面。 不過, 這幾年語音辨識技術的進步顯而易見, 通過大資料、語音增強技術、麥克風整列的融合, 這些問題已經得到很好的解決。
第二, 設計 + 工程化。 由於機器無法像人類一樣掌握語言, 所以需要對設備使用者體驗以及工程實現進行設計, 方便人機交流。

第三, 場景化、功能化、知識化。 為了讓語音產品更加好用, 需要在垂直領域對知識進行整理, 從而達到最好的體驗。
第四, 解決語言問題本身的難題。 其實, 對於語言的理解, 最根本的還是靠技術和資料。

瑞聲科技張金宇:從傳統麥克風到智慧麥克風, 語音硬體產品首要解決的是功耗問題

語音是最自然的對話模式,能夠解放用戶的雙手,並且隨時隨地工作,給我們回饋和資訊支援。

對於老人和小孩來說,語音也是最適合的對話模式。他們很難瞭解最先進的技術,也很難操控智慧家電,而語音技術能夠讓一些不太瞭解這些數碼設備的人群,去很好地享受智慧設備帶來的便捷。

然而,為了滿足智慧交互的需求,語音技術在底層硬體上仍面臨著很多挑戰。

張金宇總結:「要讓語音設備全天候待命,首先要解決的就是功耗問題。」

為了解決功耗的問題,瑞聲開發了一款智慧麥克風,其中耗電比較大的模組在不工作的時處於休眠狀態,從而節省電量的消耗。這款智慧麥克風最低可以做到 100 微安的功率,相當於從 99% 到 100% 的推進,可以真正地讓使用者不需要去顧慮這個功耗的問題。並且,這款麥克風陣列尺寸足夠小,能夠直接集成到語音設備裡。

另外,張金宇強調,不論是音訊硬體還是演算法的解決方案,都需要在技術提供商和客戶共同的努力下才能夠實現最切合應用場景的解決方案。

亞馬遜 Travis Grizzel :Alexa 的優勢不在於現在能做什麼,而是以後能做什麼

語音交互是一種自然而有力的對話模式,它的應用空間十分巨大。如今,通過技術可以將語音編碼成機器所能理解的指令,並且能讓機器去學習使用它。

亞馬遜 Alexa 資深架構師 Travis Grizzel 說:「自 2014 年亞馬遜推出 Alexa 以來,該語音技術已經廣泛應用于以智慧家居為主的硬體產品中。」國內外科技媒體對 Alexa 也是一片讚譽,其中,Travis Grizzel 最喜歡的一條媒體評論是 —— 「Alexa 的優勢不在於現在能做什麼,而是以後能做什麼。」

智慧硬體產品植入 Alexa 語音技術,能夠獲得更高的「智慧」。從亞馬遜自家的 Echo 來看,它可以用於控制家裡的智慧家居設備,如果使用者想在亞馬遜網站上購買商品,也可以通過 Alexa 直接實現,訂購食物和外賣也只是分分鐘的事情。

另外,亞馬遜的 Alexa 服務是開放和免費的,開發者可以用 Alexa 做出深入應用場景的解決方案,比如在汽車駕駛中,Alexa 的語音方案就有很廣闊的應用空間。

在未來,Alexa 會更加開放,Echo 內部使用的元件也會逐漸開放給亞馬遜的合作夥伴,幫助他們快速打造自身的產品。

Omate Laurent Le Pen: Alexa 給智慧手錶廠商帶來的機遇與挑戰

智慧手錶廠商 Omate 的創始人 Laurent 來自法國,他的公司從四年前就開始做智慧手錶。

起初,無論是資本還是市場,都不看好 Omate 的產品,但 Laurent 卻對智慧手錶的執念頗深。經過了無數次的推翻和重新設計,Omate 智慧手錶終於在 2013 年的 4 月份上線 Kickstarter,並成功籌集了近 100 萬美金。

雖然得到了用戶的認可,資本市場也慢慢改變了對 Omate 的看法,但是,在蘋果智慧手錶的熱賣,以及來自中國大量競品的雙重擠壓下,留給 Omate 的市場份額越來越小,Omate 再次陷入了困境。

此時,美國的亞馬遜開始與 Omate 聯繫,希望將 Alexa 植入他們的智慧手錶產品中。通過亞馬遜的 Alexa 語音技術,Omate 的智慧手錶再一次得到升級。為了讓 Alexa 在智慧手錶上能夠提供更好的服務體驗,Laurent 從產品底層開始優化,以符合 Alexa 的認證。

Laurent 補充:「通過和 Alexa 的合作,我們找到了新的發展方向 —— 説明客戶的產品去對接 Alexa 服務,比如,我們就為德國的一家機器人公司的產品做了 Alexa 語音技術的融合服務。」

優必選梁嘉豪:集成 Alexa 技術,智慧型機器人探索海外當地語系化之路

在國內,做智慧硬體的廠商很多,其中有不少出口國外的產品,當搭載語音交互功能的產品在進入海外市場時,國內廠商不得不面對語音交互的本土化問題。

優必選自成立以來,就已經把走過的路和淌過的水全經歷了一遍,對於語音技術的海外當地語系化探索,自然有獨到的經驗。

梁嘉豪認為,語音技術海外當地語系化主要面臨三個問題:

語言當地語系化:語言當地語系化包括喚醒、ASR/TTS、NLP/NLU 個三方面,其中,喚醒指的是需要對喚醒詞進行外文轉化,NLP/NLU 則需要運用海量的本地資料進行訓練。
內容當地語系化:包括考慮新聞、故事、時區、音樂、天氣、版權等的當地屬性。
雲服務當地語系化:即伺服器部署地的問題。若國內產品在國外使用時,依舊走國內伺服器通道,則難以為用戶提供良好的體驗。

對於想要拓展海外市場的創業公司來講,Alexa 是個不錯的選擇。Alexa 的麥克風陣列可以提供良好的用戶體驗,以及科學完整的內容指引,同時,在開發的過程中,Alexa 也能夠提供大量的資料樣本,對產品的聲學模型進行訓練。

要注意的是,目前廠商從向 Amazon 提交申請到最終讓產品接入 Alexa 的時長大概為 2 個月,但隨著越來越多廠商的申請接入,申請週期將會延長。

古古美美童建超:無論技術怎麼改變,本質上都是對產品的打磨和提升

語音技術已經成為機器「智慧」的入口,不少傳統廠商也將智慧語音的接入作為轉型升級的一個重要戰略。

2012 年,古古美美產品線開始向 WiFi 音箱轉型,也正是海爾、美的等家電廠商相繼將 WiFi 模組應用到智慧家居的時期。據童建超介紹,古古美美之所以選擇 WiFi 音箱這個轉型方向,是因為考慮到音箱能發揮 WiFi 一對多連接、遠距離傳輸的優勢,實現遠場操控、多房間使用的功能。另外,相比空調、冰箱等設備,音箱天生所具備的音訊輸出口可實現與人交互。

古古美美的音箱在升級換代的過程中「不免俗」地集成了協力廠商的智慧技術,比如第三代音箱產品就接入了阿裡智慧,第四代音箱產品則搭載了 Alexa 語音技術。

童建超認為,古古美美產品的本質是一個音箱,所以確保有良好的音質是他們首先要考慮問題,無論技術怎樣升級,最終都是要體現在產品和服務上。

通過對音箱產品的不斷打磨,古古美美的音箱得到了不錯的市場回饋。在 Amazon 購物網站上,古古美美第四代音箱產品 E5 的星級達到了 4.7,高於同類產品亞馬遜 Echo 的 4.4 星級。

尾聲:

人工智慧已經成為科技領域一劑強有力的興奮劑,而隨之蓬勃而起的語音技術逐漸成為機器「智慧」的入口。語音技術的快速發展,能讓機器更好地與人交互,幫助機器更好的認知世界。因為機器唯有探測到、看懂、聽懂、讀懂這個世界,才能將其「智慧」落到實處,真正為人類服務。

本次大會是深圳在「人工智慧+硬體」的創新嘗試,現場我們收穫了很多與會者對大會主題和內容的肯定。時間倉促,以及嘉賓人選等因素,我們未能呈現更多我們原本計畫呈現的內容,這些我們將在後續的「WARE 2017」系列峰會中,為大家逐一呈現。最後,感謝大會的場地支持方中誠·COMPASS,在 5 天的時間裡協助我們籌備這次會議;感謝各位嘉賓親臨現場做分享,感謝深圳灣的鐵杆粉兒們購票參會!我們很快會再見!(@深圳灣)

語音是最自然的對話模式,能夠解放用戶的雙手,並且隨時隨地工作,給我們回饋和資訊支援。

對於老人和小孩來說,語音也是最適合的對話模式。他們很難瞭解最先進的技術,也很難操控智慧家電,而語音技術能夠讓一些不太瞭解這些數碼設備的人群,去很好地享受智慧設備帶來的便捷。

然而,為了滿足智慧交互的需求,語音技術在底層硬體上仍面臨著很多挑戰。

張金宇總結:「要讓語音設備全天候待命,首先要解決的就是功耗問題。」

為了解決功耗的問題,瑞聲開發了一款智慧麥克風,其中耗電比較大的模組在不工作的時處於休眠狀態,從而節省電量的消耗。這款智慧麥克風最低可以做到 100 微安的功率,相當於從 99% 到 100% 的推進,可以真正地讓使用者不需要去顧慮這個功耗的問題。並且,這款麥克風陣列尺寸足夠小,能夠直接集成到語音設備裡。

另外,張金宇強調,不論是音訊硬體還是演算法的解決方案,都需要在技術提供商和客戶共同的努力下才能夠實現最切合應用場景的解決方案。

亞馬遜 Travis Grizzel :Alexa 的優勢不在於現在能做什麼,而是以後能做什麼

語音交互是一種自然而有力的對話模式,它的應用空間十分巨大。如今,通過技術可以將語音編碼成機器所能理解的指令,並且能讓機器去學習使用它。

亞馬遜 Alexa 資深架構師 Travis Grizzel 說:「自 2014 年亞馬遜推出 Alexa 以來,該語音技術已經廣泛應用于以智慧家居為主的硬體產品中。」國內外科技媒體對 Alexa 也是一片讚譽,其中,Travis Grizzel 最喜歡的一條媒體評論是 —— 「Alexa 的優勢不在於現在能做什麼,而是以後能做什麼。」

智慧硬體產品植入 Alexa 語音技術,能夠獲得更高的「智慧」。從亞馬遜自家的 Echo 來看,它可以用於控制家裡的智慧家居設備,如果使用者想在亞馬遜網站上購買商品,也可以通過 Alexa 直接實現,訂購食物和外賣也只是分分鐘的事情。

另外,亞馬遜的 Alexa 服務是開放和免費的,開發者可以用 Alexa 做出深入應用場景的解決方案,比如在汽車駕駛中,Alexa 的語音方案就有很廣闊的應用空間。

在未來,Alexa 會更加開放,Echo 內部使用的元件也會逐漸開放給亞馬遜的合作夥伴,幫助他們快速打造自身的產品。

Omate Laurent Le Pen: Alexa 給智慧手錶廠商帶來的機遇與挑戰

智慧手錶廠商 Omate 的創始人 Laurent 來自法國,他的公司從四年前就開始做智慧手錶。

起初,無論是資本還是市場,都不看好 Omate 的產品,但 Laurent 卻對智慧手錶的執念頗深。經過了無數次的推翻和重新設計,Omate 智慧手錶終於在 2013 年的 4 月份上線 Kickstarter,並成功籌集了近 100 萬美金。

雖然得到了用戶的認可,資本市場也慢慢改變了對 Omate 的看法,但是,在蘋果智慧手錶的熱賣,以及來自中國大量競品的雙重擠壓下,留給 Omate 的市場份額越來越小,Omate 再次陷入了困境。

此時,美國的亞馬遜開始與 Omate 聯繫,希望將 Alexa 植入他們的智慧手錶產品中。通過亞馬遜的 Alexa 語音技術,Omate 的智慧手錶再一次得到升級。為了讓 Alexa 在智慧手錶上能夠提供更好的服務體驗,Laurent 從產品底層開始優化,以符合 Alexa 的認證。

Laurent 補充:「通過和 Alexa 的合作,我們找到了新的發展方向 —— 説明客戶的產品去對接 Alexa 服務,比如,我們就為德國的一家機器人公司的產品做了 Alexa 語音技術的融合服務。」

優必選梁嘉豪:集成 Alexa 技術,智慧型機器人探索海外當地語系化之路

在國內,做智慧硬體的廠商很多,其中有不少出口國外的產品,當搭載語音交互功能的產品在進入海外市場時,國內廠商不得不面對語音交互的本土化問題。

優必選自成立以來,就已經把走過的路和淌過的水全經歷了一遍,對於語音技術的海外當地語系化探索,自然有獨到的經驗。

梁嘉豪認為,語音技術海外當地語系化主要面臨三個問題:

語言當地語系化:語言當地語系化包括喚醒、ASR/TTS、NLP/NLU 個三方面,其中,喚醒指的是需要對喚醒詞進行外文轉化,NLP/NLU 則需要運用海量的本地資料進行訓練。
內容當地語系化:包括考慮新聞、故事、時區、音樂、天氣、版權等的當地屬性。
雲服務當地語系化:即伺服器部署地的問題。若國內產品在國外使用時,依舊走國內伺服器通道,則難以為用戶提供良好的體驗。

對於想要拓展海外市場的創業公司來講,Alexa 是個不錯的選擇。Alexa 的麥克風陣列可以提供良好的用戶體驗,以及科學完整的內容指引,同時,在開發的過程中,Alexa 也能夠提供大量的資料樣本,對產品的聲學模型進行訓練。

要注意的是,目前廠商從向 Amazon 提交申請到最終讓產品接入 Alexa 的時長大概為 2 個月,但隨著越來越多廠商的申請接入,申請週期將會延長。

古古美美童建超:無論技術怎麼改變,本質上都是對產品的打磨和提升

語音技術已經成為機器「智慧」的入口,不少傳統廠商也將智慧語音的接入作為轉型升級的一個重要戰略。

2012 年,古古美美產品線開始向 WiFi 音箱轉型,也正是海爾、美的等家電廠商相繼將 WiFi 模組應用到智慧家居的時期。據童建超介紹,古古美美之所以選擇 WiFi 音箱這個轉型方向,是因為考慮到音箱能發揮 WiFi 一對多連接、遠距離傳輸的優勢,實現遠場操控、多房間使用的功能。另外,相比空調、冰箱等設備,音箱天生所具備的音訊輸出口可實現與人交互。

古古美美的音箱在升級換代的過程中「不免俗」地集成了協力廠商的智慧技術,比如第三代音箱產品就接入了阿裡智慧,第四代音箱產品則搭載了 Alexa 語音技術。

童建超認為,古古美美產品的本質是一個音箱,所以確保有良好的音質是他們首先要考慮問題,無論技術怎樣升級,最終都是要體現在產品和服務上。

通過對音箱產品的不斷打磨,古古美美的音箱得到了不錯的市場回饋。在 Amazon 購物網站上,古古美美第四代音箱產品 E5 的星級達到了 4.7,高於同類產品亞馬遜 Echo 的 4.4 星級。

尾聲:

人工智慧已經成為科技領域一劑強有力的興奮劑,而隨之蓬勃而起的語音技術逐漸成為機器「智慧」的入口。語音技術的快速發展,能讓機器更好地與人交互,幫助機器更好的認知世界。因為機器唯有探測到、看懂、聽懂、讀懂這個世界,才能將其「智慧」落到實處,真正為人類服務。

本次大會是深圳在「人工智慧+硬體」的創新嘗試,現場我們收穫了很多與會者對大會主題和內容的肯定。時間倉促,以及嘉賓人選等因素,我們未能呈現更多我們原本計畫呈現的內容,這些我們將在後續的「WARE 2017」系列峰會中,為大家逐一呈現。最後,感謝大會的場地支持方中誠·COMPASS,在 5 天的時間裡協助我們籌備這次會議;感謝各位嘉賓親臨現場做分享,感謝深圳灣的鐵杆粉兒們購票參會!我們很快會再見!(@深圳灣)

Next Article
喜欢就按个赞吧!!!
点击关闭提示