華文網

小度在家亮相GMIC大會 百度揭東輝:產品體驗是核心

“產品體驗是推動人機交互變革的核心突破口。”4月26日,在GMIC全球移動互聯網大會“全球創新硬體產品秀”分論壇上,百度度秘事業部智能生態副總經理揭東輝在演講時表示,在AI時代,

逐漸成熟的智慧語音交互技術讓人機對話模式變得更加智慧,將智慧設備的使用者滲透推向新高,也讓使用者使用智慧設備的門檻越來越低。

(百度度秘事業部智能生態副總經理揭東輝)

除了AI語音技術,產品體驗是一個核心要素。揭東輝說,產品體驗是讓DuerOS真正落到實處,

滲透到生活中的根本原因。產品體驗是分場景的,包括手機、電視、車載等等場景的滲入和設備的搭載,都是DuerOS能夠走進用戶生活的原因。自2017年7月正式發佈以來,DuerOS的合作夥伴數量已經超過了160家、搭載DuerOS落地的主控設備也超過了80餘款,DuerOS落地硬體解決方案超過20個。

百度3月重磅推出的國內首款智慧視頻音箱小度在家是揭東輝帶到GMIC的創新AI硬體。他表示,AI時代,

光做上層的OS、應用層遠遠不夠,更需要軟硬體結合,讓AI能力在產品上體現出來。小度在家就是一款集智慧音箱、智慧電視和可視電話于一身的創新性產品,它突破了以往使用者與設備的交互體驗,承載著“讓全家人享受到科技樂趣”的使命。

以下是揭東輝演講實錄:

揭東輝:今天分享的主題叫做“為AI發聲,智領未來”。

如果我們把時間軸往前挪一挪,AI在電腦發明的時候,那時候大家就往這方面探索,

那時候整個交互系統還是很不好用,最早是鍵盤,後面發明了滑鼠。這種情況下大家對科技還有很高的熱情,到了移動交互時代,大家認為手機是解決日常生活的工具。會把手機握到手上,除了它的功能很強大,另外一個層次是原因它還是很好用,手指點就可以了,點到的東西就是你要的東西。

到最近AI這個時代,我們現在開始語音交互的技術越來越成熟,

這種情況下對話模式變成越來越智慧,使用門檻越來越低,所以它的用戶滲透會越來越高。這種情況下我們做了我們的DuerOS。這個系統出來以後,我們不再需要找遙控器,不再需要找APP打開看看調用的功能,人用語音跟它交互。這種情況下DuerOS就可以滲透到任何場景裡,比如早上起床,我們可以用智慧音箱鬧鐘喚醒,洗漱的時候可以有一個屏給你推送資訊,車上有可以跟你自然交互的,
上班的時候智慧語音助手,一系列的產品輔助辦公工作,最重要回到家裡,可以原廠交互的電視。小朋友可以用智慧語音玩具跟它做很好的交互。

另外一個很核心的東西是你要有很好的產品體驗,產品體驗才是讓它真正落到實處,滲透到生活中的最根本的原因。大家剛開始用一個產品的時候,一定是說滿足你的功能,是工具性的產品。逐漸到後面你可能會說這個東西挺順手,喜歡用它。一直到好的產品體驗是離不開它,少了它某些功能就缺失了。產品體驗是可以滲透到生活中的基本原因。

產品體驗的核心,我們認為它是分場景的東西,舉個例子,像是手機,大家都不覺得手機需要喚醒功能或者需要強的語音交互功能。但是當我們把手機這個場景放到開車的導航的時候,手被方向盤佔用的時候,就想說導航的手機如果能夠語音操控是多麼好的事情。在這個想法下,會把DuerOS跟場景結合,落實到各種產品裡去。

智慧電視做的應用場景是除了能夠看很多片源以外,可能還會說這個場景裡面主演是誰,配角叫什麼名字,演過什麼電影,或者想說獲取一些配樂是什麼來歷,是什麼曲子。這個東西智慧交互的電視提供的好玩的功能。

有了這麼多功能以後,有很多夥伴問這些功能是不是能為我的產品所用,這個答案是“YES”的,我們所有的能力都會開放出來。我們提供最底層的東西,解決語音交互中的聽清、聽懂、滿足的基本功能。聽清是通過語音聲學技術讓人的聲音能夠很清晰被機器識別。聽懂可以讓一個很長的句子,或者不是很清晰的意圖,能夠被自然語言處理識別出來,明白你所要的需求,到最後的時候一定是它能夠滿足你想要的需求,比如你聽歌,要點外賣,或者獲取資訊,或者只是簡單問天氣。我們構建了100個品類,通過這些滿足用戶的需求。

我剛才說的這些能力分成原生能力,包括百科等等的。協力廠商能夠提供的能力也可以進來。

我們有一個核心層,包含了現在說的語音辨識TTS,知識圖譜、自然語言處理。最上面應用層可以跟廠商合作一起完善的,包括整體的參考設計、硬體的麥克風晶片的選型,工業設計的能力,一直到手機上的交互APP的定制。

DuerOS平臺是去年7月5日發佈的,這個發佈以來到目前為止超過160+合作夥伴,這些合作夥伴分佈在各種管道跟行業,包括電視、家電、玩具、音箱等等的產品,以及智慧家居,各個行業都有落地。我們提供了一些方案,包含了從最小的晶片級的,大約是只能跑小系統,一直到安卓等等,全系列硬體結合的模組。搭載DuerOS能力的產品超過80多種。

我們一直在反覆運算,今年7月份還會有開發者大會,我們還會有更有趣的東西發佈,也歡迎大家7月份一起來參加我們的開發者大會的活動。

我們認為AI時代,光做上層的OS、應用層遠遠不夠,它需要軟硬體結合,就是一定要讓AI跑在產品上才能體現出能力來。突破性的創新產品一定是很好玩的硬體呈現的。

小度在家就是有創新性的硬體交互,首先智慧音箱可以聽音樂、聊天,同時代有智慧電視的屬性,可以看電視的時候瞭解所有的,你可以說當前電視裡面有些什麼人,這些人有什麼人物關係,可以幫你介紹這些東西。甚至你看某個明星,只看某個明星片段,它可以篩選出來。還有智慧手機的屬性,包含移動通訊,或者視頻通訊的能力。這些結合在一起做了小度在家的產品,這個產品我一直想說怎麼描述它,發覺語音描述很難,我可能要說123467有各種的點,好在今天的交互也是帶屏的交互,不是語音的。所以來看大螢幕它有什麼好玩的能力。

我們不會給你介紹這個軟硬體改了多少版,多少人花了多少心血做,今天要分享一下它的一些設計原則,因為我們講是創新產品。

首先一個特點是多模態的交互,當語音很難描述一個東西的時候,你用視頻,多模的方式可以有寬廣的呈現方式。尤其我們這種無屏音箱,在一些應用上本身就有局限性,本身以聽為主,聽是單執行緒,必須專注才能抓到內容。比如問它天氣的狀況,它回答給你可能是很標準的範本,比如天氣晴,最高最低是多少,空氣品質多少,對用戶可能就是一兩個點,是不是下雨了要帶傘,要不要加衣服,這樣有帶屏的呈現就很簡單,秀在平米上,用戶掃一眼就看到了。

多模態的交互另外場景上有很好應用,比如購物場景,語音購物是很不流暢的購物體驗,你沒有商品選擇的權利,也看不到商品長什麼樣。還有跟地圖相關的服務,也只有在帶屏產品上才能呈現出來。

我們會做智慧交互的引導,這是很重要的一個事情,在我們一些資料上來看我們發覺很多無屏產品會看到喚醒以後會有很大比例是突然不知道要問產品什麼樣,有些產品喚醒之後是空語音的狀態能達到30%的比例。我們可能會有很好的內容,有很好藏在後面的東西,但是用戶不知道怎麼獲取,這時候作為一個有屏的引導就很容易做引導交互。

還有一個產品本身是有多屬性的,尤其像在家庭的產品,一定不會只為一個人服務,它應該要有多用戶的設計理念,比如小孩什麼樣的呈現方式,老人用是什麼樣的對話模式。

一二線城市,尤其現代年輕人的家庭結構裡,有4種人物畫像:缺失的爸爸、焦慮的媽媽、失控的小孩、孤獨的老人。我們希望通過小度在家能夠幫我們來解決這種人生活中改善一點點,每天改善一點點,希望能夠給大家更好的體驗。

DuerOS是一個開放的系統,我們希望這套系統提供最基本的軟硬體的能力,大家一起來做上面的差異化,它上面的產品化,然後把創新的產品真正能做到推動萬物爆發,大家都能做出新的好玩的東西。

謝謝大家!

喜歡用它。一直到好的產品體驗是離不開它,少了它某些功能就缺失了。產品體驗是可以滲透到生活中的基本原因。

產品體驗的核心,我們認為它是分場景的東西,舉個例子,像是手機,大家都不覺得手機需要喚醒功能或者需要強的語音交互功能。但是當我們把手機這個場景放到開車的導航的時候,手被方向盤佔用的時候,就想說導航的手機如果能夠語音操控是多麼好的事情。在這個想法下,會把DuerOS跟場景結合,落實到各種產品裡去。

智慧電視做的應用場景是除了能夠看很多片源以外,可能還會說這個場景裡面主演是誰,配角叫什麼名字,演過什麼電影,或者想說獲取一些配樂是什麼來歷,是什麼曲子。這個東西智慧交互的電視提供的好玩的功能。

有了這麼多功能以後,有很多夥伴問這些功能是不是能為我的產品所用,這個答案是“YES”的,我們所有的能力都會開放出來。我們提供最底層的東西,解決語音交互中的聽清、聽懂、滿足的基本功能。聽清是通過語音聲學技術讓人的聲音能夠很清晰被機器識別。聽懂可以讓一個很長的句子,或者不是很清晰的意圖,能夠被自然語言處理識別出來,明白你所要的需求,到最後的時候一定是它能夠滿足你想要的需求,比如你聽歌,要點外賣,或者獲取資訊,或者只是簡單問天氣。我們構建了100個品類,通過這些滿足用戶的需求。

我剛才說的這些能力分成原生能力,包括百科等等的。協力廠商能夠提供的能力也可以進來。

我們有一個核心層,包含了現在說的語音辨識TTS,知識圖譜、自然語言處理。最上面應用層可以跟廠商合作一起完善的,包括整體的參考設計、硬體的麥克風晶片的選型,工業設計的能力,一直到手機上的交互APP的定制。

DuerOS平臺是去年7月5日發佈的,這個發佈以來到目前為止超過160+合作夥伴,這些合作夥伴分佈在各種管道跟行業,包括電視、家電、玩具、音箱等等的產品,以及智慧家居,各個行業都有落地。我們提供了一些方案,包含了從最小的晶片級的,大約是只能跑小系統,一直到安卓等等,全系列硬體結合的模組。搭載DuerOS能力的產品超過80多種。

我們一直在反覆運算,今年7月份還會有開發者大會,我們還會有更有趣的東西發佈,也歡迎大家7月份一起來參加我們的開發者大會的活動。

我們認為AI時代,光做上層的OS、應用層遠遠不夠,它需要軟硬體結合,就是一定要讓AI跑在產品上才能體現出能力來。突破性的創新產品一定是很好玩的硬體呈現的。

小度在家就是有創新性的硬體交互,首先智慧音箱可以聽音樂、聊天,同時代有智慧電視的屬性,可以看電視的時候瞭解所有的,你可以說當前電視裡面有些什麼人,這些人有什麼人物關係,可以幫你介紹這些東西。甚至你看某個明星,只看某個明星片段,它可以篩選出來。還有智慧手機的屬性,包含移動通訊,或者視頻通訊的能力。這些結合在一起做了小度在家的產品,這個產品我一直想說怎麼描述它,發覺語音描述很難,我可能要說123467有各種的點,好在今天的交互也是帶屏的交互,不是語音的。所以來看大螢幕它有什麼好玩的能力。

我們不會給你介紹這個軟硬體改了多少版,多少人花了多少心血做,今天要分享一下它的一些設計原則,因為我們講是創新產品。

首先一個特點是多模態的交互,當語音很難描述一個東西的時候,你用視頻,多模的方式可以有寬廣的呈現方式。尤其我們這種無屏音箱,在一些應用上本身就有局限性,本身以聽為主,聽是單執行緒,必須專注才能抓到內容。比如問它天氣的狀況,它回答給你可能是很標準的範本,比如天氣晴,最高最低是多少,空氣品質多少,對用戶可能就是一兩個點,是不是下雨了要帶傘,要不要加衣服,這樣有帶屏的呈現就很簡單,秀在平米上,用戶掃一眼就看到了。

多模態的交互另外場景上有很好應用,比如購物場景,語音購物是很不流暢的購物體驗,你沒有商品選擇的權利,也看不到商品長什麼樣。還有跟地圖相關的服務,也只有在帶屏產品上才能呈現出來。

我們會做智慧交互的引導,這是很重要的一個事情,在我們一些資料上來看我們發覺很多無屏產品會看到喚醒以後會有很大比例是突然不知道要問產品什麼樣,有些產品喚醒之後是空語音的狀態能達到30%的比例。我們可能會有很好的內容,有很好藏在後面的東西,但是用戶不知道怎麼獲取,這時候作為一個有屏的引導就很容易做引導交互。

還有一個產品本身是有多屬性的,尤其像在家庭的產品,一定不會只為一個人服務,它應該要有多用戶的設計理念,比如小孩什麼樣的呈現方式,老人用是什麼樣的對話模式。

一二線城市,尤其現代年輕人的家庭結構裡,有4種人物畫像:缺失的爸爸、焦慮的媽媽、失控的小孩、孤獨的老人。我們希望通過小度在家能夠幫我們來解決這種人生活中改善一點點,每天改善一點點,希望能夠給大家更好的體驗。

DuerOS是一個開放的系統,我們希望這套系統提供最基本的軟硬體的能力,大家一起來做上面的差異化,它上面的產品化,然後把創新的產品真正能做到推動萬物爆發,大家都能做出新的好玩的東西。

謝謝大家!