您的位置:首頁>正文

百度度秘兒童創新事業部負責人周華:DuerOS智慧玩具解決方案

12月20日, 由全球領先的兒童科技媒體平臺——極客爸爸主辦的“2018兒童未來創新大會暨2017Jikebaba Awards 頒獎典禮”在上海小南國花園酒店隆重舉行,

百度度秘兒童創新事業部負責人周華先生帶來了有關“智趣·未來, DuerOS智慧玩具解決方案"的精彩分享。 以下為現場速記稿件整理。

周華:今天非常高興能和業內的朋友及專家在一起, 分享一下我們在兒童方向的技術賦能。 這是我今天演講的標題“智趣·未來”, 介紹一下我們百度DuerOS人工智慧平臺。 DuerOS主要是做自然語音的交互, 在現場有很多廠家在使用我們的兒童智慧語音交互平臺。

我們先回顧一下在前面20年人與機器交互演進歷史, 最早的時候在PC時代, 我們跟PC和電腦對話主要是通過鍵盤或者滑鼠, 那個時候門檻還是比較高的, 如果你不會五筆、拼音輸入法, 你很難跟電腦交互。 在2008年開始, 我們進入了一個移動互聯網的時代。 在這個時代主要交互的螢幕就變成了觸控式螢幕, 我們通過手指就能完成非常自然交互。 在AI時代對話模式應該是什麼?人最有效的輸出方式是通過語言, 輸出能力非常高。 所以我們判斷在AI時代, 也許最好的一個交互是靠手勢、語音, 而且語音是一個最高效的輸出方式。

隨著這種對話模式變得越來越自然, 使用它的門檻變得越來越低了。 以前年輕人在用手機, 手機對於小朋友、老人來說, 還是一個非常困難的事情。 到了AI時代用戶受眾越來越多了, 兒童有這個能力通過語音的方式和機器進行交互。

這是百度AI大地圖, 百度從來就是一個偏技術化的公司。 在上面語音的喚醒和識別, 我們投了非常非常多的人力和資源, 我們百度有一個人工智慧團隊。 地圖下面是我們對於在視頻、圖像方面的能力, 比如說像人臉識別、OCR, 還有一些自然語言的處理。 在所有計算的背後, 都少不了大規模機器學習的硬體平臺提供支撐, 目前這個都地圖上所有的能力, 其實都是通過百度都可以找到對應的介面, 去瞭解更多的詳情。

百度AI大地圖

怎麼樣才能做好一個兒童語音交互呢?DuerOS一直在說, 我們做的是人工智慧。 那人工智慧一定要最好能夠理解人類的語言, 能夠理解人類的意圖。 對於兒童來說, 做好兒童的語音交互有三個非常重要的一點, 第一個聽清, 小朋友說的話能夠被機器理解成文字, “我要看西遊記”這五個字能夠正確的被識別出來, 沒有海量的資料你要訓練一個兒童的模型是非常困難的。

我們的語音有一個開放平臺, 它其實在幾年前就已經對外開放了。 從今年11月份的時候, 整個語音開放平臺是對外免費,大家可以去使用。在這個平臺上面,我們之前搜集到了非常非常多的兒童語音資料。通過這些兒童的語音資料加上人工的標注,我們就做出了一個業內非常頂尖的兒童語音辨識引擎。

在聽清楚兒童文字以後,下一步就要對文字進行一個理解,理解兒童語義相對來說是非常非常困難的。我給大家舉一個例子,我們看過很多兒童語言交互的文本,我們發現很多很多的文本有一個特點,基本上在很多場景都出現過,就是掐頭去尾,第一個字少了或者最後一個字少了。“我要聽小蘋”,“小蘋”是什麼?下面一定是小蘋果。

所以對這種兒童語義的理解,要做一個人工的標注然後才能訓練出一個非常好的模型,讓我們的機器能夠理解兒童具體的含義是什麼。還有一個場景比方說成人的表達就是我要聽《黑貓警長》,小朋友可能表達更加直接一些,他就會問黑貓警長。這個時候咱們需要理解他,他到底是想要知道《黑貓警長》的故事,還是要聽《黑貓警長》這首歌,還是說要看《黑貓警長》的動畫呢?這些我們都是在聽懂的基礎上需要做大量的工作,分析用戶場景以後才能得到更加精准的理解。

在聽懂的基礎上,更深層就是要對兒童語音的滿足,他如果有問題我們要能夠精准的回答他。他如果要引用一些內容,我們能夠從海量的內容中最準確的找出那一個內容來。在這裡面我們也可以看到有很多小朋友點播一個內容的時候,不會按照成人的方式點播。

比方說成人會說我要聽周傑倫的《青花瓷》,這首歌很自然的就被點出來了。但是兒童思想會非常跳躍,“蓮花洞”。大家知道蓮花洞是什麼嗎?我要聽“火焰山”,有一些標準可能火焰山能夠找的出來。所以對內容、資源並不是越多就越好,其實要對內容和資源投入非常多的人力和計算,才能挖掘出其中內容知識庫,對兒童請求的滿足。

這個是我們百度DuerOs對外完全開放出來的,一套免費的兒童語言交互服務。在這個平臺上面,我們第一個提供了資訊智慧的檢索,做到有問必答,這主要是針對內容類別的。目前來說有合作方,像喜馬拉雅等,業界還有一些付費內容也在我們平臺上做一個對接。我們在這些內容基礎上面做了非常非常多節目的清洗,把故事、兒歌、國學、百科、英語,這些最常用的分類劃分出來了以後,同時我們還有很多子分類,比方說寓言、成語、歷史、地理,兒童都可以通過語音來點播到。

我們在做兒童方向是今年開始做的,百度積累了非常多的資源,但是兒童方向是從零開始起步。不到一年的時間內,我們打造了一個非常非常棒的兒童智慧百科。這些智慧百科不是從零開始的,大家都知道百度百科有幾億的用戶。在這個使用者的基礎上,我們都對資料、內容都做過一些針對兒童的改造,比如像漢字的問答三個金字念什麼?某某部首的偏旁是什麼?極客爸爸的“極”字有多少筆,它的偏旁是什麼?這些我們都針對兒童需求做過特地內容的開發。

當然,還有像文學的問答、十萬個為什麼、動植物、中英文互譯的能力,都是通過DuerOS這個兒童平臺對外可以開放,大家可以免費使用的。這個其實也不算我們炫技的,在兒童經常會問到中國的第一長河,地球和太陽有多遠?從北京到上海有多遠?蘋果的英文叫什麼?世界上最高的山峰是什麼?爸爸的爸爸叫什麼?這些我從哪裡來,其實都在我們針對兒童內容的大招中。

前面是我們第一層次輸出的能力,今天我們主打的是讓小朋友的問題都能得到滿足的回答,但是真正做好兒童語音交互還有很重要的一點,這也是我們根據自己的歷史資料發現。在兒童交互裡面,兒童和設備對話,他的對話週期不會超過5條。80%集中在5條之內,90%集中在13條之內。也就是說,最多問完13句話以後,這小朋友今天不會再和機器做一個交互了。

基於前面的一種判斷,我們相信STEAM教育領域會產生比任何教育公司都大的公司。這種大不僅是本身上市的市值,還包括它在社會上的影響力,以及對孩子們未來成長中起到的相應作用。其實很多朋友已經瞭解了STEAM教育包含的,它是融合了這五門的一個綜合性素質教育。而Makeblock用不同的方式去提升五個方面的能力。

我們在明年的時候我們會重點基於這種主動性的交互,會做一個非常大的投入,包括內容的推介、兒童聊天。像我們小朋友經常會問的:你很聰明呀。現在的聊天可能說:是啊,我是很聰明或者說你也很聰明。但是沒辦法繼續接下去了。像爸爸生氣了,同學欺負我怎麼辦?這些小朋友經常問的一些問題,這個目前來說做的不是非常好,我們明年會做一個很大的投入,就在做這個主動式的語音交互,寓教於樂,我們爭取兒童和AI的對話能夠從5句、13句到26句,甚至更多。

明年還有很重要的一點,咱們有很多內容的廠商,有上游服務的廠商參與到這個活動當中來。我也希望這些廠商能夠跟百度一起打造一個兒童早教的生態,可以把你們優質的內容通過DuerOS這個平臺,輸出到更多的終端產品上面去。當然,做智慧硬體可能大家現在最不願意談的就是安全了,因為硬體上的能力很重要,但硬體上的安全要付出一個很大的成本。

舉個例子就是兒童手錶的安全,攻擊者是百度實驗室安全專家,他可以利用手錶上的漏洞、傳輸協定的漏洞、雲端服務的漏洞,可以很容易偽造父母的來電給小朋友撥過去。甚至可以把小朋友周邊所有的聊天記錄都給抓取進來,這個還是語音的。我們看的到越來越的兒童產品,不管是機器人也好,兒童的平板也好,上面都有一個攝像頭。大家知道最近360攝像頭炒的也比較厲害,其實兒童平板上的攝像頭同樣也是一個非常容易被攻破的一個設備。

所以智慧硬體的安全,我們希望作在這次分享中能夠給大家提到一定的高度,讓大家有所警覺。我們有一個叫OASES的安全聯盟,比方說你的設備如果是個智慧硬體可以接入這個平臺,由平臺自動來給你打補丁。這個完全對用戶來說是無感的,我們通過這個平臺可以提供完整的一套安全服務。

怎麼和DuerOS做一個對接呢?DuerOS是一個開放的平臺,所有的廠商,不管是什麼樣的硬體形態,只要你有語音交互的需求,都可以跟他做一個對接。目前來講我們通過兩種方式可以直接使用DuerOS的能力,第一個是通過DuerOS方案商,假設有一家廠商需要做一款產品,但是您的人力主要在運營和產品上面,研發稍微偏弱的話,我們可以給您推薦一下DuerOS的方案商。目前接入DuerOS的方案商接近40家,根據您不同的需求我們都會有不同的方案商,來服務您,幫你定制這個產品。

兒童客制化的能力都可以通過DuerOS,這個設備開放平臺來實現。當然,我們也有APP開發、WAP開發這些相應的工具。通過我們一整套工具,您就可以打造您自己的產品。

在場的有很多已經是DuerOS的客戶,甚至我們DuerOS上游的合作夥伴,我們希望有更多的合作夥伴能夠和DuerOS一塊打造業界最優的兒童產品,能夠成為我們的合作夥伴,也希望有人能夠加入到DuerOS這個團隊裡面來,謝謝大家。

往期精選

整個語音開放平臺是對外免費,大家可以去使用。在這個平臺上面,我們之前搜集到了非常非常多的兒童語音資料。通過這些兒童的語音資料加上人工的標注,我們就做出了一個業內非常頂尖的兒童語音辨識引擎。

在聽清楚兒童文字以後,下一步就要對文字進行一個理解,理解兒童語義相對來說是非常非常困難的。我給大家舉一個例子,我們看過很多兒童語言交互的文本,我們發現很多很多的文本有一個特點,基本上在很多場景都出現過,就是掐頭去尾,第一個字少了或者最後一個字少了。“我要聽小蘋”,“小蘋”是什麼?下面一定是小蘋果。

所以對這種兒童語義的理解,要做一個人工的標注然後才能訓練出一個非常好的模型,讓我們的機器能夠理解兒童具體的含義是什麼。還有一個場景比方說成人的表達就是我要聽《黑貓警長》,小朋友可能表達更加直接一些,他就會問黑貓警長。這個時候咱們需要理解他,他到底是想要知道《黑貓警長》的故事,還是要聽《黑貓警長》這首歌,還是說要看《黑貓警長》的動畫呢?這些我們都是在聽懂的基礎上需要做大量的工作,分析用戶場景以後才能得到更加精准的理解。

在聽懂的基礎上,更深層就是要對兒童語音的滿足,他如果有問題我們要能夠精准的回答他。他如果要引用一些內容,我們能夠從海量的內容中最準確的找出那一個內容來。在這裡面我們也可以看到有很多小朋友點播一個內容的時候,不會按照成人的方式點播。

比方說成人會說我要聽周傑倫的《青花瓷》,這首歌很自然的就被點出來了。但是兒童思想會非常跳躍,“蓮花洞”。大家知道蓮花洞是什麼嗎?我要聽“火焰山”,有一些標準可能火焰山能夠找的出來。所以對內容、資源並不是越多就越好,其實要對內容和資源投入非常多的人力和計算,才能挖掘出其中內容知識庫,對兒童請求的滿足。

這個是我們百度DuerOs對外完全開放出來的,一套免費的兒童語言交互服務。在這個平臺上面,我們第一個提供了資訊智慧的檢索,做到有問必答,這主要是針對內容類別的。目前來說有合作方,像喜馬拉雅等,業界還有一些付費內容也在我們平臺上做一個對接。我們在這些內容基礎上面做了非常非常多節目的清洗,把故事、兒歌、國學、百科、英語,這些最常用的分類劃分出來了以後,同時我們還有很多子分類,比方說寓言、成語、歷史、地理,兒童都可以通過語音來點播到。

我們在做兒童方向是今年開始做的,百度積累了非常多的資源,但是兒童方向是從零開始起步。不到一年的時間內,我們打造了一個非常非常棒的兒童智慧百科。這些智慧百科不是從零開始的,大家都知道百度百科有幾億的用戶。在這個使用者的基礎上,我們都對資料、內容都做過一些針對兒童的改造,比如像漢字的問答三個金字念什麼?某某部首的偏旁是什麼?極客爸爸的“極”字有多少筆,它的偏旁是什麼?這些我們都針對兒童需求做過特地內容的開發。

當然,還有像文學的問答、十萬個為什麼、動植物、中英文互譯的能力,都是通過DuerOS這個兒童平臺對外可以開放,大家可以免費使用的。這個其實也不算我們炫技的,在兒童經常會問到中國的第一長河,地球和太陽有多遠?從北京到上海有多遠?蘋果的英文叫什麼?世界上最高的山峰是什麼?爸爸的爸爸叫什麼?這些我從哪裡來,其實都在我們針對兒童內容的大招中。

前面是我們第一層次輸出的能力,今天我們主打的是讓小朋友的問題都能得到滿足的回答,但是真正做好兒童語音交互還有很重要的一點,這也是我們根據自己的歷史資料發現。在兒童交互裡面,兒童和設備對話,他的對話週期不會超過5條。80%集中在5條之內,90%集中在13條之內。也就是說,最多問完13句話以後,這小朋友今天不會再和機器做一個交互了。

基於前面的一種判斷,我們相信STEAM教育領域會產生比任何教育公司都大的公司。這種大不僅是本身上市的市值,還包括它在社會上的影響力,以及對孩子們未來成長中起到的相應作用。其實很多朋友已經瞭解了STEAM教育包含的,它是融合了這五門的一個綜合性素質教育。而Makeblock用不同的方式去提升五個方面的能力。

我們在明年的時候我們會重點基於這種主動性的交互,會做一個非常大的投入,包括內容的推介、兒童聊天。像我們小朋友經常會問的:你很聰明呀。現在的聊天可能說:是啊,我是很聰明或者說你也很聰明。但是沒辦法繼續接下去了。像爸爸生氣了,同學欺負我怎麼辦?這些小朋友經常問的一些問題,這個目前來說做的不是非常好,我們明年會做一個很大的投入,就在做這個主動式的語音交互,寓教於樂,我們爭取兒童和AI的對話能夠從5句、13句到26句,甚至更多。

明年還有很重要的一點,咱們有很多內容的廠商,有上游服務的廠商參與到這個活動當中來。我也希望這些廠商能夠跟百度一起打造一個兒童早教的生態,可以把你們優質的內容通過DuerOS這個平臺,輸出到更多的終端產品上面去。當然,做智慧硬體可能大家現在最不願意談的就是安全了,因為硬體上的能力很重要,但硬體上的安全要付出一個很大的成本。

舉個例子就是兒童手錶的安全,攻擊者是百度實驗室安全專家,他可以利用手錶上的漏洞、傳輸協定的漏洞、雲端服務的漏洞,可以很容易偽造父母的來電給小朋友撥過去。甚至可以把小朋友周邊所有的聊天記錄都給抓取進來,這個還是語音的。我們看的到越來越的兒童產品,不管是機器人也好,兒童的平板也好,上面都有一個攝像頭。大家知道最近360攝像頭炒的也比較厲害,其實兒童平板上的攝像頭同樣也是一個非常容易被攻破的一個設備。

所以智慧硬體的安全,我們希望作在這次分享中能夠給大家提到一定的高度,讓大家有所警覺。我們有一個叫OASES的安全聯盟,比方說你的設備如果是個智慧硬體可以接入這個平臺,由平臺自動來給你打補丁。這個完全對用戶來說是無感的,我們通過這個平臺可以提供完整的一套安全服務。

怎麼和DuerOS做一個對接呢?DuerOS是一個開放的平臺,所有的廠商,不管是什麼樣的硬體形態,只要你有語音交互的需求,都可以跟他做一個對接。目前來講我們通過兩種方式可以直接使用DuerOS的能力,第一個是通過DuerOS方案商,假設有一家廠商需要做一款產品,但是您的人力主要在運營和產品上面,研發稍微偏弱的話,我們可以給您推薦一下DuerOS的方案商。目前接入DuerOS的方案商接近40家,根據您不同的需求我們都會有不同的方案商,來服務您,幫你定制這個產品。

兒童客制化的能力都可以通過DuerOS,這個設備開放平臺來實現。當然,我們也有APP開發、WAP開發這些相應的工具。通過我們一整套工具,您就可以打造您自己的產品。

在場的有很多已經是DuerOS的客戶,甚至我們DuerOS上游的合作夥伴,我們希望有更多的合作夥伴能夠和DuerOS一塊打造業界最優的兒童產品,能夠成為我們的合作夥伴,也希望有人能夠加入到DuerOS這個團隊裡面來,謝謝大家。

往期精選

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示