您的位置:首頁>科技>正文

圖靈郭家:如何打造兒童喜歡的智慧產品?這個問題可以通過 AI+IP 模型來解答 | WARE 2018

成立 8 年, 聚集 70 萬應用開發者, 聚焦兒童領域 AI 應用, 圖靈不僅僅是「阿蘭·圖靈」的那個圖靈, 圖靈還是全球最大的中文語義技術公司, 其 AI 技術已經幫助國內 TOP50 的兒童產品品牌實現了語音交互和智慧化內容輸出。

在深圳灣「WARE 2018 新硬體峰會」上, 圖靈機器人聯合創始人郭家分享了圖靈在兒童領域的 AI 應用探索和思考, 並深入闡述了「AI+IP」模型如何説明兒童智慧產品實現影響力和智慧化服務價值輸出。

IP = 影響力(粉絲流量)+ 消費力(粉絲轉化);AI = 多模態交互技術 + 智慧化服務價值輸出。

郭家和我們探討了「兒童喜歡玩什麼」的話題。

同樣都是機器人, 無論是從銷量還是用戶的喜愛程度來看, Jibo 比起超級飛俠都差的很遠。 對於兒童來說, 喜歡哪個不喜歡哪個, 產品從外觀和表現力上就已經非常明顯了。

而在 AI 應用上, 通用的 AI 是遠遠不夠的, 需要通過多模態人機交互, 實現 IP 角色定制化, 再依據 IP 角色定制內容輸出。 比如, 當我問「你有去過巴黎嗎?」, 如果是小豬佩奇就會回答, 「法國就在我們隔壁, 我經常去」;如果是超級飛俠就會回答, 「我本來就會飛, 想去哪裡就去哪裡」。

AI 天然自帶一種人格屬性, 它就是一個有生命的機器人。 而多模態交互能讓 IP 角色更加豐富, 以滿足兒童豐富多彩的夢想。 在此基礎之上, 圖靈再為產品加入智慧化的內容和服務, 就可以説明兒童產生對學習更大的樂趣。

以下是郭家演講實錄, 經深圳灣整理和發佈。

---------------------------

演講嘉賓:郭家 / 圖靈機器人聯合創始人

演講主題:兒童智慧產品的 IP 與 AI 交互

大家好, 我是圖靈的郭家。 今天跟大家分享一下圖靈 AI 在兒童領域的應用探索。

幾天前, 艾瑞諮詢發佈了一份 AI 領域的分析報告,

分別從橫向和縱向幾個維度解析了人工智慧產業:橫向維度包括基礎設施(如晶片、感測器、資料)、行業應用場景(如工業、金融、教育)等, 縱向維度則是按照技術歸類劃分。

圖靈從中發現, 其實每個產品都可歸類於這三大類技術:語音辨識與合成(ASR/TTS)、語義理解(NLP)、機器視覺(CV), 這也是目前人工智慧領域三大主流技術框架。

成立 8 年, 聚集 70 萬應用開發者, 聚焦兒童領域 AI 應用, 圖靈不僅僅有一個好名字

「圖靈」(阿蘭.圖靈)是鼎鼎大名的電腦之父、人工智慧之父。 「圖靈」又是我們早在 2010 年公司開始探索 AI 方向時就註冊的品牌名。 我們在 AI 大潮襲來之前, 就開始開發 AI 語音對話應用, 那時候還是 App, 之後又在業界率先推出了機器人作業系統。

圖靈專注在 AI 語義技術開發多年, 現在已經在全球積累了 70 多萬開發者, 這個數字每天都在增長和活躍。 自 2015 年開始, 圖靈在兒童領域逐步與國內 TOP10 的企業達成合作, 包括大家耳聞能詳的步步高、火火兔、奧飛、讀書郎、快易典、名校堂、KIDO 等。

圖靈已經成長為全球最大的中文語義技術公司。

讓兒童與機器的交互更自然, 要看哪些關鍵指標?這裡有圖靈的一組研究

在語音語義交互領域有哪些關鍵的指標呢?這張幻燈片展示了圖靈的研究成果。 在眾多指標裡, ASR+NLP+TTS 速度、意圖解析準確率、知識庫、語料庫, 這些標注黃色的部分, 是客戶及使用者層面非常關注的資料。

進一步闡釋,這張圖的左邊是我們最看重的演算法類指標,包括語音和語義的交互資料、分詞準確率、意圖解析準確率、NER 準確率等。

其中,在交互速度方面,拿 Echo 的語音交互資料做對比,從使用者說話到 Echo 回饋結果,平均耗時 1.5 秒。我們也測了很多國內的產品,有的比 Echo 還要更快,這是特別重要的一個指標。

意圖解析是指,當我們向機器問一個問題,機器能不能回答好,其中評價的指標包括兩部分:第一部分是正確的理解、聽懂你的意思;第二部分是找到合適的答案給到你。所以意圖理解是非常重要的環節,也是各項 AI 國際賽事主要 PK 的指標。

AI 技術的本質是演算法+資料,資料的積累往往可以成為一家公司的門檻。我特別認可這樣的說法——所有的互聯網公司都會變成資料公司,所有的資料公司都會變成人工智慧公司。所以資料儲備指標,對於語音交互的評估至關重要。為此,圖靈也在積累兒童音視頻資源。

三大技術能力,打造面向兒童硬體設備商的 AI 方案

前面有提到圖靈已經和國內 TOP10 的企業達成合作,其中包括小米。今年 3 月,圖靈和小米兒童產品已經全面展開合作,小米智慧手錶、故事機等小米生態鏈產品,都採用了圖靈的 AI 技術。而在 3 月 27 日小米新品發佈會上,雷軍宣佈小愛同學不僅被植入進了小米電視,還植入進了小米手機,而其中的兒童對話部分,就有圖靈的技術支援。

圖靈面向兒童硬體設備商的 AI 技術方案包括三大方面的能力:

語音對話:閒聊型/知識問答型/技能任務型
兒童內容點播:音樂/故事/教材/動畫
家長端:遠端交互/設定提醒/資料管理

這些不僅僅是 PPT 的能力,更是圖靈已經賦能 TOP50 兒童品牌後驗證和訓練出來的能力。

圖靈的 AI+IP 模型:IP 建立影響力,AI 智慧化服務輸出價值

我們看這樣一組資料:白色的這款是由 MIT 科學家們打造的明星產品 Jibo 家用社交機器人,紅色的這款是奧飛旗下樂迪超級飛俠兒童機器人。目前,無論是從銷量還是用戶的喜愛程度來看,Jibo 比起超級飛俠都還是差的很遠。這其中的原因不言而喻,對於兒童來說,喜歡哪個不喜歡哪個,從外觀和表現力上就已經非常明顯了。

圖靈認為,IP = 影響力(粉絲流量) + 消費力(粉絲轉化)。首先,要有足夠的流量建立影響力,就像明星要經常走秀才能出名;然後,接廣告變現,粉絲消費變現,在動畫領域的一些兒童 IP 已經有這樣的價值了。

圖靈認為,AI = 多模態交互技術 + 智慧化服務價值輸出。AI 的價值體現,首先是在技術層面,產品層面實現了語音、視覺、機械控制等,其次在智慧化層面,不斷為使用者輸出內容和服務。

基於此,圖靈構建了自己的 AI+IP 模型。

將 AI 與 IP 融合,把技術融合在構建影響力這個層面,去吸引足夠多的粉絲,然後在消費力層間,持續的輸出智慧化服務的價值。

光有通用 AI 還不夠,圖靈通過多模態人機交互,實現 IP 角色定制化

圖靈在對目標客戶的研究發現,擁有 IP 的設備廠商,對於通用的 AI 並不感冒,他們往往都會有進一步的 IP 角色定制化需求。

圖靈為客戶定制的個性化多模態交互,包含四大部分的功能:IP 屬性個性化、IP 音色個性化、IP 動作個性化、IP 表情個性化。展開來論述:

IP 屬性:提供屬性定義工具,定義機器人的姓名、年齡、性別、父母等
IP 音色:用 WaveNet 生成模型,做全球最好的 TTS 合成引擎
IP 動作:用語義串聯動作,讓機器人說什麼話做什麼動作
IP 表情:用情感計算識別的情感類型和程度,映射機器人的表情

目前市場上主流的 TTS 技術生成的童聲,機器聲音的痕跡還非常明顯。今年年初,AlphaGo 團隊開放了一個最新的 TTS 技術——基於 WaveNet 卷積神經網路的 Cloud TTS,我們在這一基礎上進行了音色定制和優化,製作出來的童聲,音色的圓潤程度遠遠比市場現有 TTS 音色的圓潤程度高,能做到和人物原聲相似度達 95% 以上。(現場演示聲音對比,秒殺效果令全場觀眾稱讚。)

這裡值得一提的是,清華大學 Aminer 團隊不久前發佈了一份報告,報告顯示,圖靈兒童 AI 專利數為同類專利總數的 62%,多模態交互專利全球第二,AI 專利總數則是全球第四。

光有單一的 IP 還不夠,圖靈幫助品牌方實現智慧化的內容和服務價值輸出

接下來講一下 AI+IP 模型中的智慧化服務,分三方面闡述:

第一,建立獨立記憶系統。在圖靈語料總庫的基礎上,讓機器人學習並記憶每個使用者不同的個性化資料。例如如果能持續記錄使用者的個人習慣,並做出相應的個性化調整,這能使得產品有更深的粘性。

第二,定制語義技能。圖靈除了提供 AI 技術方案,也是 AI 的應用開發者,我們為優質合作夥伴定制自有資源的 AI 技能、知識圖譜等。

第三,劇本式話題。根據動畫片的劇本,生成每個 IP 獨有的話題。例如,圖靈與小豬佩奇、超級飛俠等 IP 合作,我們訓練出來的內容與其他 AI 訓練出來的內容不一樣。當我問它,你有去過巴黎嗎?如果是小豬佩奇就會回答,「法國就在我們隔壁,我經常去」;如果是超級飛俠就會回答,「我本來就會飛,想去哪裡就去哪裡」。

回應客戶的需求,圖靈還對大量兒童課本教材做了 AI 內容和服務輸出。

AI+IP 是國際大趨勢,兒童智慧產品應該是小朋友的夢想載體

無論是圖靈和日本夏普合作的 RoBoHoN 機器人、Sphero 新品、還是和電影『蜘蛛俠』一起上市的會說話的蜘蛛俠,以及迪士尼 AI 劇本專利,我們都能發現,AI+IP 也是國際上兒童產品的趨勢。

圖靈做了大量關於「兒童喜歡玩什麼」的調研。這些都是我們的實地調研:墨西哥的這位男孩喜歡小汽車,義大利的這位女孩喜歡各種公主裙和芭比娃娃,這個美國男孩喜歡飛機,這個中國男孩喜歡槍和炮。

兒童喜歡玩什麼?答案抽象出來,就是給他一個夢想的載體。以上四組分別體現了小朋友的駕駛員的夢想、公主夢想、飛行員夢想、以及當一名戰士的夢想。

小結一下:AI 天然自帶一種人格屬性,它就是一個有生命的機器人。而多模態交互能讓 IP 角色更加豐富,以滿足兒童豐富多彩的夢想。在此基礎之上,我們再為產品加入智慧化的內容和服務,就可以説明兒童產生對學習更大的樂趣。

以上就是我的分享,謝謝各位!

整理、編輯:陳壹零、談喆 @深圳灣

版權聲明:本文系深圳灣編輯創作發佈,轉載請注明來自深圳灣,並標明網站地址 shenzhenware.com

轉載、約稿、投稿、團隊報導請聯繫微信公眾號:shenzhenware(回復關鍵字)

進一步闡釋,這張圖的左邊是我們最看重的演算法類指標,包括語音和語義的交互資料、分詞準確率、意圖解析準確率、NER 準確率等。

其中,在交互速度方面,拿 Echo 的語音交互資料做對比,從使用者說話到 Echo 回饋結果,平均耗時 1.5 秒。我們也測了很多國內的產品,有的比 Echo 還要更快,這是特別重要的一個指標。

意圖解析是指,當我們向機器問一個問題,機器能不能回答好,其中評價的指標包括兩部分:第一部分是正確的理解、聽懂你的意思;第二部分是找到合適的答案給到你。所以意圖理解是非常重要的環節,也是各項 AI 國際賽事主要 PK 的指標。

AI 技術的本質是演算法+資料,資料的積累往往可以成為一家公司的門檻。我特別認可這樣的說法——所有的互聯網公司都會變成資料公司,所有的資料公司都會變成人工智慧公司。所以資料儲備指標,對於語音交互的評估至關重要。為此,圖靈也在積累兒童音視頻資源。

三大技術能力,打造面向兒童硬體設備商的 AI 方案

前面有提到圖靈已經和國內 TOP10 的企業達成合作,其中包括小米。今年 3 月,圖靈和小米兒童產品已經全面展開合作,小米智慧手錶、故事機等小米生態鏈產品,都採用了圖靈的 AI 技術。而在 3 月 27 日小米新品發佈會上,雷軍宣佈小愛同學不僅被植入進了小米電視,還植入進了小米手機,而其中的兒童對話部分,就有圖靈的技術支援。

圖靈面向兒童硬體設備商的 AI 技術方案包括三大方面的能力:

語音對話:閒聊型/知識問答型/技能任務型
兒童內容點播:音樂/故事/教材/動畫
家長端:遠端交互/設定提醒/資料管理

這些不僅僅是 PPT 的能力,更是圖靈已經賦能 TOP50 兒童品牌後驗證和訓練出來的能力。

圖靈的 AI+IP 模型:IP 建立影響力,AI 智慧化服務輸出價值

我們看這樣一組資料:白色的這款是由 MIT 科學家們打造的明星產品 Jibo 家用社交機器人,紅色的這款是奧飛旗下樂迪超級飛俠兒童機器人。目前,無論是從銷量還是用戶的喜愛程度來看,Jibo 比起超級飛俠都還是差的很遠。這其中的原因不言而喻,對於兒童來說,喜歡哪個不喜歡哪個,從外觀和表現力上就已經非常明顯了。

圖靈認為,IP = 影響力(粉絲流量) + 消費力(粉絲轉化)。首先,要有足夠的流量建立影響力,就像明星要經常走秀才能出名;然後,接廣告變現,粉絲消費變現,在動畫領域的一些兒童 IP 已經有這樣的價值了。

圖靈認為,AI = 多模態交互技術 + 智慧化服務價值輸出。AI 的價值體現,首先是在技術層面,產品層面實現了語音、視覺、機械控制等,其次在智慧化層面,不斷為使用者輸出內容和服務。

基於此,圖靈構建了自己的 AI+IP 模型。

將 AI 與 IP 融合,把技術融合在構建影響力這個層面,去吸引足夠多的粉絲,然後在消費力層間,持續的輸出智慧化服務的價值。

光有通用 AI 還不夠,圖靈通過多模態人機交互,實現 IP 角色定制化

圖靈在對目標客戶的研究發現,擁有 IP 的設備廠商,對於通用的 AI 並不感冒,他們往往都會有進一步的 IP 角色定制化需求。

圖靈為客戶定制的個性化多模態交互,包含四大部分的功能:IP 屬性個性化、IP 音色個性化、IP 動作個性化、IP 表情個性化。展開來論述:

IP 屬性:提供屬性定義工具,定義機器人的姓名、年齡、性別、父母等
IP 音色:用 WaveNet 生成模型,做全球最好的 TTS 合成引擎
IP 動作:用語義串聯動作,讓機器人說什麼話做什麼動作
IP 表情:用情感計算識別的情感類型和程度,映射機器人的表情

目前市場上主流的 TTS 技術生成的童聲,機器聲音的痕跡還非常明顯。今年年初,AlphaGo 團隊開放了一個最新的 TTS 技術——基於 WaveNet 卷積神經網路的 Cloud TTS,我們在這一基礎上進行了音色定制和優化,製作出來的童聲,音色的圓潤程度遠遠比市場現有 TTS 音色的圓潤程度高,能做到和人物原聲相似度達 95% 以上。(現場演示聲音對比,秒殺效果令全場觀眾稱讚。)

這裡值得一提的是,清華大學 Aminer 團隊不久前發佈了一份報告,報告顯示,圖靈兒童 AI 專利數為同類專利總數的 62%,多模態交互專利全球第二,AI 專利總數則是全球第四。

光有單一的 IP 還不夠,圖靈幫助品牌方實現智慧化的內容和服務價值輸出

接下來講一下 AI+IP 模型中的智慧化服務,分三方面闡述:

第一,建立獨立記憶系統。在圖靈語料總庫的基礎上,讓機器人學習並記憶每個使用者不同的個性化資料。例如如果能持續記錄使用者的個人習慣,並做出相應的個性化調整,這能使得產品有更深的粘性。

第二,定制語義技能。圖靈除了提供 AI 技術方案,也是 AI 的應用開發者,我們為優質合作夥伴定制自有資源的 AI 技能、知識圖譜等。

第三,劇本式話題。根據動畫片的劇本,生成每個 IP 獨有的話題。例如,圖靈與小豬佩奇、超級飛俠等 IP 合作,我們訓練出來的內容與其他 AI 訓練出來的內容不一樣。當我問它,你有去過巴黎嗎?如果是小豬佩奇就會回答,「法國就在我們隔壁,我經常去」;如果是超級飛俠就會回答,「我本來就會飛,想去哪裡就去哪裡」。

回應客戶的需求,圖靈還對大量兒童課本教材做了 AI 內容和服務輸出。

AI+IP 是國際大趨勢,兒童智慧產品應該是小朋友的夢想載體

無論是圖靈和日本夏普合作的 RoBoHoN 機器人、Sphero 新品、還是和電影『蜘蛛俠』一起上市的會說話的蜘蛛俠,以及迪士尼 AI 劇本專利,我們都能發現,AI+IP 也是國際上兒童產品的趨勢。

圖靈做了大量關於「兒童喜歡玩什麼」的調研。這些都是我們的實地調研:墨西哥的這位男孩喜歡小汽車,義大利的這位女孩喜歡各種公主裙和芭比娃娃,這個美國男孩喜歡飛機,這個中國男孩喜歡槍和炮。

兒童喜歡玩什麼?答案抽象出來,就是給他一個夢想的載體。以上四組分別體現了小朋友的駕駛員的夢想、公主夢想、飛行員夢想、以及當一名戰士的夢想。

小結一下:AI 天然自帶一種人格屬性,它就是一個有生命的機器人。而多模態交互能讓 IP 角色更加豐富,以滿足兒童豐富多彩的夢想。在此基礎之上,我們再為產品加入智慧化的內容和服務,就可以説明兒童產生對學習更大的樂趣。

以上就是我的分享,謝謝各位!

整理、編輯:陳壹零、談喆 @深圳灣

版權聲明:本文系深圳灣編輯創作發佈,轉載請注明來自深圳灣,並標明網站地址 shenzhenware.com

轉載、約稿、投稿、團隊報導請聯繫微信公眾號:shenzhenware(回復關鍵字)

Next Article
喜欢就按个赞吧!!!
点击关闭提示