華文網

圖靈機器人:帶著千億條語料庫,它成為了 QQ 的群聊機器人|創業

當市面上的大多人工智慧公司都在買資料時,我們不僅不需要買資料,

甚至都已經可以賣了。

圖靈機器人 COO 郭家表示圖靈機器人最大的優勢便是擁有全球頂級的中文對話語庫。據介紹,目前圖靈機器人已經擁有 40 多萬的開發者,積累了 1300 多億條語料庫,而且值得一提的是這是對話語料庫,極少有其他公司能達到這樣的量級。那麼圖靈機器人是如何做到的呢?

一切都得從蟲洞語音助手說起。

蟲洞語音助手是圖靈機器人於 2012 年正式發佈的類似於蘋果 Siri 的對話機器人,其具備語義搜索、智慧問答、語音控制等功能,旨在解決用戶生活中遇到的各種問題,説明使用者快速獲取資訊。作為國內較早的語音助手工具之一,“蟲洞語音助手”于 2012 年 3 月推出第一版,當月就有 40 萬的使用者註冊,

產品一炮走紅。而到 2013 年 5 月,蟲洞日活躍用戶度約為 15%,總用戶量接近 1000 萬。

不過,在面對良好發展勢頭的同時,圖靈也注意到了背後潛藏著的隱患。“我們發現就連 Siri 的體驗也都還不夠好。”郭家表示。

據瞭解,蟲洞語音助手能正確地完成用戶提出的任務和要求,但也不完善,很多時候蟲洞能將連續提出的幾個問題進行關聯,經常只是機械地對每一個問題進行回答,不能區分用於無聊調戲的聊天模式以及正常使用的問答模式。

尚不完善的體驗無法長久地留住用戶。

而由 2C 變成 2B 的舉動也為圖靈帶來了第二春。據郭家介紹,2014 年蟲洞一開放,資料量便開始飆升,“差不多每月增長 1 萬個開發者,1 億多個用戶。”

大資料促成“中文語境下智慧度最高的機器人大腦”

這是圖靈機器人在自己的官網上打出的 Slogan,圖靈竟敢打出這麼一個扎眼的標語,其實並不是標榜自己的技術有多麼好,“現在的人工智慧公司最終比拼的其實還是資料,不管是語音辨識、語義識別還是視覺識別等演算法 95%以上都是開源的,如果某家公司說我演算法好,那只能說他們沒有找到一個會看論文文獻的人。”郭家表示,“大家拼的應該是資料。

也正是在資料方面的積累使得郭家有信心表示圖靈機器人是“中文語境下智慧度最高的機器人大腦”。對此,郭家認為可以從兩方面說明圖靈機器人的“聰明”:

1、準確率,即能否正確回答用戶的問題。我們對比過其他企業的產品,發現我們是最高的。資料顯示,圖靈機器人在語義識別方面的準確率可達 94.7%。

2、趣味度,用戶持續試玩的感受,這方面,我們目前至少排前三。

基於這些,最近圖靈機器人被騰訊選中,被集成到了新版的 QQ 中作為 QQ 群裡的聊天機器人,輔助群主運營,“騰訊方面一下子上線幾十萬個群,剛上線最高每秒併發幾萬次,直接讓我們的流量飆升了十多個點。”郭家說到。不過,此次騰訊一共上線了兩款 QQ 群機器人,一款是圖靈機器人,而另一款則是微軟旗下大名鼎鼎的小冰機器人。

而接入中國最大的流量池之一的騰訊 QQ 之後,圖靈方面的對話資料庫顯然也會與其他競爭對手進一步拉開距離。

基於圖靈機器人,打造 Turing OS 機器人作業系統

智慧手機的觸屏式交互是對傳統鍵盤式交互的革新,為此,才有了安卓等移動作業系統。而到了人工智慧時代,觸摸式交互也開始落伍了,基於語音以及機器視覺等等的多模態交互才是機器人時代的主流交互手段,這是輸入方面的變化;而在輸出方面,機器人時代的輸出也已經不再只是聲音和文字,機器人的肢體動作和表情也將成為輸出的重要部分,新的對話模式決定了 OS 的框架,也意味著安卓等系統不適用於機器人,郭家認為機器人的普及也必須有專門為機器人開發的作業系統的助力。

因此,圖靈在做好主打語義理解的圖靈機器人的同時,還在機器人作業系統方向發力,以期取得更大的價值。據瞭解,圖靈在機器人的基礎之上整合打包了其他包括語音辨識、圖像識別等友商的技術,開發了 Turing OS 機器人作業系統,旨在讓機器人開發更加簡單,開發者只需要安安心心做硬體,而不用專門找人自己開發系統軟體。

另外,郭家認為安卓系統最主要的問題就在於時延。“如果一個機器人要摔倒了,系統必須即時反應,不能有延遲”,所以,Turing OS 機器人作業系統還在 kernal 和 framework 層進行了優化,以達到即時性的要求。

目前,Turing OS 除了在語義識別方面能夠達到 94.7%的準確率以外,人機對話準確率也達到了 88.2%,後者採用情感 TTS 技術,具備 25 種語言情感,包括 468 類情感語言、120 種聲音語調、88 套表情動作,官方宣稱識別準確率達到了 95.1%,可以像人一樣識別和表達情感。

作業系統的競爭是一個巨頭之間的競爭,現在包括阿裡巴巴、孫正義旗下的軟銀以及穀歌和微軟都在機器人 OS 上有所發力。面對巨頭,郭家這樣告訴記者,“做 OS 的競爭一定是最頂級的,對我們而言,不要有那麼大的壓力,將自己喜歡做的事情做好就可以了。”

據瞭解,圖靈目前具有員工 130 餘人。2016 年 1 月,其接受了奧飛動漫 5000 萬元的戰略入股。

題圖來自 123RF

本文作者 :

- - - - END - - - -

最近圖靈機器人被騰訊選中,被集成到了新版的 QQ 中作為 QQ 群裡的聊天機器人,輔助群主運營,“騰訊方面一下子上線幾十萬個群,剛上線最高每秒併發幾萬次,直接讓我們的流量飆升了十多個點。”郭家說到。不過,此次騰訊一共上線了兩款 QQ 群機器人,一款是圖靈機器人,而另一款則是微軟旗下大名鼎鼎的小冰機器人。

而接入中國最大的流量池之一的騰訊 QQ 之後,圖靈方面的對話資料庫顯然也會與其他競爭對手進一步拉開距離。

基於圖靈機器人,打造 Turing OS 機器人作業系統

智慧手機的觸屏式交互是對傳統鍵盤式交互的革新,為此,才有了安卓等移動作業系統。而到了人工智慧時代,觸摸式交互也開始落伍了,基於語音以及機器視覺等等的多模態交互才是機器人時代的主流交互手段,這是輸入方面的變化;而在輸出方面,機器人時代的輸出也已經不再只是聲音和文字,機器人的肢體動作和表情也將成為輸出的重要部分,新的對話模式決定了 OS 的框架,也意味著安卓等系統不適用於機器人,郭家認為機器人的普及也必須有專門為機器人開發的作業系統的助力。

因此,圖靈在做好主打語義理解的圖靈機器人的同時,還在機器人作業系統方向發力,以期取得更大的價值。據瞭解,圖靈在機器人的基礎之上整合打包了其他包括語音辨識、圖像識別等友商的技術,開發了 Turing OS 機器人作業系統,旨在讓機器人開發更加簡單,開發者只需要安安心心做硬體,而不用專門找人自己開發系統軟體。

另外,郭家認為安卓系統最主要的問題就在於時延。“如果一個機器人要摔倒了,系統必須即時反應,不能有延遲”,所以,Turing OS 機器人作業系統還在 kernal 和 framework 層進行了優化,以達到即時性的要求。

目前,Turing OS 除了在語義識別方面能夠達到 94.7%的準確率以外,人機對話準確率也達到了 88.2%,後者採用情感 TTS 技術,具備 25 種語言情感,包括 468 類情感語言、120 種聲音語調、88 套表情動作,官方宣稱識別準確率達到了 95.1%,可以像人一樣識別和表達情感。

作業系統的競爭是一個巨頭之間的競爭,現在包括阿裡巴巴、孫正義旗下的軟銀以及穀歌和微軟都在機器人 OS 上有所發力。面對巨頭,郭家這樣告訴記者,“做 OS 的競爭一定是最頂級的,對我們而言,不要有那麼大的壓力,將自己喜歡做的事情做好就可以了。”

據瞭解,圖靈目前具有員工 130 餘人。2016 年 1 月,其接受了奧飛動漫 5000 萬元的戰略入股。

題圖來自 123RF

本文作者 :

- - - - END - - - -