您的位置:首頁>數碼>正文

獨家:87天,百度渡鴉智能音箱誕生記

在剛剛過去的百度世界大會, 一款智慧音箱raven H經過立項、ID設計、原材料選擇、工廠製造約8個月的時間最終出世, 百度創始人兼CEO李彥宏、COO陸奇親自為它月臺, 它的發佈在萬千矚目下佔據大會近一半時間, 以至於不少媒體調侃到百度世界大會變身智慧音箱大會!

這款由渡鴉科技打造的raven H智慧音箱憑藉個性化的外觀設計、多元的色彩以及具有想像力的頂部Touch模組受到業內關注。

根據智東西從產業鏈參與各方的初略估計, 百度這款智慧音箱打造的近8個月過程中, 至少有數千人參與其中。 無論是渡鴉、度秘、材料商還是工廠, 無論是前方一線還是後方, 所有人加班加點追趕時間;無論是長達45天攻克材料難題, 還是87天將設計圖紙快速落地產品;無論是“備戰會議室”, 還是淩晨3點半隨打隨通的電話, 都呈現了百度這款智慧音箱誕生背後的故事。

▲百度硬體事業部總經理、渡鴉創始人呂騁

智東西訪遍百度硬體事業部總經理、渡鴉創始人CEO呂騁、渡鴉首席體驗官阿不都力木·阿不都熱依木(以下簡稱阿不)、Tymphany中國事業部總經理劉曉彤一干人等, 並深度體驗raven H智能音箱, 為你複盤百度智慧音箱誕生全過程, 以及這款音箱究竟有何特殊之處。

一、數千人組團參戰

首先, 我們不妨沿著時間軸回到原點, 看看這款智能音箱何時立項、如何誕生, 從ID設計到工廠生產又經歷了怎樣的故事, 百度內部以及產業鏈到底有多大投入。

這還要回到今年2月份, 百度宣佈全資收購主打家居場景智慧設備的創業公司渡鴉科技, 渡鴉創業早期, 智東西就曾對創始人呂騁和該專案進行過深度報導。 呂騁攜團隊正式加盟百度, 並擔任百度智慧家居硬體總經理, 向COO陸奇彙報。

同渡鴉團隊成員溝通中得知, 智慧音箱這個項目3月份開始立項, 5月底第一個設計方案出來, 然後在工廠實驗材料、落地產品, 10月初第一批樣機出來, 11月生產線上的樣機完成。 Tymphany中國事業部總經理劉曉彤與呂騁團隊一起見證了渡鴉raven H從想法到誕生整個過程後, 也感歎不已, 據其估算, 從拿到敲定的設計圖紙, 到產品最終落地並在11月16日公之於眾, 前後只用了87天, 這個速度在智慧音箱打造過程中是很了不起的效率, 和渡鴉團隊交流中,

每次提到這個點, 團隊成員都表現出自豪和激動。

為了這款raven H, 渡鴉近百名員工全部All in 智慧音箱, 百度內部也有DuerOS語音團隊和AI團隊等進行內部配合, 而外部還有龐大的供應鏈體系, 包括材料商、工廠的聲學、結構、製造團隊等, 據渡鴉團隊透露, 加起來至少幾千人組成的大團隊參與到了這個硬體的開發生產中。

渡鴉團隊2月份加入百度, 為了這個項目團隊不斷擴充, 目前已到近百人。 據產業鏈人士透露, 渡鴉做硬體的團隊之前曾參與過旗艦手機的生產, 在硬體領域呆了很多年, 圈內都很知名, 很專業也很拼!

渡鴉方面還談到, raven H的目標使用者就是那些年輕的潮流人群, 追求的就是特立獨行, 因此採用了獨特的外觀和豐富的色彩, 很容易辨別也很時尚。渡鴉被百度收購前上一代智慧家居控制設備Raven H-1的模組化設計也被用到了raven H的設計理念中。

此外,在raven H類似“積木”的模組化分體設計,尤其是頂部的Touch模組可以在功能上疊加更多設想,渡鴉團隊為人們保留了更多想像空間。

二、87天:從圖紙到產品

當ID構想好之後形成方案,便開始跟工廠開始溝通,並進行產品落地。苦不堪言的材料試驗、沒日沒夜的趕工、87天從圖紙落地產品成了這一階段故事的核心。

關於raven H智慧音箱由圖紙落地到產品背後的過程,我們從渡鴉團隊、Tymphany中國事業部團隊等那裡獲取了更多的資訊。

▲百度世界大會現場

Tymphany中國事業部總經理劉曉彤對智東西講到,這款智慧音箱正式動工是在8月份,之前的接觸則是談好產品的設計,並由百度提供方案。為了這個專案,Tymphany前前後後投入約50人的團隊進行配合,包括聲學、結構、電子以及模具組等,最終87天完工,產品落地。

87天究竟是一個什麼樣的速度呢?出口國外的藍牙音箱從設計交付到產品落地的時間週期大概是6~9個月,包括國外的驗證期、時間差、假日等。智慧音箱按道理說應該更加複雜,按國外的做法基本上生產要1年,如Echo研發了2年,後來生產基本也需要1年1款。儘管國內團隊都很拼,正常情況下產品的落地仍需半年左右的時間,而渡鴉以及Tymphany團隊在87天將產品落地,可以說效率很高。

“他們的團隊(渡鴉)很專業,執行能力很強,大家都很拼”,這是劉曉彤對整個產品生產過程的感歎。

然而首先面對他們的就是痛苦不堪的材料打磨。可以說這份痛苦要來自Teenage Engineering這家設計公司提出的高溫尼龍玻璃纖維複合材料 Kalix,它非常適合用於智慧硬體,一方面摸上去它的質感要比普通的PC材料好很多,另一方面這種材料也可以減少震感,有利於提供更好的音質。

▲高溫尼龍玻璃纖維複合材料 Kalix

但問題是這款材料很貴而且最初很難落地到產品,蘋果也只是在iPhone的邊框部分使用了這個材料,來使手感更順滑。渡鴉曾身處一線的工作人員談到,這個材料成本很高,坑很多,當時從臺灣、歐洲、美國調來了幾十個博士到工廠就為攻克這個材料。

“這完全是化學實驗,同樣的配方同樣的模具,1號機出來OK,2號機出來不OK,控制變數都不行,我們都快崩潰了”,當談到材料時,渡鴉工作人員明顯情緒有些波動,“當時我們在生產線搭了帳篷,用了45天就為調試這個材料!”

Tymphany一位技術負責人也談到,這也是他們遇到最大的坑,做到幾近要放棄。一般產品加玻纖10%~15%的時候,表面就很難做漂亮,容易坑坑窪窪,為了它模具、設備都要從新改造。

“最難的在於外面的玻璃纖維材料與音箱中間的黑色材料是兩種不同的材料,但需要同時進模具,兩種材料的熔點什麼都不一樣,沒有人做過實驗,為了這個工藝我們做了45天的實驗”,呂騁感歎到。

而且我們看到raven H豐富的色彩並非噴漆後的顏色,而是玻璃纖維材料直接調出的原色。可見,為了讓外觀更好看,材料質感更舒服,渡鴉以及各方團隊費了一番功夫。

材料問題解決了,接下來依舊是艱辛的產品生產環節。劉曉彤談到,為了這款音箱,各方還在工廠設了一個“備戰”會議室,能夠坐20多人,就從來沒空過。無論是渡鴉、百度、材料還是工廠人員都很拼,為了這個產品,基本上只要有一個人在現場沒有下班,合作方的幾個核心負責人都會陪著,“前線待到幾點,後方老大就坐鎮到幾點”,這位Tymphany技術負責人表示。

而這其中還有一個小插曲,渡鴉的一個結構負責人從北京奔赴工廠,一呆就是兩個月,全身心參與到硬體打磨生產的全過程,由於長期熬夜以及工廠生活直接工作到心律不齊,為的是能夠儘快趕出產品。

“這些互聯網公司的人大多是大公司出來的,對產品流程的嚴謹性、驗證的科學性要求很高,但遇到更注重速度的互聯網企業,他們又放不下職業裡的嚴謹性,就只能把時間投入進去”,劉曉彤總結到。

同時拼搏在一線的不止渡鴉團隊,還有Tymphany團隊以及百度等團隊。Tymphany這位技術負責人感歎到,最長的一次是4天3夜都待在廠房裡,當趕一個東西時需要一個持續的過程,機器一旦開就不能停,同事累的不行了就直接睡在機器旁邊,為了產品體驗、細節打磨,大家投入很多。

百度內部也是如此,“我們經常半夜隨時電話渡鴉和度秘,淩晨3點半以前都可以打通,隨時保持溝通”,劉曉彤這句話恰好反映出為這款產品,各方付出的心血。

實驗室的樣機第一次出來大約是在9月底10月初,為了隔天就能讓渡鴉拿到機器,劉曉彤又講述了一個有趣的故事。為了讓渡鴉、度秘等團隊來驗證技術,保證隔天早上可以送到,他們想盡了郵遞、托運的辦法。儘管是靠飛機托運也不能完全保證第二天早上可以送到渡鴉團隊,為此,劉曉彤最終選擇派人連夜“人肉”把樣機送到北京,後來都是如此。可見為了產品準時交付,Tymphany也在近可能避免一切風險。

▲百度世界大會現場

就這樣多方團隊奮戰到11月初,產品線上的樣機出來了,趕在了11月16日百度世界大會之前完工。87天,渡鴉智慧音箱從圖紙到產品落地,從硬體層面來說,他們值得自豪。

三、北京三裡屯洲際酒店智慧客房體驗

再回到2017年11月21日,智東西作為少數特邀媒體,來到了渡鴉與戰略合作夥伴洲際酒店共同打造的位於三裡屯通盈中心洲際酒店首個AI智慧客房(樣板間),參與了渡鴉raven H的深度體驗。

這款智慧音箱給人的第一印象是外觀的新穎時尚。不同於市面上的“桶型”智慧音箱與黑白灰的配色,raven H採用積木式的8層級結構,並配以橙、紅、藍、綠四種顏色,給人以層次感和鮮活感。

整體來看,raven H方方正正,邊長8釐米,高為11.3釐米,可“安穩”立於手掌之上,可見小巧。raven H採用分體設計,整體可分為兩部分,頂部的Touch模組相當於音箱的“主機”,而下面7層則是“機身”。

頂部的Touch模組由一個19×19的LED點陣屏構成來呈現基本的視覺資訊,同時可以進行長按、按兩下、滑動觸控操作。它通過一個磁性介面和音箱本體連接,可進行上下滑動以及“拆卸”。在家庭中,你可以隨意攜帶Touch模組,並像使用微信APP一樣,進行長按模組中部發出語音指令,Touch模組背部也有一個小的揚聲器,但主要作為提示音存在,具體的播放任務以及遠場交互則由音箱本體來承擔。

▲頂部Touch模組

原來raven H的Touch模組和音箱本體各自帶有一個4麥克風陣列,兩部分都可以拾音並進行獨立使用,不同的是Touch模組滿足觸摸近場語音交互,音箱本體負責遠場語音交互,等於說這就是“兩套”智慧音箱,而這無疑增加了成本。而在具體工作中,渡鴉團隊談到,音箱會通過感測器感知Touch模組傾斜的角度,通過演算法進行動態工作,判斷使用麥克風的數目。

智慧音箱小巧容易,但難的是如何在小體積下保證音質以及實現有效喚醒。在這方面,raven H使用了國際音響知名品牌Tymphany定制的Peerless 2寸全頻喇叭來保證音質,並在7.2釐米的間距中做到麥克風陣列與揚聲器共存,實現遠場5米喚醒。

通過raven H智慧音箱的現場體驗以及渡鴉工作人員的講解,我們對這款產品有以下瞭解:

1、拿到產品啟動的第一步就是配網,目前國內新一代的產品中都開始使用更簡便與快捷的藍牙配網。而raven H則採用了WiFi配網,不超過45秒。不過,有趣的是,渡鴉並沒有給自己的智慧音箱做APP,而是直接通過微信公眾號的形式聯網、管理使用,減少了用戶下載應用的成本。

2、raven H在約3米和5米的距離內均可保持較高的喚醒率。喚醒是我們進行人機交互的第一步,只有良好的喚醒才能實現後面的交互。我們現場進行了3組測試,第一組是在據智慧音箱3米處,通過正常人聲3次均可喚醒;第二組智東西為了進行5米測量,特意站到了由一面玻璃牆格擋的洗漱間,並在約5米處以近似相同的聲音呼喊“小度小度”,3次也都實現喚醒。

▲約5米環境實測raven H喚醒率

第三組測試中,raven H還可以在高分貝音量下實現喚醒。該組測試可分為兩種情況,一種是當raven H自身播放音樂時,在接近100分貝的音量下(回想一下裝修中電鑽機的聲音吧),可實現在1米內無障礙喚醒,可見raven H在回聲消除等方面下了一番功夫;另一種情況是用另一台音箱就近提供一個約70分貝的雜訊(鬧市街道聲),raven H同樣可以實現喚醒。

3、機器對指令的回應時間也是影響用戶體驗的一個重要因素,raven H可以做到平均1.4秒的回應時間。目前1~1.5秒的回應時間較為理想,1.5~2秒有燈光顯示聲音回饋,效果也不錯。渡鴉工作人員指出,在考慮網路環境以及使用者體驗,做到較為均衡的1.4秒回應。

4、做為一款音箱,好的音質同樣十分重要。raven H儘管體型“嬌小”,但在音質上同樣有不俗的表現。它採用音響界知名品牌Tymphany定制的Peerless 2寸全頻喇叭,通過現場分貝儀的測試,可以達到120分貝的高音,相當於你趴在汽車頭部鳴笛的聲音。通過《加州旅館》這首專用於低音測試的歌曲,我們還能感受到raven H聲音的飽滿、低沉、自然。

5、與其他家智慧音箱通過APP來實現管理不同,raven H通過微信公眾號實現技能商店等服務。為了降低用戶的使用成本,渡鴉直接跳過APP,將應用做在微信公眾號中。微信公眾號內置技能商店,渡鴉預裝技能大約五六十個,其他技能(DuerOS目前已有200多項技能)用戶可以自行添加使用。

6、海量資料有了,智慧化仍需發力。在內容方面,渡鴉主要展示了體育、音樂、視頻三方面的語音交互,可以發現在限定邊界的場景內,以任務為導向的指令可以做到不錯的理解和交互,體育領域可以做到儘管問,顯示了渡鴉在這方面的深耕。但在音樂方面,raven H接入了百度音樂、太合音樂,還可支援喜歡/收藏功能,但考慮當下音樂版權的現狀(大部分在騰訊),流媒體音樂仍是渡鴉下一階段要重點攻克的一關。而在智慧音箱早期,渡鴉給出的解決辦法是通過藍牙與手機相連播放,作為音訊資源的補充。

此外,儘管百度有著海量的資料以及強大的搜索能力,但raven H在問答領域的多倫對話仍需改善,DuerOS的潛力還沒有完全釋放出來。可見落地到智慧音箱時,在NLP(自然語言處理)方面仍需進一步打磨。渡鴉團隊也談到,儘管百度有海量的資料,但主要是應用在網頁搜索中的, 針對語音搜索還需要對資料進行清洗,更深層的交互還在進一步打磨,後續會有更多進展。

7、有趣的“如意說”功能。所謂的如意說是指,raven H可以根據語音語義給出不同的回答。在語義上,當你給出一個完整的提問“今天天氣怎麼樣?”,它會給你完整的答覆,包含氣溫、空氣品質、生活提示等。但是當你只拋出2個字“天氣”,它也會很簡短的回復你氣溫狀況。在語音上,raven H可以根據使用者的語速來選擇合適的語速進行應答。此外,小孩和成人講出的“講個笑話”,raven H也會給出不同的回復。

8、在方言方面,raven H已支援部分大眾方言(與普通話接近的)。現場我們用重慶話和河南話對raven H進行“調教”,它都準確給出了回答以及實現了家居控制。

9、家居控制也是智慧音箱應用的一個核心點。目前raven H已支援34個品類共120款設備的家居控制,包括愛奇藝電視果、飛利浦、SONOS、蘇寧等。目前百度已經和洲際酒店集團達成了戰略合作,渡鴉首階段已在三裡屯通盈中心洲際酒店行政樓層推出AI智慧客房(樣板間),之後將推廣到全國40多家洲際酒店及度假村共計100間套房。

10、最後還有一個小細節,資料線本是一個很普通的東西,但為了差異化,渡鴉做成了復古式“電話線”版的資料線。

可以看出,渡鴉團隊在產品設計、用料、產品結構、硬體打磨上的用心,包括頂部Touch模組和音箱本體兩套麥克風陣列系統,昂貴的高溫尼龍玻璃纖維複合材料Kalix(iPhone邊框使用的材料),Tymphany打造了全頻喇叭等這些都大大提升了這款智慧音箱的成本。難怪渡鴉方面會說儘管我們定價很高(1699元),但也並不賺錢。

儘管DuerOS 2.0 被首發用到raven H上,讓渡鴉的產品有了一個堅實的技術基礎平臺,但在音樂內容、語音交互尤其是多輪對話方面如何在落地時帶來最佳體驗,還需要不斷打磨。

四、Touch模組上的“野心”

在體驗現場,渡鴉團隊和創始人呂騁還與智東西談及了raven H的分體設計以及智慧音箱產品定位上的一些看法。

所謂的分體設計,就是在頂部的Touch模組和音箱本體上同時使用相同的兩套麥克風陣列、記憶體、主機板等,這就相當於2套完整的方案,為什麼渡鴉要採用這種較貴的方案呢?

渡鴉方面稱,在內部他們更傾向於把Touch模組稱為智慧音箱的“主機”,而把音箱本體稱為“機身”。除了外觀外,音箱本體和其他市面上的智慧音箱並無本質不同,都用於遠場語音交互上。

而與其他智慧音箱不同之處正在於Touch模組,“Touch模組才是主角,單獨拿在手中按住說話,不用喚醒詞,就像微信語音一樣”,呂騁演示到。單獨的Touch模組則又在純語音交互外,給了用戶觸摸交互的選擇。

而渡鴉的“野心”顯然不止如此,通過渡鴉團隊的溝通以及渡鴉的兩款產品raven R 和raven Q,可以看出渡鴉想要賦予Touch模組更多的想像力,通過磁性結構連接更多的設備,從而以模組化的方式相容更多的設備,比如Touch模組+HiFi音箱、Touch模組+機械手臂等等。

但如果渡鴉想要實現這種“野心”,首先要做的就是鋪開銷量,只有獲得更多的用戶,才有可能發展成連接器,連接更多的設備。而1699元的價格則可能會成為它首先遇到的障礙。

在既有的智慧音箱中,無論是國外亞馬遜的Echo、還是國內阿裡的天貓精靈等都採取的是音箱這個形態,其中一點就是找到用戶的一個既有品類認知,以此打開市場。可是渡鴉又為何將產品設計成一個非音箱的樣貌,進而稱自己為智慧音箱呢,用戶又能否接受這種認知?

渡鴉團隊談到,這款智慧音箱定位的就是潮流的年輕人,他們追求的就是特立獨行,無論是外觀還是配色,raven H都是時尚的。

未來智慧硬體的形態,音箱是一個很好的起點,但不是終點。呂騁判斷音箱這個形態不會停留太久,因為音箱不會是一個定義性產品(相比iPhone)。對於未來的定義性產品,渡鴉也在探索,而此次他們給出的答案就是Touch,以Touch為載體,將更多的功能和應用接入Touch,比如六軸機器人。

五、百度智能音箱誕生記

歷時近8個月,百度這款智慧音箱由團隊組建到ID設計再到工廠落地生產,尤其是工廠環節,我們看到了這款高顏值智慧音箱背後的故事,看到了百度為打造其首款智能音箱的付出。

李彥宏、陸奇親自為其月臺,百度世界大會近一半時間拱手相讓,可見百度對這款智慧硬體的重視。對於百度而言,它為百度將技術與生態落地到產品提供了一次機會,通過打造這樣一個標杆產品來快速反覆運算技術,構建自身生態。

但百度能否像微軟一樣,成功打造一款引領潮流的Surface,仍是一個未知數,而產品的出現則至少讓一個新的故事開始展開。

很容易辨別也很時尚。渡鴉被百度收購前上一代智慧家居控制設備Raven H-1的模組化設計也被用到了raven H的設計理念中。

此外,在raven H類似“積木”的模組化分體設計,尤其是頂部的Touch模組可以在功能上疊加更多設想,渡鴉團隊為人們保留了更多想像空間。

二、87天:從圖紙到產品

當ID構想好之後形成方案,便開始跟工廠開始溝通,並進行產品落地。苦不堪言的材料試驗、沒日沒夜的趕工、87天從圖紙落地產品成了這一階段故事的核心。

關於raven H智慧音箱由圖紙落地到產品背後的過程,我們從渡鴉團隊、Tymphany中國事業部團隊等那裡獲取了更多的資訊。

▲百度世界大會現場

Tymphany中國事業部總經理劉曉彤對智東西講到,這款智慧音箱正式動工是在8月份,之前的接觸則是談好產品的設計,並由百度提供方案。為了這個專案,Tymphany前前後後投入約50人的團隊進行配合,包括聲學、結構、電子以及模具組等,最終87天完工,產品落地。

87天究竟是一個什麼樣的速度呢?出口國外的藍牙音箱從設計交付到產品落地的時間週期大概是6~9個月,包括國外的驗證期、時間差、假日等。智慧音箱按道理說應該更加複雜,按國外的做法基本上生產要1年,如Echo研發了2年,後來生產基本也需要1年1款。儘管國內團隊都很拼,正常情況下產品的落地仍需半年左右的時間,而渡鴉以及Tymphany團隊在87天將產品落地,可以說效率很高。

“他們的團隊(渡鴉)很專業,執行能力很強,大家都很拼”,這是劉曉彤對整個產品生產過程的感歎。

然而首先面對他們的就是痛苦不堪的材料打磨。可以說這份痛苦要來自Teenage Engineering這家設計公司提出的高溫尼龍玻璃纖維複合材料 Kalix,它非常適合用於智慧硬體,一方面摸上去它的質感要比普通的PC材料好很多,另一方面這種材料也可以減少震感,有利於提供更好的音質。

▲高溫尼龍玻璃纖維複合材料 Kalix

但問題是這款材料很貴而且最初很難落地到產品,蘋果也只是在iPhone的邊框部分使用了這個材料,來使手感更順滑。渡鴉曾身處一線的工作人員談到,這個材料成本很高,坑很多,當時從臺灣、歐洲、美國調來了幾十個博士到工廠就為攻克這個材料。

“這完全是化學實驗,同樣的配方同樣的模具,1號機出來OK,2號機出來不OK,控制變數都不行,我們都快崩潰了”,當談到材料時,渡鴉工作人員明顯情緒有些波動,“當時我們在生產線搭了帳篷,用了45天就為調試這個材料!”

Tymphany一位技術負責人也談到,這也是他們遇到最大的坑,做到幾近要放棄。一般產品加玻纖10%~15%的時候,表面就很難做漂亮,容易坑坑窪窪,為了它模具、設備都要從新改造。

“最難的在於外面的玻璃纖維材料與音箱中間的黑色材料是兩種不同的材料,但需要同時進模具,兩種材料的熔點什麼都不一樣,沒有人做過實驗,為了這個工藝我們做了45天的實驗”,呂騁感歎到。

而且我們看到raven H豐富的色彩並非噴漆後的顏色,而是玻璃纖維材料直接調出的原色。可見,為了讓外觀更好看,材料質感更舒服,渡鴉以及各方團隊費了一番功夫。

材料問題解決了,接下來依舊是艱辛的產品生產環節。劉曉彤談到,為了這款音箱,各方還在工廠設了一個“備戰”會議室,能夠坐20多人,就從來沒空過。無論是渡鴉、百度、材料還是工廠人員都很拼,為了這個產品,基本上只要有一個人在現場沒有下班,合作方的幾個核心負責人都會陪著,“前線待到幾點,後方老大就坐鎮到幾點”,這位Tymphany技術負責人表示。

而這其中還有一個小插曲,渡鴉的一個結構負責人從北京奔赴工廠,一呆就是兩個月,全身心參與到硬體打磨生產的全過程,由於長期熬夜以及工廠生活直接工作到心律不齊,為的是能夠儘快趕出產品。

“這些互聯網公司的人大多是大公司出來的,對產品流程的嚴謹性、驗證的科學性要求很高,但遇到更注重速度的互聯網企業,他們又放不下職業裡的嚴謹性,就只能把時間投入進去”,劉曉彤總結到。

同時拼搏在一線的不止渡鴉團隊,還有Tymphany團隊以及百度等團隊。Tymphany這位技術負責人感歎到,最長的一次是4天3夜都待在廠房裡,當趕一個東西時需要一個持續的過程,機器一旦開就不能停,同事累的不行了就直接睡在機器旁邊,為了產品體驗、細節打磨,大家投入很多。

百度內部也是如此,“我們經常半夜隨時電話渡鴉和度秘,淩晨3點半以前都可以打通,隨時保持溝通”,劉曉彤這句話恰好反映出為這款產品,各方付出的心血。

實驗室的樣機第一次出來大約是在9月底10月初,為了隔天就能讓渡鴉拿到機器,劉曉彤又講述了一個有趣的故事。為了讓渡鴉、度秘等團隊來驗證技術,保證隔天早上可以送到,他們想盡了郵遞、托運的辦法。儘管是靠飛機托運也不能完全保證第二天早上可以送到渡鴉團隊,為此,劉曉彤最終選擇派人連夜“人肉”把樣機送到北京,後來都是如此。可見為了產品準時交付,Tymphany也在近可能避免一切風險。

▲百度世界大會現場

就這樣多方團隊奮戰到11月初,產品線上的樣機出來了,趕在了11月16日百度世界大會之前完工。87天,渡鴉智慧音箱從圖紙到產品落地,從硬體層面來說,他們值得自豪。

三、北京三裡屯洲際酒店智慧客房體驗

再回到2017年11月21日,智東西作為少數特邀媒體,來到了渡鴉與戰略合作夥伴洲際酒店共同打造的位於三裡屯通盈中心洲際酒店首個AI智慧客房(樣板間),參與了渡鴉raven H的深度體驗。

這款智慧音箱給人的第一印象是外觀的新穎時尚。不同於市面上的“桶型”智慧音箱與黑白灰的配色,raven H採用積木式的8層級結構,並配以橙、紅、藍、綠四種顏色,給人以層次感和鮮活感。

整體來看,raven H方方正正,邊長8釐米,高為11.3釐米,可“安穩”立於手掌之上,可見小巧。raven H採用分體設計,整體可分為兩部分,頂部的Touch模組相當於音箱的“主機”,而下面7層則是“機身”。

頂部的Touch模組由一個19×19的LED點陣屏構成來呈現基本的視覺資訊,同時可以進行長按、按兩下、滑動觸控操作。它通過一個磁性介面和音箱本體連接,可進行上下滑動以及“拆卸”。在家庭中,你可以隨意攜帶Touch模組,並像使用微信APP一樣,進行長按模組中部發出語音指令,Touch模組背部也有一個小的揚聲器,但主要作為提示音存在,具體的播放任務以及遠場交互則由音箱本體來承擔。

▲頂部Touch模組

原來raven H的Touch模組和音箱本體各自帶有一個4麥克風陣列,兩部分都可以拾音並進行獨立使用,不同的是Touch模組滿足觸摸近場語音交互,音箱本體負責遠場語音交互,等於說這就是“兩套”智慧音箱,而這無疑增加了成本。而在具體工作中,渡鴉團隊談到,音箱會通過感測器感知Touch模組傾斜的角度,通過演算法進行動態工作,判斷使用麥克風的數目。

智慧音箱小巧容易,但難的是如何在小體積下保證音質以及實現有效喚醒。在這方面,raven H使用了國際音響知名品牌Tymphany定制的Peerless 2寸全頻喇叭來保證音質,並在7.2釐米的間距中做到麥克風陣列與揚聲器共存,實現遠場5米喚醒。

通過raven H智慧音箱的現場體驗以及渡鴉工作人員的講解,我們對這款產品有以下瞭解:

1、拿到產品啟動的第一步就是配網,目前國內新一代的產品中都開始使用更簡便與快捷的藍牙配網。而raven H則採用了WiFi配網,不超過45秒。不過,有趣的是,渡鴉並沒有給自己的智慧音箱做APP,而是直接通過微信公眾號的形式聯網、管理使用,減少了用戶下載應用的成本。

2、raven H在約3米和5米的距離內均可保持較高的喚醒率。喚醒是我們進行人機交互的第一步,只有良好的喚醒才能實現後面的交互。我們現場進行了3組測試,第一組是在據智慧音箱3米處,通過正常人聲3次均可喚醒;第二組智東西為了進行5米測量,特意站到了由一面玻璃牆格擋的洗漱間,並在約5米處以近似相同的聲音呼喊“小度小度”,3次也都實現喚醒。

▲約5米環境實測raven H喚醒率

第三組測試中,raven H還可以在高分貝音量下實現喚醒。該組測試可分為兩種情況,一種是當raven H自身播放音樂時,在接近100分貝的音量下(回想一下裝修中電鑽機的聲音吧),可實現在1米內無障礙喚醒,可見raven H在回聲消除等方面下了一番功夫;另一種情況是用另一台音箱就近提供一個約70分貝的雜訊(鬧市街道聲),raven H同樣可以實現喚醒。

3、機器對指令的回應時間也是影響用戶體驗的一個重要因素,raven H可以做到平均1.4秒的回應時間。目前1~1.5秒的回應時間較為理想,1.5~2秒有燈光顯示聲音回饋,效果也不錯。渡鴉工作人員指出,在考慮網路環境以及使用者體驗,做到較為均衡的1.4秒回應。

4、做為一款音箱,好的音質同樣十分重要。raven H儘管體型“嬌小”,但在音質上同樣有不俗的表現。它採用音響界知名品牌Tymphany定制的Peerless 2寸全頻喇叭,通過現場分貝儀的測試,可以達到120分貝的高音,相當於你趴在汽車頭部鳴笛的聲音。通過《加州旅館》這首專用於低音測試的歌曲,我們還能感受到raven H聲音的飽滿、低沉、自然。

5、與其他家智慧音箱通過APP來實現管理不同,raven H通過微信公眾號實現技能商店等服務。為了降低用戶的使用成本,渡鴉直接跳過APP,將應用做在微信公眾號中。微信公眾號內置技能商店,渡鴉預裝技能大約五六十個,其他技能(DuerOS目前已有200多項技能)用戶可以自行添加使用。

6、海量資料有了,智慧化仍需發力。在內容方面,渡鴉主要展示了體育、音樂、視頻三方面的語音交互,可以發現在限定邊界的場景內,以任務為導向的指令可以做到不錯的理解和交互,體育領域可以做到儘管問,顯示了渡鴉在這方面的深耕。但在音樂方面,raven H接入了百度音樂、太合音樂,還可支援喜歡/收藏功能,但考慮當下音樂版權的現狀(大部分在騰訊),流媒體音樂仍是渡鴉下一階段要重點攻克的一關。而在智慧音箱早期,渡鴉給出的解決辦法是通過藍牙與手機相連播放,作為音訊資源的補充。

此外,儘管百度有著海量的資料以及強大的搜索能力,但raven H在問答領域的多倫對話仍需改善,DuerOS的潛力還沒有完全釋放出來。可見落地到智慧音箱時,在NLP(自然語言處理)方面仍需進一步打磨。渡鴉團隊也談到,儘管百度有海量的資料,但主要是應用在網頁搜索中的, 針對語音搜索還需要對資料進行清洗,更深層的交互還在進一步打磨,後續會有更多進展。

7、有趣的“如意說”功能。所謂的如意說是指,raven H可以根據語音語義給出不同的回答。在語義上,當你給出一個完整的提問“今天天氣怎麼樣?”,它會給你完整的答覆,包含氣溫、空氣品質、生活提示等。但是當你只拋出2個字“天氣”,它也會很簡短的回復你氣溫狀況。在語音上,raven H可以根據使用者的語速來選擇合適的語速進行應答。此外,小孩和成人講出的“講個笑話”,raven H也會給出不同的回復。

8、在方言方面,raven H已支援部分大眾方言(與普通話接近的)。現場我們用重慶話和河南話對raven H進行“調教”,它都準確給出了回答以及實現了家居控制。

9、家居控制也是智慧音箱應用的一個核心點。目前raven H已支援34個品類共120款設備的家居控制,包括愛奇藝電視果、飛利浦、SONOS、蘇寧等。目前百度已經和洲際酒店集團達成了戰略合作,渡鴉首階段已在三裡屯通盈中心洲際酒店行政樓層推出AI智慧客房(樣板間),之後將推廣到全國40多家洲際酒店及度假村共計100間套房。

10、最後還有一個小細節,資料線本是一個很普通的東西,但為了差異化,渡鴉做成了復古式“電話線”版的資料線。

可以看出,渡鴉團隊在產品設計、用料、產品結構、硬體打磨上的用心,包括頂部Touch模組和音箱本體兩套麥克風陣列系統,昂貴的高溫尼龍玻璃纖維複合材料Kalix(iPhone邊框使用的材料),Tymphany打造了全頻喇叭等這些都大大提升了這款智慧音箱的成本。難怪渡鴉方面會說儘管我們定價很高(1699元),但也並不賺錢。

儘管DuerOS 2.0 被首發用到raven H上,讓渡鴉的產品有了一個堅實的技術基礎平臺,但在音樂內容、語音交互尤其是多輪對話方面如何在落地時帶來最佳體驗,還需要不斷打磨。

四、Touch模組上的“野心”

在體驗現場,渡鴉團隊和創始人呂騁還與智東西談及了raven H的分體設計以及智慧音箱產品定位上的一些看法。

所謂的分體設計,就是在頂部的Touch模組和音箱本體上同時使用相同的兩套麥克風陣列、記憶體、主機板等,這就相當於2套完整的方案,為什麼渡鴉要採用這種較貴的方案呢?

渡鴉方面稱,在內部他們更傾向於把Touch模組稱為智慧音箱的“主機”,而把音箱本體稱為“機身”。除了外觀外,音箱本體和其他市面上的智慧音箱並無本質不同,都用於遠場語音交互上。

而與其他智慧音箱不同之處正在於Touch模組,“Touch模組才是主角,單獨拿在手中按住說話,不用喚醒詞,就像微信語音一樣”,呂騁演示到。單獨的Touch模組則又在純語音交互外,給了用戶觸摸交互的選擇。

而渡鴉的“野心”顯然不止如此,通過渡鴉團隊的溝通以及渡鴉的兩款產品raven R 和raven Q,可以看出渡鴉想要賦予Touch模組更多的想像力,通過磁性結構連接更多的設備,從而以模組化的方式相容更多的設備,比如Touch模組+HiFi音箱、Touch模組+機械手臂等等。

但如果渡鴉想要實現這種“野心”,首先要做的就是鋪開銷量,只有獲得更多的用戶,才有可能發展成連接器,連接更多的設備。而1699元的價格則可能會成為它首先遇到的障礙。

在既有的智慧音箱中,無論是國外亞馬遜的Echo、還是國內阿裡的天貓精靈等都採取的是音箱這個形態,其中一點就是找到用戶的一個既有品類認知,以此打開市場。可是渡鴉又為何將產品設計成一個非音箱的樣貌,進而稱自己為智慧音箱呢,用戶又能否接受這種認知?

渡鴉團隊談到,這款智慧音箱定位的就是潮流的年輕人,他們追求的就是特立獨行,無論是外觀還是配色,raven H都是時尚的。

未來智慧硬體的形態,音箱是一個很好的起點,但不是終點。呂騁判斷音箱這個形態不會停留太久,因為音箱不會是一個定義性產品(相比iPhone)。對於未來的定義性產品,渡鴉也在探索,而此次他們給出的答案就是Touch,以Touch為載體,將更多的功能和應用接入Touch,比如六軸機器人。

五、百度智能音箱誕生記

歷時近8個月,百度這款智慧音箱由團隊組建到ID設計再到工廠落地生產,尤其是工廠環節,我們看到了這款高顏值智慧音箱背後的故事,看到了百度為打造其首款智能音箱的付出。

李彥宏、陸奇親自為其月臺,百度世界大會近一半時間拱手相讓,可見百度對這款智慧硬體的重視。對於百度而言,它為百度將技術與生態落地到產品提供了一次機會,通過打造這樣一個標杆產品來快速反覆運算技術,構建自身生態。

但百度能否像微軟一樣,成功打造一款引領潮流的Surface,仍是一個未知數,而產品的出現則至少讓一個新的故事開始展開。

Next Article
喜欢就按个赞吧!!!
点击关闭提示