您的位置:首頁>科技>正文

咪咕和科大訊飛又搞了個大新聞

文 / 王胖子

一年一度的CES又來了, 不少讓人驚豔的設備亮相。

比如下面這個, 很有希望引領人工智慧設備風潮的"小傢伙":

1月9日上午,

拉斯維加斯, 2018 CES展現場, 咪咕與科大訊飛聯合發佈的全球首款全語音人工智慧耳機莫比斯(Mobius)。

它以咪咕內容與科大訊飛技術為核心, 聚合了語音操控, 中英翻譯, 心率監測, 健身指導, 日程管理, 出行導航, 路線規劃、音樂聽書等完整的一站式生活服務體系。

本次CES是莫比斯的第一次正式亮相。 但事實上, 它去年12月中旬就已經開始在京東眾籌, 而且非常受歡迎——上線僅10小時就完成了眾籌目標, 第一天就突破了10萬大關……

1

我為什麼這麼看好它?

自從2015年以來, 伴隨人工智慧技術逐漸成熟, 很多公司都在不斷嘗試,

希望用新的技術重新定義人機對話模式, 讓我們不需要動手, 就能操控電腦、手機和各種設備。

其中, 被寄予最大希望的方式, 是語音。

在深度學習和大資料的發展帶動下, 人工智慧語音技術近兩年來一路突飛猛進, 無論語音辨識還是語義識別, 準確率都是水漲船高, 實用性能與日俱增。

但是, 還有一個最大的門檻:硬體。

此前, 科大訊飛、小米、百度等很多公司都已經推出人工智慧音箱, 希望將它打造成固定環境中的用戶新入口。

這些產品頗受好評。 然而, 它們不能隨身攜帶。 就像傳統PC相比於筆記型電腦, 固定電話相比於手機, 寬頻相比於WiFi, 這個難以逾越的限制, 已經鎖死了智慧音箱發展的天花板。

此外, 也有一些應用在手機上流行,

相比智慧音箱, 它的方便性大大提升, 但即使如此, 手機的拾音與擴音能力, 依然限制了實際的使用體驗, 難以真正解放雙手, 人機交互的私密性體驗也不夠好。

其他的智慧穿戴設備, 也大多同樣面臨類似問題。

而現在, 人工智慧耳機這個設備的出現, 讓人工智慧語音辨識的對話模式, 終於看到了真正的顛覆希望。

2

那麼, 人工智慧耳機到底有哪些神奇之處呢?

(1)它讓我們不需要動手, 只用語音命令, 就能使用手機上的大多數功能, 比如聽音樂、打電話、給朋友發微信、讓人工智慧給你講笑話……

這樣的功能, 以前的很多手機都有, 比如Siri。 但在人工智慧耳機上, 它聽得懂的命令, 能實現的功能, 更加複雜得多, 更加準確得多——最重要的是,

也方便得多。

設想一下:

在一個大雨天, 你一隻手拎著包, 一隻手打著傘走在路上, 突然手機響了, 而且是你特設的振鈴——這代表它是老闆/老婆/老公/老媽來的電話, 十秒鐘不接就會完蛋的那種……

你想呼喚Siri, 但風聲雨聲振鈴聲, 聲聲都響, 手機還在兜裡, 喊破了嗓子它也不見得會回應你……

你不得不把傘和包挪到一隻手上, 另一隻手拉開衣鏈, 用來不及擦乾淨的, 微沾著雨絲的手掏出手機, 結果手指是濕的, 指紋不識別, 只能手忙腳亂地輸密碼/劃手勢解鎖……

忙亂中手一滑, 手機啪嘰一聲, 摔在了腳下的泥水坑裡……

何不如, 像《一代宗師》裡的梁朝偉, 身子都不顫一下, 撐著傘穩穩走著, 嘴角上淡淡笑著, 輕輕說一句:"接聽。 "就一切都就妥了。

你想要哪個?

或者:老人突然疾病發作倒地,手腳無力,或獨居家中,或路人皆不敢扶,此時何如?能否一個電話及時求救,或許就是生死之別。

(2)即時翻譯。這一條無須解釋,真正的大殺器,王胖子這種外語渣的出國旅遊必備。

(3)內置感測器,配合人工智慧演算法,即時監測你的運動軌跡和心率,甚至像專業教練一樣,給你即時的運動指導,或是健康保護。它甚至能感知你的情緒,來給你播放不同的音樂。

(4)它甚至能給我們提供更多的服務:比如你聽著音樂晨跑,快到紅燈口時音樂就會自動降低聲音,甚至提醒你注意觀察有沒有汽車;比如兩個朋友要見面,相互找不到,可以根據耳機的提示相互走近……

這些功能,有的已經實現了,有的還在路上,但也不遠了。總之,可以想像的場景太多,太多。

最關鍵的是,這個設備方便,隨身,私密。所以,以前困擾人工智慧語音落地的很多問題,全都迎刃而解。

也正是因為這個原因,我認為,人工智慧耳機有望成為今年可穿戴設備領域最大的風口。

3

或許有人會說,這些功能好不好並不重要,只有市場認可了,有了銷量,才是實錘。

所以,有必要列一點資料了。

比如蘋果的AirPods,一個亮點功能就是整合了語音助手Siri,能通過語音對話進行指令操作。雖然目前還沒有準確資料,但據協力廠商預測,在剛過去的2017年,AirPods的銷量將達到1300萬副,獨佔無線耳機市場85% 的市場份額。

對於人工智慧耳機來說,這個數字或許只是開始。

要知道,AirPods剛推出時可是飽受質疑,跟Siri的功能協作乏善可陳,續航也只有5個小時!

而根據調研機構 Statista 估計,2017年全球的耳機出貨數量是3.68 億對。毫無疑問,未來這個市場將會迅速被人工智慧耳機取代。

事實上,在人工智慧耳機這個方向上,從巨頭到創業公司,已經有非常多的人搶入佈局。

比如穀歌。它在新推出的無線耳機PixelBuds裡面,整合了谷歌語音助理,使用者可以通過,用戶通過特定手勢啟動它,甚至在與Pixel配對後還能即時翻譯。

比如創業公司Vinci的智慧頭機,也可以通過通過語音交互來進行耳機和音樂操作,根據外部環境改變音量,甚至可以根據心率、歷史偏好、場景、使用者狀態等條件差異,提供個性化的音樂推薦。

比如,耳機品牌Bragi也準備和Audio Analytic合作,通過人工智慧技術進行識別環境,讓它為它的Dash Pro等產品能從環境中收集資訊後,再對聲音進行處理。

甚至有消息說,日本一支研究團隊正在開發了一種人工智慧耳機,能夠通過腦電波跟蹤聽眾的情感狀態,創造出為聽眾量身定制的音樂,從而改善聽眾情緒。

……

相信在2018年,人工智慧耳機這個新興的行業,很快會百花齊放。

4

當然,就目前而言,我最看好的,還是咪咕和科大訊飛做的莫比斯。

除了它之外,市場上已經推出產品的設備中,大多都還算不得真正的"人工智慧耳機",比如AirPods,除了Siri以外就只能呵呵了;而在人工智慧功能上相對成熟的Vinci,產品也是頭機不是耳機,技術難度和易用性的差別都仿若天淵。

那麼,莫比斯的細節,有怎麼強大呢?

(1)它是TWS(TureWireless,真無線)耳機,單耳重量僅有7.5克!

多年來,從有線到無線,從一體到分體,耳機的種類可謂五花八門,但從2016年以來,TWS耳機已經成為絕對的大勢所趨。

它的特點是:兩個耳機都獨立存在,不再需要電線連接,從而徹底擺脫了電線束縛。耳機的設計也可以更加貼合耳部的結構設計,就像一顆豆子一樣戴在耳朵裡。

當然,這就需要每個耳機都要擁有獨立的電源、處理器、射頻和感測器,技術難度大大提升。

在此基礎上,莫比斯在7.5克的耳機裡,嵌入各種感測器和人工智慧功能,還要確保續航時間,這背後的技術實力可以說相當過硬。

更何況,莫比斯還是全球首次將智慧手機天線應用於耳機,並首次在TWS耳機中使用了Alongo雙麥降噪技術。

(2)莫比斯的藍牙標準是4.2。對耳機的性能來說,藍牙的關鍵無須多說,而4.2的優勢,相信也不用我再囉嗦了。

(3)防塵防水,莫比斯做到IP65,不算撥尖,但已經在標準線以上。

(4)心率演算法用的是lifebeam。

這些年智慧設備大熱,號稱能統計步數、在騎行、健身時監測心率和卡路里的設備,可以說遍地都是。但大多數設備監測的資料準確率,就只能呵呵了。而莫比斯用的lifebeam演算法,是目前全球最準確的隨身心率追蹤測量演算法。

它的準確有多高呢?航空級——這個詞可不是說著玩的,它是真的用來給宇航員測心率時用的。

(5)全雙工人工智慧交互。

嗯,這個詞有點拗口。

簡單解釋下,什麼叫全雙工呢?簡單來說,就是你和我可以同時說話,大家一邊說,一邊聽。

這樣,在人機交互的時候,不但可以隨時打斷和補充命令,而且能夠拒識和過濾無效的語音。

看上去簡單,但它實際上需要非常強大的語音辨識和分析能力,是科大訊飛壓箱底的技術優勢之一。

(6)識別和翻譯的準確率達90%以上。這一條無須解釋,往上每一個百分點都是大不同啊。

(7)上下文對話場景智慧識別技術,集成智慧語義斷句解決方案。可以結合交互的上下文,進行語義理解,並具有長時間的用戶交互歷史記憶,甚至可以同時管理多個對話場景,跨場景資訊共用長時記憶。

這也是深度學習帶來的技術實力,它的實際體驗值得期待。

至少,各種助手"記憶只有一句話"的這個老大難問題,已經被它掃進垃圾堆了。

(8)即時語言翻譯。內置聽譯、同聲傳譯和同聲對譯3種中英翻譯場景。以後出國旅遊輕鬆了!

(9)多種生活服務功能集成。通過莫比斯,打電話、天氣預報、鬧鐘提醒、時間查詢、地圖導航等等手機上的大多數功能,都可以用語音直接搞定。

(10)海量娛樂資源。

作為咪咕公司的首個智慧硬體產品、首個眾籌項目,莫比斯也得到了咪咕全力的資源加持。

它依託的咪咕系海量正版有聲內容,有多少呢?至少包括:

超過1700萬首歌曲……

84個分類,70萬集、20萬小時高清有聲內容,從有聲小說到資訊新聞,從名家專欄到網路電臺,想聽什麼都有……

真正說起來,這可能也是我們使用頻率最高,使用時間最長的領域。

而據咪咕透露,如果配合人工智慧應用"咪咕靈犀",莫比斯還會有更多驚喜表現。不過,由於沒有體驗,暫時就沒辦法介紹了。

這個以德國數學家命名的耳機,或許真的能像它的莫比烏斯環的科技感設計一樣,為我們帶來無窮的未來想像。

你想要哪個?

或者:老人突然疾病發作倒地,手腳無力,或獨居家中,或路人皆不敢扶,此時何如?能否一個電話及時求救,或許就是生死之別。

(2)即時翻譯。這一條無須解釋,真正的大殺器,王胖子這種外語渣的出國旅遊必備。

(3)內置感測器,配合人工智慧演算法,即時監測你的運動軌跡和心率,甚至像專業教練一樣,給你即時的運動指導,或是健康保護。它甚至能感知你的情緒,來給你播放不同的音樂。

(4)它甚至能給我們提供更多的服務:比如你聽著音樂晨跑,快到紅燈口時音樂就會自動降低聲音,甚至提醒你注意觀察有沒有汽車;比如兩個朋友要見面,相互找不到,可以根據耳機的提示相互走近……

這些功能,有的已經實現了,有的還在路上,但也不遠了。總之,可以想像的場景太多,太多。

最關鍵的是,這個設備方便,隨身,私密。所以,以前困擾人工智慧語音落地的很多問題,全都迎刃而解。

也正是因為這個原因,我認為,人工智慧耳機有望成為今年可穿戴設備領域最大的風口。

3

或許有人會說,這些功能好不好並不重要,只有市場認可了,有了銷量,才是實錘。

所以,有必要列一點資料了。

比如蘋果的AirPods,一個亮點功能就是整合了語音助手Siri,能通過語音對話進行指令操作。雖然目前還沒有準確資料,但據協力廠商預測,在剛過去的2017年,AirPods的銷量將達到1300萬副,獨佔無線耳機市場85% 的市場份額。

對於人工智慧耳機來說,這個數字或許只是開始。

要知道,AirPods剛推出時可是飽受質疑,跟Siri的功能協作乏善可陳,續航也只有5個小時!

而根據調研機構 Statista 估計,2017年全球的耳機出貨數量是3.68 億對。毫無疑問,未來這個市場將會迅速被人工智慧耳機取代。

事實上,在人工智慧耳機這個方向上,從巨頭到創業公司,已經有非常多的人搶入佈局。

比如穀歌。它在新推出的無線耳機PixelBuds裡面,整合了谷歌語音助理,使用者可以通過,用戶通過特定手勢啟動它,甚至在與Pixel配對後還能即時翻譯。

比如創業公司Vinci的智慧頭機,也可以通過通過語音交互來進行耳機和音樂操作,根據外部環境改變音量,甚至可以根據心率、歷史偏好、場景、使用者狀態等條件差異,提供個性化的音樂推薦。

比如,耳機品牌Bragi也準備和Audio Analytic合作,通過人工智慧技術進行識別環境,讓它為它的Dash Pro等產品能從環境中收集資訊後,再對聲音進行處理。

甚至有消息說,日本一支研究團隊正在開發了一種人工智慧耳機,能夠通過腦電波跟蹤聽眾的情感狀態,創造出為聽眾量身定制的音樂,從而改善聽眾情緒。

……

相信在2018年,人工智慧耳機這個新興的行業,很快會百花齊放。

4

當然,就目前而言,我最看好的,還是咪咕和科大訊飛做的莫比斯。

除了它之外,市場上已經推出產品的設備中,大多都還算不得真正的"人工智慧耳機",比如AirPods,除了Siri以外就只能呵呵了;而在人工智慧功能上相對成熟的Vinci,產品也是頭機不是耳機,技術難度和易用性的差別都仿若天淵。

那麼,莫比斯的細節,有怎麼強大呢?

(1)它是TWS(TureWireless,真無線)耳機,單耳重量僅有7.5克!

多年來,從有線到無線,從一體到分體,耳機的種類可謂五花八門,但從2016年以來,TWS耳機已經成為絕對的大勢所趨。

它的特點是:兩個耳機都獨立存在,不再需要電線連接,從而徹底擺脫了電線束縛。耳機的設計也可以更加貼合耳部的結構設計,就像一顆豆子一樣戴在耳朵裡。

當然,這就需要每個耳機都要擁有獨立的電源、處理器、射頻和感測器,技術難度大大提升。

在此基礎上,莫比斯在7.5克的耳機裡,嵌入各種感測器和人工智慧功能,還要確保續航時間,這背後的技術實力可以說相當過硬。

更何況,莫比斯還是全球首次將智慧手機天線應用於耳機,並首次在TWS耳機中使用了Alongo雙麥降噪技術。

(2)莫比斯的藍牙標準是4.2。對耳機的性能來說,藍牙的關鍵無須多說,而4.2的優勢,相信也不用我再囉嗦了。

(3)防塵防水,莫比斯做到IP65,不算撥尖,但已經在標準線以上。

(4)心率演算法用的是lifebeam。

這些年智慧設備大熱,號稱能統計步數、在騎行、健身時監測心率和卡路里的設備,可以說遍地都是。但大多數設備監測的資料準確率,就只能呵呵了。而莫比斯用的lifebeam演算法,是目前全球最準確的隨身心率追蹤測量演算法。

它的準確有多高呢?航空級——這個詞可不是說著玩的,它是真的用來給宇航員測心率時用的。

(5)全雙工人工智慧交互。

嗯,這個詞有點拗口。

簡單解釋下,什麼叫全雙工呢?簡單來說,就是你和我可以同時說話,大家一邊說,一邊聽。

這樣,在人機交互的時候,不但可以隨時打斷和補充命令,而且能夠拒識和過濾無效的語音。

看上去簡單,但它實際上需要非常強大的語音辨識和分析能力,是科大訊飛壓箱底的技術優勢之一。

(6)識別和翻譯的準確率達90%以上。這一條無須解釋,往上每一個百分點都是大不同啊。

(7)上下文對話場景智慧識別技術,集成智慧語義斷句解決方案。可以結合交互的上下文,進行語義理解,並具有長時間的用戶交互歷史記憶,甚至可以同時管理多個對話場景,跨場景資訊共用長時記憶。

這也是深度學習帶來的技術實力,它的實際體驗值得期待。

至少,各種助手"記憶只有一句話"的這個老大難問題,已經被它掃進垃圾堆了。

(8)即時語言翻譯。內置聽譯、同聲傳譯和同聲對譯3種中英翻譯場景。以後出國旅遊輕鬆了!

(9)多種生活服務功能集成。通過莫比斯,打電話、天氣預報、鬧鐘提醒、時間查詢、地圖導航等等手機上的大多數功能,都可以用語音直接搞定。

(10)海量娛樂資源。

作為咪咕公司的首個智慧硬體產品、首個眾籌項目,莫比斯也得到了咪咕全力的資源加持。

它依託的咪咕系海量正版有聲內容,有多少呢?至少包括:

超過1700萬首歌曲……

84個分類,70萬集、20萬小時高清有聲內容,從有聲小說到資訊新聞,從名家專欄到網路電臺,想聽什麼都有……

真正說起來,這可能也是我們使用頻率最高,使用時間最長的領域。

而據咪咕透露,如果配合人工智慧應用"咪咕靈犀",莫比斯還會有更多驚喜表現。不過,由於沒有體驗,暫時就沒辦法介紹了。

這個以德國數學家命名的耳機,或許真的能像它的莫比烏斯環的科技感設計一樣,為我們帶來無窮的未來想像。

Next Article
喜欢就按个赞吧!!!
点击关闭提示