華文網

基於AI手機的主動服務背後,究竟有哪些秘密存在?

三百萬年以前,古人類第一次使用工具,便天然地揭示了人和動物的最大區別。鬥轉星移,人類緩慢地跨過了石器時代、青銅時代、鐵器時代乃至於近代的蒸汽、電氣時代。時至今日,

資訊科技日新月異,人類使用的工具也愈來愈豐富和便捷。

然而,縱然時代不同,世界經歷了滄桑巨變,人和工具的本質關係卻從未被真正地動搖。一直以來,人都必須主動地使用工具。工具是靜止的、無意識的,它只能被動地為人類服務。即便是堪稱是人類歷史以來最偉大的發明——智慧手機,

也難逃天命。

直到最近幾年人工智慧技術的迅速發展,乃至去年全球第一款AI晶片麒麟970的問世和使用,我們看到:隨著手機AI的日益強大,人類和工具的關係似乎悄悄出現了某種被顛覆的可能性。這種可能性,正是基於AI手機的主動服務。

那麼,手機主動服務的背後,究竟有哪些秘密存在?

AI的主動:開啟解放雙手的時代

一直以來,要想獲取手機的資訊或者對其發出指令,

就必須要依賴手動操作。比如最原始的密碼或圖案解鎖。這些都存在操作失誤的可能,如果哪個熊孩子多輸錯了幾次,手機出於自我保護就可能要幾分鐘甚至幾十分鐘無法解鎖。為此,手機廠商開始探索藏于人體的天然的生物密碼。

移動端現有指紋識別、人臉識別和虹膜識別三種生物識別方式,而應用最廣泛的當數指紋識別,

其被廣泛應用于解鎖、支付、進入應用等種種場景。與此同時,更為安全和精准的虹膜識別也處於緊鑼密鼓的開發當中。而隨著手機算力的提高,尤其是AI晶片的推出,其對人臉結構的分解也更為細緻,手機人臉識別也正在成為標配。

在語音交互領域,

當蘋果的Siri出現,其立刻引領了一股語音助手的熱潮。隨著技術的進步,市面上的絕大多數手機都加入了語音助手的功能。利用語音助手,人們只需要動動嘴就可以完成打電話、搜索等任務。有意思的是,給用戶講笑話卻是目前語音助手的常用功能。這可能也充分體現了我國人民風趣幽默的性格特點。然而如果只用手機講笑話,恍若有點大炮打蚊子的感覺。

生物識別和語音助手出現的歷史性意義比實際用途更為重要:對人的雙手的解放。

而這,也是手機AI為實現主動服務而邁出的堅實的一步。

當華為P20發佈,我們看到AI的主動服務已經聚焦在了攝影領域。其搭載的AI攝影大師系統可以實現從場景檢測、推薦規則、使用者習慣三個層面定義拍攝技術,為用戶帶來更加強大的拍照體驗。看起來,攝影技術是讓用戶越來越傻,所有的問題都交由手機來解決,用戶只需要點一下快門甚至說一聲“拍照”,就可以享受手機為自己帶來的視覺盛宴。

當手機主動服務的範圍越來越廣,或許有必要把這些分散式的服務綜合起來,來給使用者帶來更深度的服務體驗。比如榮耀推出的Magic Live系統,其可以自動添加連絡人、識別微信聊天內容,為你建立事件檔案並發佈提醒。

這些智慧提醒功能實際上已經初步具備了主動服務的形態。其運行模式也相對簡單,集中對單個的資訊進行獨立的提取分析,而且主要是基於地理、天氣、交通三個系統的提醒。換句話說,這些都是既定的模式,只需要經過少量的資料分析和處理就能得出相應的結論,然後作出提醒。

然而,更高級的主動服務形態勢必不是基於既定程式和資料的分析,而是通過對人的習慣、愛好和思維方式的學習,來實現手機對人的思考。

這樣一個實現的過程可以總結為:從一開始的人學習操作手機,到現在的手機向人學習,從而更像人。

乍一聽似乎非常玄妙,其實體現在主動服務的進化上,完全可以用兩個詞來解釋:提醒和建議。

我們上面說到,情景智慧的運行模式是對單個資訊進行獨立的提取分析,再結合地理位置等資訊後作出有關交通、天氣等“提醒”。那麼,更深度的主動服務對單個資訊的處理則要調動更為複雜的手機模組來進行綜合分析處理,然後提出“建議”。

比如你對手機說“我想看電影”,手機就會根據你的觀影傾向比如評分、題材、電影院等給你買好一張電影票,然後安排好最適宜的出行方式、路線,給出觀影結束後的活動建議。又如你來到一家餐廳,手機會根據你的習慣主動幫你點餐,或者根據你的用餐口味點一些你從來沒有吃過但是會喜歡吃的菜。

這就需要更強大演算法和算力來進行資料的儲存和處理。在慢慢對人進行學習的過程中,能夠進一步地理解和判斷人的意向,從而由最初的人能用手機幹什麼向手機能為人做什麼轉化,手機也就越來越像人。

我們的雙手,也便在這樣的被理解中解放,得以騰出空來去完成其他的事業。

托起的可能:硬實力的背後加持

世界上第一台電腦問世的時候,誰也沒有想到它的體積會越來越小,但算力會變得如此之強大。從電子管、電晶體、積體電路再到如今的量子電腦,從最初的每秒5000次計算到如今的接近10億億次,人類技術進步的腳步快得令人窒息。

正是擁有如此強大的運算能力,電腦在當下的應用廣泛程度才無可匹敵。由此觀之,要實現對人類行為的計算理解,硬體的保障顯得十分重要。

所以,首先必須要為手機裝上一個智慧大腦,而這個大腦就是AI晶片。麒麟970是球首款內置神經網路單元(NPU)的人工智慧處理器。它的加入,讓手機各主體單元的分工更加明確和細緻:GPU和CPU負責計算的速度和力度,NPU則負責計算的深度,再加上負責提高AI性能密度的HiAI移動計算架構則,計算任務被明確分配,資源調配的獨立進行在各個模組上實現了可能。這就實現了在移動終端進行深度學習、神將網路技術等任務的進行,為整體計算工作大大的提高了效率。可以說,AI晶片的算力加持,是一切主動服務的首要前提。

除了讓手機輕鬆地進行圖像識別和語音辨識,為了推進更好的主動服務,也可以嘗試著加強手機的空間感知能力。這樣,當你從口袋裡拿出手機,手機就可以根據你掏出手機的角度、方向等來判斷你的目的是解鎖、拍照還是接聽電話。在拍照的時候,陀螺儀可以檢測你按下快門的瞬間的手機抖動幅度,然後自動修復偏移誤差。再比如借助陀螺儀的定位功能,在GPS信號弱的時候可以根據手機移動距離來進行暫時的導航。此外,在VR遊戲等場景下,陀螺儀的重要性也不言自明。

這就像一位學武之人,他若想修煉出一套獨門劍術,就必須要有一身鋼筋鐵骨、一把絕世利器。外修於形,內練於神,才能利刃出鞘,天下拜服。

同樣,以AI晶片為主導,圍繞著其增強硬體設定,同時發揮手機內部各模組之間的聚合效應,才能為手機主動服務的落地提供硬性條件。

風險的平息:安全是上臺的底氣

也許會有人擔心:如果一切硬體、軟體、AI生態等條件統統達到了標準,基於用戶個性而打造的主動服務也必然會讀取大量的使用者私人資訊。可以說,人好似在手機裡裸奔。其綁定的各種金融帳戶一旦遭竊,輕易就能令人一夜回到解放前。Facebook隱私洩露事件至今折騰得小紮焦頭爛額,萬一在手機裡出現這樣重大的安全事件怎麼辦?

所以,資料安全、本地算力和感測器豐富三者協同共進,才能共同構成手機主動服務的前提。

AI晶片的研發與應用其實正是解決這個問題的最好辦法。普通的CPU和GPU算力不足,其在處理使用者資料的時候往往會將其上傳到雲端。雖然雲端加密技術也在不斷地進步,但在上傳和返回的途中仍然會存在洩密的可能。蘋果的iCloud被破解導致好萊塢眾女星顏面盡失,慘痛的教訓歷歷在目。而AI晶片的強大算力令對資料的處理在移動終端就可以實現,不上雲就斷絕了洩漏的可能。移動終端就相當於一個U盤,把U盤揣兜裡還能有被複製的可能的話,那這個世界的技術估計必須得經歷一次前所未有的爆炸,甚至……推翻現有的物理理論體系。這個在理論上顯然不太可能。

另一方面必須要注意的是,AI獲取使用者的資料必須要建立在一個基礎上:用戶的授權。一切未經用戶的授權而讀取隱私和硬性要求授權的行為都是耍流氓,我們必須要堅決抵制這種流氓行徑。只有用戶讓手機理解自己,手機才能理解。生殺大權仍然是用戶掌握。

使用者的資料又可以分為兩類:核心資料和非核心資料。

核心資料,顧名思義,是對使用者極其重要的資料內容。如支付密碼。上文提到的即拍即買中“買”的行為就必須要涉及到手機支付,而手機支付就必須要用到支付密碼。由於涉及到資金的安全,手機只有在使用者授權自動劃撥的情況下,才能完成這一服務,否則就是無稽之談。又如對使用者地理位置資訊的記錄。如果用戶不授權AI的GPS定位,那麼諸如停車位置、目的地規劃也就無法實現。因此,種種涉及到用戶的資金、位置、照片等隱私資料的讀取,都必須要經過用戶的授權才可以。

非核心資料,則是手機必須要讀取的使用者資訊,且只在本手機上才能使用。如開鎖用的使用者指紋、面部結構,用於接收語音服務、識別等指令的聲紋等,這類資訊功能定向,不具有普遍適用性和價值,是進行手機操作的必備資料。這類資料基本不存在授權的問題。

從這個層面上來講,主動服務實質上是使用者的一種情願行為。在使用者授權的前提下讀取資料,訓練手機AI的理解力和關懷力,才會讓用戶覺得到被理解和被關懷的溫暖。牛不喝水強摁頭,不是AI服務的邏輯。

此外,在應對本地資料安全方面,手機也會提供一些加密方法。比如為了保護使用者的圖片、音訊、視頻和文檔等資料,專門開發保密櫃功能,給用戶隱私再加上一塊防盜大鎖。

移動終端計算、使用者授權和保密功能的多重資料隱私保護手段齊下,讓用戶的隱私零洩漏,才是能讓使用者主動服務在這個溫暖的旅館中安然入睡的最優方案。

當手機的主動服務被徐徐打開,也就意味著更多變革的可能。工具從此被賦予了更廣闊的意義:它不再是被人施以冰冷的指令去執行,而是用心去感知人的靈魂與情感。它愈加像人,又保持著距離,跟隨著刀耕火種一路走來,也將以新的姿態緊隨著我們,在未來之路上昂首而立。

用戶只需要點一下快門甚至說一聲“拍照”,就可以享受手機為自己帶來的視覺盛宴。

當手機主動服務的範圍越來越廣,或許有必要把這些分散式的服務綜合起來,來給使用者帶來更深度的服務體驗。比如榮耀推出的Magic Live系統,其可以自動添加連絡人、識別微信聊天內容,為你建立事件檔案並發佈提醒。

這些智慧提醒功能實際上已經初步具備了主動服務的形態。其運行模式也相對簡單,集中對單個的資訊進行獨立的提取分析,而且主要是基於地理、天氣、交通三個系統的提醒。換句話說,這些都是既定的模式,只需要經過少量的資料分析和處理就能得出相應的結論,然後作出提醒。

然而,更高級的主動服務形態勢必不是基於既定程式和資料的分析,而是通過對人的習慣、愛好和思維方式的學習,來實現手機對人的思考。

這樣一個實現的過程可以總結為:從一開始的人學習操作手機,到現在的手機向人學習,從而更像人。

乍一聽似乎非常玄妙,其實體現在主動服務的進化上,完全可以用兩個詞來解釋:提醒和建議。

我們上面說到,情景智慧的運行模式是對單個資訊進行獨立的提取分析,再結合地理位置等資訊後作出有關交通、天氣等“提醒”。那麼,更深度的主動服務對單個資訊的處理則要調動更為複雜的手機模組來進行綜合分析處理,然後提出“建議”。

比如你對手機說“我想看電影”,手機就會根據你的觀影傾向比如評分、題材、電影院等給你買好一張電影票,然後安排好最適宜的出行方式、路線,給出觀影結束後的活動建議。又如你來到一家餐廳,手機會根據你的習慣主動幫你點餐,或者根據你的用餐口味點一些你從來沒有吃過但是會喜歡吃的菜。

這就需要更強大演算法和算力來進行資料的儲存和處理。在慢慢對人進行學習的過程中,能夠進一步地理解和判斷人的意向,從而由最初的人能用手機幹什麼向手機能為人做什麼轉化,手機也就越來越像人。

我們的雙手,也便在這樣的被理解中解放,得以騰出空來去完成其他的事業。

托起的可能:硬實力的背後加持

世界上第一台電腦問世的時候,誰也沒有想到它的體積會越來越小,但算力會變得如此之強大。從電子管、電晶體、積體電路再到如今的量子電腦,從最初的每秒5000次計算到如今的接近10億億次,人類技術進步的腳步快得令人窒息。

正是擁有如此強大的運算能力,電腦在當下的應用廣泛程度才無可匹敵。由此觀之,要實現對人類行為的計算理解,硬體的保障顯得十分重要。

所以,首先必須要為手機裝上一個智慧大腦,而這個大腦就是AI晶片。麒麟970是球首款內置神經網路單元(NPU)的人工智慧處理器。它的加入,讓手機各主體單元的分工更加明確和細緻:GPU和CPU負責計算的速度和力度,NPU則負責計算的深度,再加上負責提高AI性能密度的HiAI移動計算架構則,計算任務被明確分配,資源調配的獨立進行在各個模組上實現了可能。這就實現了在移動終端進行深度學習、神將網路技術等任務的進行,為整體計算工作大大的提高了效率。可以說,AI晶片的算力加持,是一切主動服務的首要前提。

除了讓手機輕鬆地進行圖像識別和語音辨識,為了推進更好的主動服務,也可以嘗試著加強手機的空間感知能力。這樣,當你從口袋裡拿出手機,手機就可以根據你掏出手機的角度、方向等來判斷你的目的是解鎖、拍照還是接聽電話。在拍照的時候,陀螺儀可以檢測你按下快門的瞬間的手機抖動幅度,然後自動修復偏移誤差。再比如借助陀螺儀的定位功能,在GPS信號弱的時候可以根據手機移動距離來進行暫時的導航。此外,在VR遊戲等場景下,陀螺儀的重要性也不言自明。

這就像一位學武之人,他若想修煉出一套獨門劍術,就必須要有一身鋼筋鐵骨、一把絕世利器。外修於形,內練於神,才能利刃出鞘,天下拜服。

同樣,以AI晶片為主導,圍繞著其增強硬體設定,同時發揮手機內部各模組之間的聚合效應,才能為手機主動服務的落地提供硬性條件。

風險的平息:安全是上臺的底氣

也許會有人擔心:如果一切硬體、軟體、AI生態等條件統統達到了標準,基於用戶個性而打造的主動服務也必然會讀取大量的使用者私人資訊。可以說,人好似在手機裡裸奔。其綁定的各種金融帳戶一旦遭竊,輕易就能令人一夜回到解放前。Facebook隱私洩露事件至今折騰得小紮焦頭爛額,萬一在手機裡出現這樣重大的安全事件怎麼辦?

所以,資料安全、本地算力和感測器豐富三者協同共進,才能共同構成手機主動服務的前提。

AI晶片的研發與應用其實正是解決這個問題的最好辦法。普通的CPU和GPU算力不足,其在處理使用者資料的時候往往會將其上傳到雲端。雖然雲端加密技術也在不斷地進步,但在上傳和返回的途中仍然會存在洩密的可能。蘋果的iCloud被破解導致好萊塢眾女星顏面盡失,慘痛的教訓歷歷在目。而AI晶片的強大算力令對資料的處理在移動終端就可以實現,不上雲就斷絕了洩漏的可能。移動終端就相當於一個U盤,把U盤揣兜裡還能有被複製的可能的話,那這個世界的技術估計必須得經歷一次前所未有的爆炸,甚至……推翻現有的物理理論體系。這個在理論上顯然不太可能。

另一方面必須要注意的是,AI獲取使用者的資料必須要建立在一個基礎上:用戶的授權。一切未經用戶的授權而讀取隱私和硬性要求授權的行為都是耍流氓,我們必須要堅決抵制這種流氓行徑。只有用戶讓手機理解自己,手機才能理解。生殺大權仍然是用戶掌握。

使用者的資料又可以分為兩類:核心資料和非核心資料。

核心資料,顧名思義,是對使用者極其重要的資料內容。如支付密碼。上文提到的即拍即買中“買”的行為就必須要涉及到手機支付,而手機支付就必須要用到支付密碼。由於涉及到資金的安全,手機只有在使用者授權自動劃撥的情況下,才能完成這一服務,否則就是無稽之談。又如對使用者地理位置資訊的記錄。如果用戶不授權AI的GPS定位,那麼諸如停車位置、目的地規劃也就無法實現。因此,種種涉及到用戶的資金、位置、照片等隱私資料的讀取,都必須要經過用戶的授權才可以。

非核心資料,則是手機必須要讀取的使用者資訊,且只在本手機上才能使用。如開鎖用的使用者指紋、面部結構,用於接收語音服務、識別等指令的聲紋等,這類資訊功能定向,不具有普遍適用性和價值,是進行手機操作的必備資料。這類資料基本不存在授權的問題。

從這個層面上來講,主動服務實質上是使用者的一種情願行為。在使用者授權的前提下讀取資料,訓練手機AI的理解力和關懷力,才會讓用戶覺得到被理解和被關懷的溫暖。牛不喝水強摁頭,不是AI服務的邏輯。

此外,在應對本地資料安全方面,手機也會提供一些加密方法。比如為了保護使用者的圖片、音訊、視頻和文檔等資料,專門開發保密櫃功能,給用戶隱私再加上一塊防盜大鎖。

移動終端計算、使用者授權和保密功能的多重資料隱私保護手段齊下,讓用戶的隱私零洩漏,才是能讓使用者主動服務在這個溫暖的旅館中安然入睡的最優方案。

當手機的主動服務被徐徐打開,也就意味著更多變革的可能。工具從此被賦予了更廣闊的意義:它不再是被人施以冰冷的指令去執行,而是用心去感知人的靈魂與情感。它愈加像人,又保持著距離,跟隨著刀耕火種一路走來,也將以新的姿態緊隨著我們,在未來之路上昂首而立。