您的位置:首頁>正文

萬物非聯(連)網就會有智慧,你不容錯過的智慧核心

根據英國 IT Jobs Watch、Indeed 和 Stack Overflow 等三大機構統計中, 不管是從人力職缺上還是薪資待遇, 2018年物聯網絕對是不容小覷的一個趨勢, 在上一篇文章裡我們已經為各位介紹了物聯網的基本架構,

但只有聯網這件事情, 絕對不是構成"服務"的要件之一, 所有的感應裝置永遠在做的就是資料上的搜集和處理, 但如何把Data轉換成information和Knowledge, 這中間的關鍵要素就是在現在另外一個火紅的項目"機器學習(Machine learning, ML)"

首先, ML的價值是什麼呢?大家都知道現在物聯網的應用非常廣泛, 比如像是用掃描器掃描會員Barcode去紀錄消費, 或是智慧冰箱、智慧空調等等, 都是物聯網的實用案例, 從感應裝置傳送到管理平臺, 結合應用程式的處理、分析, 並在回饋出決策指引裝置做應用等, 但關鍵點就在所謂的決策段了, 也就是所謂的"決策支援"系統, 那這和一般的資料分析有什麼不同呢?

傳統的資料分析在解釋資料這方面的確是相當稱職的一件事情,

你可以利用過去的事件, 來推估一樣的狀況發生在現在時, 會發生什麼樣的狀況, 也就是一種歷史的概念, 比如像是一間餐廳, 因為百分之80的用餐者都回復說好吃, 其中女性又占七成, 那我們可以判斷這是一間適合女性用餐的餐廳, 對吧?這就是利用過去的資料來做分析模型的一種判斷, 找出目標變數的相關性, 來推測結果, 也就是所謂的Data Mining

當然, 你可以依照過去發生的事件, 以及影響變因去做交叉比對, 在把今天發生的情況加入比對之中, 來對接下來的使用行為做出判斷, 並依據每一次的決策去做紀錄, 但這樣的資料分析通常是靜態的, 在處理快速變化和非結構化的資料面來說,

使用程度是相當有限的, 就像你把字彙都建進翻譯機之後, 把句子KEY進去做翻譯, 通常翻出來的東西很難做即時修正吧, 特別是那種新興的專有名詞, 如果沒辦法動態的捕捉這些詞彙, 那翻譯出來的精准度一定會有所落差。

這點在物聯網也是一樣, 因為資料寫入的感應裝置數量很多, 並且可以和數以萬計的外部因素去做動態關聯, 那靜態模型若是無法自我擴充的話, 決策就會有失准的可能。

難道百分之八十的人評斷說好吃的店一定好吃嗎? 會不會是有促銷活動的影響呢? 還是其他因素的關聯? 難道大家都說會下雨, 明天就不會事情天嗎?

所以在傳統的資料分析上, 除了這些過去資料輔佐外,

還會導入一些專家的決策做背書, 並建立模型與資料變數之間做關聯。 而機器學習是從變數(例如節能)出發, 然後自動尋找預測變數及其相互作用, 並去對模型做修正。

最簡單的一個實例就是我們常用的Google翻譯了, GOOGLE利用手邊龐大混亂的語彙資料集。 並將其翻譯系統母體大至全球, 廣達數十億個翻譯網頁來訓練電腦, 其中的資料包含公司網站、多語系的國際報告、多語系的使用檔、說明書..等等, 透過這樣的方式來提升翻譯的精准度, 來預判出現"Good"之後, 下一個英文字是"JOB"或是"Morning" 的機率有多高。

資料來源包含各公司網站、官方檔的多語翻譯, 國際組織的多語報告, 或是 Google 圖書掃描計畫, 納入的書籍翻譯, 甚至包含網上各種斷簡殘篇、品質參差不齊、混亂的資料。

這樣一來, 翻譯的準確度再度提升, 甚至某個英文字之後, 出現另外一個字的機率, 都能夠計算出來, 並透過回饋讓翻譯模型成長, 變得更精准。

而目前的ML主要有兩大類別如下:

1、監督式學習 (Supervised learning):指在一組實例的基礎上開發一種演算法。 例如智慧雨傘販賣為例, 可能是一個產品每天的銷售記錄。 比方說雨傘在一天之中可以賣幾支, 並推算何時可以自動補貨

2、非監督式學習 (Unsupervised Learning):結合其他資料, 讓系統主動分析並探索銷售的關鍵因素, 而非單純的日期與銷售的關係, 例如下雨天造成雨傘的銷售影響狀況、是否會有本地事件(例如抗議用傘當象徵道具..等), 來做出雨傘銷售量與這些因素關聯的關係。

若是以智慧家電為例呢?其物聯網資料分析的來來源資料可能包含如震動,環境因素如溫度、語言、文字、影像辨識,或是使用者行為等線上的資料,並結合一些開來源資料做輔助,如天氣溫濕度、新聞等做交互使用,都是一些很好的例子 ,利如智慧冷氣可以判斷使用者的習慣,並結合室內外溫,來做幾度就會開冷氣的決策支援;而智慧冰箱可以依據使用者的採買習慣來瞭解青菜吃幾周會吃完..等等。

所以物聯網的資料分析及決策支援中,有幾個關鍵要素如下:

1、大量資料並導入專家的評判做關聯,讓資料庫變成知識庫,並導入自動化的規則來彙整應用

2、對資料做分析後抓取數個關鍵變數,以及變數特徵,

3、導入機器學習,結合演算法來驗證模型的精准度,將字動結果回饋到預測過程中的參數中,來達優化預測和決策支持

但無論如何,一個好的物聯網並非是靠人為去做資料決策支援,而是應該要透過更系統化、更自動化的方式來讓產品的決策更為精准,而物聯網本身的價值並非只是在搜集資料,而是如何把資料變成服務,甚至是應用方案,才應該是物聯網的核心。

若是以智慧家電為例呢?其物聯網資料分析的來來源資料可能包含如震動,環境因素如溫度、語言、文字、影像辨識,或是使用者行為等線上的資料,並結合一些開來源資料做輔助,如天氣溫濕度、新聞等做交互使用,都是一些很好的例子 ,利如智慧冷氣可以判斷使用者的習慣,並結合室內外溫,來做幾度就會開冷氣的決策支援;而智慧冰箱可以依據使用者的採買習慣來瞭解青菜吃幾周會吃完..等等。

所以物聯網的資料分析及決策支援中,有幾個關鍵要素如下:

1、大量資料並導入專家的評判做關聯,讓資料庫變成知識庫,並導入自動化的規則來彙整應用

2、對資料做分析後抓取數個關鍵變數,以及變數特徵,

3、導入機器學習,結合演算法來驗證模型的精准度,將字動結果回饋到預測過程中的參數中,來達優化預測和決策支持

但無論如何,一個好的物聯網並非是靠人為去做資料決策支援,而是應該要透過更系統化、更自動化的方式來讓產品的決策更為精准,而物聯網本身的價值並非只是在搜集資料,而是如何把資料變成服務,甚至是應用方案,才應該是物聯網的核心。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示