採訪美國資料服務商Informatica:非結構化資料服務將是下一個戰場
近日,2017Informatica資料管理高峰論壇在上海舉辦,Informatica大中國區總經理王晨傑、亞太和日本區高級副總裁Murray Sargant等出席並演講,
Informatica是服務全球企業的資料整合式軟體提供商,1993年在美國成立,2007年進入中國市場,發展至今,它的角色也發生了變化,由傳統的ETL服務商演變為企業雲資料管理服務商,目前圍繞客戶資料、產品資料、社交資料提供大資料管理解決方案、資料安全解決方案、主資料管理解決方案和資料集成管理解決方案支持。
Informatica大中國區總經理王晨傑現場提到公司目前通過服務方式的轉變,將提供更加靈活的混合雲、資料湖管理、資料治理、360視圖等應用服務,使IT系統變得更加簡單。
通過採訪,億歐發現資料服務領域有兩個點很值得討論和注意。
1)企業目前遇到的資料問題有哪些?
2)企業對應用資料的正確看法應該是什麼?
億歐曾經在企業心聲:愁的不是資料多少,而是不知如何利用一文中提到,很多企業需要構建的資料閉環是培養資料意識——挖掘價值資料——產生效果。所以服務商現在在做的事是一方面説明企業後端資料管道統一化;其次,為資料打造更加詳細的標籤,不同資料應用不同場景。很多企業業務掛在網站上,但是沒有很好的系統管理,
據億歐瞭解Informatica目前從客戶資料、產品資料以及社交網路資料切入和分析,由結構資料進階到非結構資料服務,從而提高資料預判性和精准度。隨著發展,人工智慧和安全技術的應用也將會更加成熟。
例如,Informatica構建EIC(非結構化資料服務方案)的人工智慧解決能力,用作資料集成的人工智慧,也就是AI的引擎叫CLAIRE。通過人工智慧瞭解資料的需求,
此外,資料安全不再是傳統意義上加密和防火牆的應用,現在是加強中繼資料的安全,保證來源資料的安全,服務商會告訴客戶資料要有區分,哪些是安全資料和不安全資料,哪些是公共資料和有價值資料。
在資訊社會,資訊可以劃分為兩大類。一類資訊能夠用資料或統一的結構加以表示,我們稱之為結構化資料,如數位、符號;而另一類資訊無法用數位或統一的結構表示,
很多公司面臨的最大問題是為了用資料賺錢而賺錢,他們並不清楚使用資料的目的,這些公司不明白資料只是來源,應該把眼光放在商業價值和業務上,正確的邏輯是要先看業務和商業目的,尋找對應資料的價值,然後看哪些資料可用。Murray Sargant提到例如特斯拉無人駕駛的例子,自動駕駛是目的,然後怎麼做呢?裝攝像頭和感測器。考慮商業目的是什麼,定位資料,千萬別忘記“未來想幹什麼,發展成什麼樣的公司,然後利用現有設施和產品去做。”
人民群眾是海量資料的創造者,隨著場景化、行業化的服務滲透,各行業客戶需求都不一致,被問及中國本土化和中美差異問題時,王晨傑表示大資料首先是從歐美啟動,最開始講大資料是從對ETL資訊孤島進行整合開始的,他們把國外成功的案例帶到中國進行大量推薦和介紹。隨著中國推動資料發展以及政府和行業特別的需求,本土化的解決方案會更加成熟。
中國是一個自然的大資料國家,它本身的資料量和資訊巨大,每60秒鐘有那麼多的資料在轉移、在遷移、在變動,所有的這些信息量,是國外很多企業所不具備的環境和能力,未來大資料的應用中國會比其他國家走得快,更多的一線和二三四線城市會得到更加快速的發展。
備註:ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將資料從來源端經過抽取(extract)、轉換(transform)、載入(load)至目的端的過程。ETL一詞較常用在資料倉庫,但其物件並不限於資料倉庫。ETL是構建資料倉庫的重要一環,用戶從資料來源抽取出所需的資料,經過資料清洗,最終按照預先定義好的資料倉庫模型,將資料載入到資料倉庫中去。
運用資料之前要問目的是什麼很多公司面臨的最大問題是為了用資料賺錢而賺錢,他們並不清楚使用資料的目的,這些公司不明白資料只是來源,應該把眼光放在商業價值和業務上,正確的邏輯是要先看業務和商業目的,尋找對應資料的價值,然後看哪些資料可用。Murray Sargant提到例如特斯拉無人駕駛的例子,自動駕駛是目的,然後怎麼做呢?裝攝像頭和感測器。考慮商業目的是什麼,定位資料,千萬別忘記“未來想幹什麼,發展成什麼樣的公司,然後利用現有設施和產品去做。”
人民群眾是海量資料的創造者,隨著場景化、行業化的服務滲透,各行業客戶需求都不一致,被問及中國本土化和中美差異問題時,王晨傑表示大資料首先是從歐美啟動,最開始講大資料是從對ETL資訊孤島進行整合開始的,他們把國外成功的案例帶到中國進行大量推薦和介紹。隨著中國推動資料發展以及政府和行業特別的需求,本土化的解決方案會更加成熟。
中國是一個自然的大資料國家,它本身的資料量和資訊巨大,每60秒鐘有那麼多的資料在轉移、在遷移、在變動,所有的這些信息量,是國外很多企業所不具備的環境和能力,未來大資料的應用中國會比其他國家走得快,更多的一線和二三四線城市會得到更加快速的發展。
備註:ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將資料從來源端經過抽取(extract)、轉換(transform)、載入(load)至目的端的過程。ETL一詞較常用在資料倉庫,但其物件並不限於資料倉庫。ETL是構建資料倉庫的重要一環,用戶從資料來源抽取出所需的資料,經過資料清洗,最終按照預先定義好的資料倉庫模型,將資料載入到資料倉庫中去。