華文網

採訪美國資料服務商Informatica:非結構化資料服務將是下一個戰場

近日,2017Informatica資料管理高峰論壇在上海舉辦,Informatica大中國區總經理王晨傑、亞太和日本區高級副總裁Murray Sargant等出席並演講,

億歐等媒體在兩位演講結束後對之進行了採訪,討論中美資料服務的發展方向。

資料服務,要回歸資料本身

Informatica是服務全球企業的資料整合式軟體提供商,1993年在美國成立,2007年進入中國市場,發展至今,它的角色也發生了變化,由傳統的ETL服務商演變為企業雲資料管理服務商,目前圍繞客戶資料、產品資料、社交資料提供大資料管理解決方案、資料安全解決方案、主資料管理解決方案和資料集成管理解決方案支持。

Informatica大中國區總經理王晨傑現場提到公司目前通過服務方式的轉變,將提供更加靈活的混合雲、資料湖管理、資料治理、360視圖等應用服務,使IT系統變得更加簡單。

通過採訪,億歐發現資料服務領域有兩個點很值得討論和注意。

1)企業目前遇到的資料問題有哪些?

2)企業對應用資料的正確看法應該是什麼?

資料缺乏規整能力,人工智慧為之賦能

億歐曾經在企業心聲:愁的不是資料多少,而是不知如何利用一文中提到,很多企業需要構建的資料閉環是培養資料意識——挖掘價值資料——產生效果。所以服務商現在在做的事是一方面説明企業後端資料管道統一化;其次,為資料打造更加詳細的標籤,不同資料應用不同場景。很多企業業務掛在網站上,但是沒有很好的系統管理,

這樣網站運營其實舉步維艱。

據億歐瞭解Informatica目前從客戶資料、產品資料以及社交網路資料切入和分析,由結構資料進階到非結構資料服務,從而提高資料預判性和精准度。隨著發展,人工智慧和安全技術的應用也將會更加成熟。

例如,Informatica構建EIC(非結構化資料服務方案)的人工智慧解決能力,用作資料集成的人工智慧,也就是AI的引擎叫CLAIRE。通過人工智慧瞭解資料的需求,

編碼流程實現自動化。

此外,資料安全不再是傳統意義上加密和防火牆的應用,現在是加強中繼資料的安全,保證來源資料的安全,服務商會告訴客戶資料要有區分,哪些是安全資料和不安全資料,哪些是公共資料和有價值資料。

在資訊社會,資訊可以劃分為兩大類。一類資訊能夠用資料或統一的結構加以表示,我們稱之為結構化資料,如數位、符號;而另一類資訊無法用數位或統一的結構表示,

如文本、圖像、聲音、網頁等,被稱之為非結構化資料。人工智慧的加入,促進了資料的分類和處理。Informatica亞太和日本區資深副總裁Murray Sargant提到中國市場將會是資料發展最佳成熟的地區,這幾年通過微信、QQ、支付寶、大眾點評等軟體深入到每個人生活中,中國產生了巨大的資料集,毋庸置疑,無論現在還是未來,企業必須用資料驅動業務,樹立資料驅動意識才可以更懂消費群體。

運用資料之前要問目的是什麼

很多公司面臨的最大問題是為了用資料賺錢而賺錢,他們並不清楚使用資料的目的,這些公司不明白資料只是來源,應該把眼光放在商業價值和業務上,正確的邏輯是要先看業務和商業目的,尋找對應資料的價值,然後看哪些資料可用。Murray Sargant提到例如特斯拉無人駕駛的例子,自動駕駛是目的,然後怎麼做呢?裝攝像頭和感測器。考慮商業目的是什麼,定位資料,千萬別忘記“未來想幹什麼,發展成什麼樣的公司,然後利用現有設施和產品去做。”

人民群眾是海量資料的創造者,隨著場景化、行業化的服務滲透,各行業客戶需求都不一致,被問及中國本土化和中美差異問題時,王晨傑表示大資料首先是從歐美啟動,最開始講大資料是從對ETL資訊孤島進行整合開始的,他們把國外成功的案例帶到中國進行大量推薦和介紹。隨著中國推動資料發展以及政府和行業特別的需求,本土化的解決方案會更加成熟。

中國是一個自然的大資料國家,它本身的資料量和資訊巨大,每60秒鐘有那麼多的資料在轉移、在遷移、在變動,所有的這些信息量,是國外很多企業所不具備的環境和能力,未來大資料的應用中國會比其他國家走得快,更多的一線和二三四線城市會得到更加快速的發展。

備註:ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將資料從來源端經過抽取(extract)、轉換(transform)、載入(load)至目的端的過程。ETL一詞較常用在資料倉庫,但其物件並不限於資料倉庫。ETL是構建資料倉庫的重要一環,用戶從資料來源抽取出所需的資料,經過資料清洗,最終按照預先定義好的資料倉庫模型,將資料載入到資料倉庫中去。

運用資料之前要問目的是什麼

很多公司面臨的最大問題是為了用資料賺錢而賺錢,他們並不清楚使用資料的目的,這些公司不明白資料只是來源,應該把眼光放在商業價值和業務上,正確的邏輯是要先看業務和商業目的,尋找對應資料的價值,然後看哪些資料可用。Murray Sargant提到例如特斯拉無人駕駛的例子,自動駕駛是目的,然後怎麼做呢?裝攝像頭和感測器。考慮商業目的是什麼,定位資料,千萬別忘記“未來想幹什麼,發展成什麼樣的公司,然後利用現有設施和產品去做。”

人民群眾是海量資料的創造者,隨著場景化、行業化的服務滲透,各行業客戶需求都不一致,被問及中國本土化和中美差異問題時,王晨傑表示大資料首先是從歐美啟動,最開始講大資料是從對ETL資訊孤島進行整合開始的,他們把國外成功的案例帶到中國進行大量推薦和介紹。隨著中國推動資料發展以及政府和行業特別的需求,本土化的解決方案會更加成熟。

中國是一個自然的大資料國家,它本身的資料量和資訊巨大,每60秒鐘有那麼多的資料在轉移、在遷移、在變動,所有的這些信息量,是國外很多企業所不具備的環境和能力,未來大資料的應用中國會比其他國家走得快,更多的一線和二三四線城市會得到更加快速的發展。

備註:ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將資料從來源端經過抽取(extract)、轉換(transform)、載入(load)至目的端的過程。ETL一詞較常用在資料倉庫,但其物件並不限於資料倉庫。ETL是構建資料倉庫的重要一環,用戶從資料來源抽取出所需的資料,經過資料清洗,最終按照預先定義好的資料倉庫模型,將資料載入到資料倉庫中去。