您的位置:首頁>科技>正文

金融業可能根本沒有大資料?!

大資料行業中又出現了一例引人矚目的投資, 一家名為Crux Informatics的初創公司拿到了1000萬美元的種子輪。 1000萬的金額不值一提, 但這次投資的領投者是投行大鱷高盛。

Crux Informatics也只專注兩件金融行業的事:第一, 處理非結構化資料。 第二, 建立資訊供應鏈保證各個金融機構的資料隱私, 確保他們不被私自售賣和利用。

綜合兩點來看, Crux Informatics很可能是高盛在大資料領域最正確的一筆投資。

金融業有大資料?哈哈哈哈哈

說這話的原因, 可以先用一個笑話來解答。

“Big Data is like teenage sex: Everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it too .”

大數據就像是青春期的性生活:每個人都在討論, 卻沒人知道到底要怎麼做, 每個人都覺得別人已經做過了, 所以每個人都聲稱自己也有。

沒錯, 在金融行業, 尤其是傳統金融機構中, 大資料應用的比例要比我們想像中低得多。 原因主要有以下兩點:

第一, 金融機構資料敏感性高, 金融機構自身對資料的處理能力卻不夠。

每個銀行的儲蓄資訊、證券機構的交易記錄, 這些資料不僅僅是我們作為客戶的隱私, 更關係著金融機構自己的經營狀況、操作經驗。 交給科技企業來處理, 沒有意外萬事大吉, 可要是出了點什麼狀況, 客戶們忙著擠兌已經是最好的情況, 要是有哪個程式師暗搓搓的用深度學習從交易記錄中訓練一個操盤模型……投行經營們只有哭的份了。

於是, 我們會看到高盛、摩根大通這些大鱷這幾年在人工智慧技術方面的投資並不落後於科技企業。 不過, 那些中小金融機構該怎麼辦?

第二, 金融機構中有大量非結構資料沒能被利用。

關於結構化資料和非結構化資料的區別此前已經解釋過很多, 簡單來說一類資訊能夠用資料或統一的結構加以表示,

我們稱之為結構化資料, 如數位、符號;反之則是非結構化資料, 比如圖像、音訊、視頻、辦公文檔等等。

而金融機構中最有價值的, 還是那些非結構化資料, 小到使用者住址、學歷、各種資產證明的影本, 大到操盤手們的交易記錄。 可這些資料都以圖片、表格等等形式存在資料庫中, 沒准還會定時被覆蓋掉。 金融機構自己是很難有能力處理這些資料的, 根據結構化資料建立模型幾乎是他們的極限了。 可要是尋找外援來處理, 就又回到了第一個問題, 如何保證資料的隱私?

於是, 為了解決這種迷之迴圈, 高盛乾脆找了一家能夠一次解決兩個問題的公司。

非結構化資料到底有多重要?

由於資料不足, 我們暫時不能瞭解到Crux Informatics用來保護資料隱私的“資訊供應鏈”究竟是什麼, 從字面上看, 很有可能是區塊鏈技術。 不過, 我們可以討論一下保護資料的下一步:利用非結構化資料, 對於金融機構來說到底有多重要。

先從最常說的風控談起。 我們理解的風控或許只是在放貸之前考察一下這個人有沒有償還能力,

其實對於金融來說, 風控常常貫徹在金融交易的整個過程中。

比如在涉及到工農業生產的供應鏈金融中, 即使貸款主體有著足夠的資質和償還能力, 金融機構更想看到的局面還是對方能夠按時償還貸款, 而不是百般索求甚至沒收對方的資產。 這時動態的、精准的風控能力就非常重要。

最簡單的例子:金融機構對歷史資料進行整理, 發現以往有過惡劣天氣導致農作物歉收、貸款主體無法償還貸款的情況。 就可以在相同情況發生時, 提前做出調整。

除了風控之外, 在精准行銷上非結構化資料也能起到作用。 從廣告投放到為客戶推薦組合基金, 每一步都需要對客戶群體有著足夠的瞭解。 而想要瞭解客戶,光靠存款金額是遠遠不夠的。

我們甚至可以把電商的推薦演算法應用起來,看看住在同一片區域的人是否有著相似的理財傾向。

總之,這一切都要依靠銀行自己的非結構化資料。

尷尬的國情下,金融資料創業者能和BAT共舞嗎?

當我們把目光放回中國,情況又有些不同。

在金融機構資料的敏感度上,因為眾所周知的原因,相比國外我們有過之而無不及。至於金融機構本身資料技術能力就更為尷尬,國有銀行在金融產業佔有優勢地位,可大體量、國字頭往往又意味著在新晉技術上稍微落後。

最後導致中國全體金融機構對於大資料的利用都較弱。這其中又會存在著哪些機會?

首先,BAT等巨頭企業恐怕會成為這種情況下最大的受益者。

當無法利用自身資料,卻又想追趕上大資料浪潮時,金融機構們紛紛開始選擇直接利用科技企業的大資料成果。而BAT們壟斷了大量的社交資料、電商數據和行為資料。甚至可以說,走出不能被利用的資料禁地,就又進入了被BAT們壟斷的大資料海洋。

加上BAT的技術人才儲備和豐富的行銷管道,直接把風控模型和精准行銷交給他們是很好的選擇。

但這也不證明創業團隊就失去了用武之地。

BAT們雖然有著絕對優勢,但他們多少都會涉及到金融業務,難免會和金融機構有競爭關係。目前雙方處於“擱置爭議,共同開發”的時期,不過也給了小團隊另一種籌碼。

想要與大象共舞,小團隊顯然不必用資料量和BAT們硬碰硬,從細微之處進行創新是個不錯的選擇。

比如演算法:試著從現在流行的深度學習、增強學習等等角度出發,用演算法去解決金融行業的需求,應用於高頻交易的“冰山演算法”就是個不錯的例子。

比如智慧硬體:在物聯網的未來,用各種智慧硬體增加資料收集的維度一定是重要趨勢。開發能收集豐富農業、工業、零售業資料的智慧硬體,一定會引起金融機構的興趣。

比如區塊鏈:用區塊鏈安全、隱私等特性解決金融機構資料敏感這一終極問題,還擔心拿不到融資?以ICO潮的熱度來看,相信我國一定有足夠多的區塊鏈技術團隊!

能做到以上幾點中的任何一點,就算不能拿到金融機構的巨額投資,也一定能拿到BAT的投資,拿不到投資一定會被BAT收購,沒被BAT收購……那就是被BAT抄襲了。

玩笑歸玩笑。金融行業大資料領域大有可為,不管是大公司還是小團隊,現在都還站在同一起跑線上呢。

作者:我堂堂一個熊貓

而想要瞭解客戶,光靠存款金額是遠遠不夠的。

我們甚至可以把電商的推薦演算法應用起來,看看住在同一片區域的人是否有著相似的理財傾向。

總之,這一切都要依靠銀行自己的非結構化資料。

尷尬的國情下,金融資料創業者能和BAT共舞嗎?

當我們把目光放回中國,情況又有些不同。

在金融機構資料的敏感度上,因為眾所周知的原因,相比國外我們有過之而無不及。至於金融機構本身資料技術能力就更為尷尬,國有銀行在金融產業佔有優勢地位,可大體量、國字頭往往又意味著在新晉技術上稍微落後。

最後導致中國全體金融機構對於大資料的利用都較弱。這其中又會存在著哪些機會?

首先,BAT等巨頭企業恐怕會成為這種情況下最大的受益者。

當無法利用自身資料,卻又想追趕上大資料浪潮時,金融機構們紛紛開始選擇直接利用科技企業的大資料成果。而BAT們壟斷了大量的社交資料、電商數據和行為資料。甚至可以說,走出不能被利用的資料禁地,就又進入了被BAT們壟斷的大資料海洋。

加上BAT的技術人才儲備和豐富的行銷管道,直接把風控模型和精准行銷交給他們是很好的選擇。

但這也不證明創業團隊就失去了用武之地。

BAT們雖然有著絕對優勢,但他們多少都會涉及到金融業務,難免會和金融機構有競爭關係。目前雙方處於“擱置爭議,共同開發”的時期,不過也給了小團隊另一種籌碼。

想要與大象共舞,小團隊顯然不必用資料量和BAT們硬碰硬,從細微之處進行創新是個不錯的選擇。

比如演算法:試著從現在流行的深度學習、增強學習等等角度出發,用演算法去解決金融行業的需求,應用於高頻交易的“冰山演算法”就是個不錯的例子。

比如智慧硬體:在物聯網的未來,用各種智慧硬體增加資料收集的維度一定是重要趨勢。開發能收集豐富農業、工業、零售業資料的智慧硬體,一定會引起金融機構的興趣。

比如區塊鏈:用區塊鏈安全、隱私等特性解決金融機構資料敏感這一終極問題,還擔心拿不到融資?以ICO潮的熱度來看,相信我國一定有足夠多的區塊鏈技術團隊!

能做到以上幾點中的任何一點,就算不能拿到金融機構的巨額投資,也一定能拿到BAT的投資,拿不到投資一定會被BAT收購,沒被BAT收購……那就是被BAT抄襲了。

玩笑歸玩笑。金融行業大資料領域大有可為,不管是大公司還是小團隊,現在都還站在同一起跑線上呢。

作者:我堂堂一個熊貓

Next Article
喜欢就按个赞吧!!!
点击关闭提示