您的位置:首頁>科技>正文

獲A輪融資 他深入300萬網站頻道挖20億資料 金融機構放貸審核以秒計

◆ 作為清華博士, 高強帶著一批精英創立了“法海風控”。

文| 鉛筆道 記者 趙芳馨

►導語

招商銀行、工商銀行、交通銀行等20家大型銀行,

鄧白氏、芝麻信用、萬達征信等國內外征信機構, 以及支付寶、58同城等互聯網金融企業, 它們背後有一個共同的服務商——法海風控。

2014年7月, 高強創立法海風控, 定位于金融風控大資料服務商, 服務于銀行, 金融、征信機構。 其系統採集了包含涉訴、稅務、工商、環保等20大領域、140個維度的企業信用資料, 總量為20億;再利用人工智慧技術將資料結構化, 進而為金融機構定制化建模。

從採集資料到建模完成, 法海風控一般花費2~3個月時間。 傳統征信手段依賴於人工調查、寫報告, 放貸結果往往需一周後知曉;而模型打分、出報告, 最快僅需要幾秒鐘。

今年1月, 法海風控獲得A輪融資, 投資方為雪杉資本和綠禾資本。

硬需求

清華經濟管理學院出身的高強,

在金融活動中發現了一個“硬”需求。 金融機構、銀行等需要收集企業的負面資訊, 因為涉及金融信貸時, 企業往往把自己包裝得光鮮亮麗, 很少主動提供不利消息。

沿著這一思路, 他集結了一批清華系的精英, 以及花旗、渣打等銀行前高管為銀行、金融機構、征信企業服務。 “法海風控”隨之於2014年7月成立, 定位于金融風控大資料服務商。

鄧白氏(歷史最悠久的企業資信調查類信用管理公司)是法海風控最早的合作夥伴。 起初, 它希望高強及團隊做資料獲取, 其核心是司法資料。

在此之前, 鄧白氏利用人工調查、編輯資料。 但各省市的法院多達3000多家, 企業也不局限於在某一地區做生意。 “根本沒辦法單獨查。 ”

而資料獲取是法海風控的強項。

在清華讀博士時, 高強創立蔚藍網路書店, 就開發了一套系統, 用於採集大量的圖書簡介、圖片資訊等。

在原有資源的基礎上, 團隊研發了人工智慧系統“小龍人”, 其核心之一是天羅採集系統。 擬人化的“小龍人”在網上巡邏, 查看頻道、資料是否增加, 若出現新資料則進行採集。

服務鄧白氏時, 系統掃描追蹤了16萬個司法方向的網站頻道, 最終採集3億多條消息。 在客戶最關心的資料完備性上, 系統基本能實現採集到完備的資料。

隨後, 法海風控一路走得比較順利。 各大銀行也找上門來, 希望法海風控為其提供資料服務。

20領域140維度數據

起步於司法資料, 但這還遠遠不夠。

很快, 客戶提出了新需求:能不能把相關新聞也摘出來?利用語義分析,

系統把洋洋灑灑的新聞稿變成一句話摘要, 比如某企業上市、開展新合作等。 其定向語義分析準確率約為98%。

除了新聞之外, 法海風控逐步增加了稅務、環保、行政處罰等資訊, 共20大領域、140個維度。 為了保證可信度, 這些外部資訊的背書來自于權威媒體、政府機構等。

每一條採集來的資料, 系統均為其打標籤。 銀行中有企業信用的五級分類, 而團隊發明了風險資訊五級分類(已申請專利), 包括警告、負向、中性、正向和利好。 以企業老闆失聯為例, “警告”的標籤顯示了銀行最關心的部分——此類事件的性質。

有了標籤, 團隊可以為客戶提供更深層次的服務:一是把文本化的資料結構化, 可大批量輸出;二是建模。

◆ 法海風控的系統名, 如元界、天羅、小龍人等都是中國風。

通過建模, 銀行等機構得到企業的風險概率, 再確定是否放貸。 這是一項個性化的需求, 因此團隊中的專家們制定相應方案, 再據此調教人工智慧系統, 為企業打分。

一般而言, 打分的依據是機構的信貸偏好。 “有的機構放貸,企業收益要達到30%,有的5%即可。”在此基礎上,模型通過2000多個維度欄位,算出哪一家企業有問題。

在測試中,法海風控利用外部資料與客戶歷史資料做對比,計算出的企業不良準確率吻合度約為60.8%。

更顯著的是效率的提升。從採集資料到建模完成,法海風控一般花費2~3個月時間。傳統征信手段依賴於人工調查、寫報告,放貸結果往往需一周後知曉;而模型打分、出報告,最快僅需要幾秒鐘。“大幅度降低成本,最起碼大量的人工就用不著了。”

獲A輪融資

隨著客戶增多,越來越多的機構選擇法海風控,比如支付寶(芝麻信用)。“金融信貸圈子不大,靠的是口碑和圈內相互推薦。”

總的來說,這些大體量客戶的需求精確,多為定制化服務。但實際上,躺在法海風控後臺的兩萬多家申請試用的企業,只有少部分享有了團隊的服務。

而高強並不想放棄頂級客戶之下的巨大市場。在他看來,法海的優勢在於“人工智慧方向上有頂尖科學家”,團隊也足夠優秀。待到成本降下來,開發出通用簡化版模型之後,系統就能大規模推出。

今年1月,法海風控獲得A輪融資,投資方為雪杉資本和綠禾資本。在此之前,公司曾獲得好貸網的天使輪投資。

因此本輪融資之後,高強計畫繼續服務更多的優秀金融機構。他著重點出“優秀”二字,若保持現有客戶的品質和業務的專精,“在別處發力的前景也是很樂觀的”。

截至目前,法海風控每天掃描跟蹤300多萬個網站頻道,採集收錄20大領域、140個維度的20多億條信用數據。未來,他希望這個資料能達到100億。

而人工智慧系統的下一步的目標則是40個領域、400個維度的資料。“這些資料和維度,會產生很多神奇的效果。”對此高強留了一個懸念,“肯定不是現在的玩法。”

/The End/

編輯 孫 嬌 校對 石 偉

“有的機構放貸,企業收益要達到30%,有的5%即可。”在此基礎上,模型通過2000多個維度欄位,算出哪一家企業有問題。

在測試中,法海風控利用外部資料與客戶歷史資料做對比,計算出的企業不良準確率吻合度約為60.8%。

更顯著的是效率的提升。從採集資料到建模完成,法海風控一般花費2~3個月時間。傳統征信手段依賴於人工調查、寫報告,放貸結果往往需一周後知曉;而模型打分、出報告,最快僅需要幾秒鐘。“大幅度降低成本,最起碼大量的人工就用不著了。”

獲A輪融資

隨著客戶增多,越來越多的機構選擇法海風控,比如支付寶(芝麻信用)。“金融信貸圈子不大,靠的是口碑和圈內相互推薦。”

總的來說,這些大體量客戶的需求精確,多為定制化服務。但實際上,躺在法海風控後臺的兩萬多家申請試用的企業,只有少部分享有了團隊的服務。

而高強並不想放棄頂級客戶之下的巨大市場。在他看來,法海的優勢在於“人工智慧方向上有頂尖科學家”,團隊也足夠優秀。待到成本降下來,開發出通用簡化版模型之後,系統就能大規模推出。

今年1月,法海風控獲得A輪融資,投資方為雪杉資本和綠禾資本。在此之前,公司曾獲得好貸網的天使輪投資。

因此本輪融資之後,高強計畫繼續服務更多的優秀金融機構。他著重點出“優秀”二字,若保持現有客戶的品質和業務的專精,“在別處發力的前景也是很樂觀的”。

截至目前,法海風控每天掃描跟蹤300多萬個網站頻道,採集收錄20大領域、140個維度的20多億條信用數據。未來,他希望這個資料能達到100億。

而人工智慧系統的下一步的目標則是40個領域、400個維度的資料。“這些資料和維度,會產生很多神奇的效果。”對此高強留了一個懸念,“肯定不是現在的玩法。”

/The End/

編輯 孫 嬌 校對 石 偉

Next Article
喜欢就按个赞吧!!!
点击关闭提示