聚信立CEO羅皓：互金基於社交網路分析的風險控制才剛剛開始

本文為資料猿推出的大型“金融大資料主題策劃”活動第一部分的系列徵文/案例；感謝聚信立創始人兼CEO羅皓先生的投稿

作為整體活動的第二部分，

2017年6月29日，由資料猿主辦，上海金融行業資訊協會、互聯網普惠金融研究院聯合主辦，中國資訊通信研究院、大資料發展促進委員會、上海大資料聯盟、首席資料官聯盟、中國大資料技術與應用聯盟協辦的《「資料猿·超聲波」之金融科技 · 商業價值探索高峰論壇》還將在上海隆重舉辦

在論壇現場，也將針對本次主題活動的投稿人，頒發“最佳商業洞察者”、“資料猿專欄最佳作者”兩大類人物獎

近年互聯網金融發展地如火如荼，借貸形式發生了天翻地覆的變化，新形勢下各借貸機構的風險控制也面臨著新的挑戰，無論是技術還是思想都經歷著革新。

新金融形勢下風控面臨的挑戰

傳統金融機構的風險管理，

用申請人身份特徵、借貸歷史、央行征信報告等資訊來評判個人信用等級，廣泛用於貸款審批、貸後管理，並且也起到了不錯的效果；隨著互聯網金融的快速發展，申請人借貸歷史或央行征信報告等個人資訊往往不能滿足放貸機構的需求。

比如，在聚信立每天處理的60多萬次借貸申請查詢中，近30%的人即沒有借貸歷史，也沒有央行征信報告。

這個群體對於借貸機構而言相當於“白戶”，對這個群體的風控成了機構的一大痛點；另外，職業詐騙分子的“專業水準”越來越高，他們清楚地知道銀行等借貸機構的審批條件，可以很好的偽造正常人的行為、習慣，機構單憑審核單個個體的行為資料很難區分出惡意欺詐。對於“白戶”，

以及團夥欺詐，社交網路分析都可以提供很好的解決方案。

社交網路分析方法概述

這裡簡要介紹一下聚信立的社交網路分析方法。聚信立處理了超過3000萬申請人的查詢申請，通過觀察申請人及其連絡人的聯繫網路，可構成一張覆蓋申請人及其連絡人在內的總共7億人的巨大網路，

同時覆蓋90%以上借貸人群，如何能給這個龐大網路中的每個個體精准評分呢？

我們相信近朱者赤、近墨者黑的原則同樣適用于借貸人群，本著這一理論基礎我們衍生出了自己的基於社交網路的演算法。

首先給出一些概念：

●X階連絡人：

連絡人可分為直接和間接連絡人，直接連絡人是指和申請人有過直接通話記錄的號碼，我們稱其為一階連絡人，間接連絡人是指連絡人的連絡人，依次可以分為二階連絡人、三階連絡人等，顯然直接連絡人比間接連絡人更能影響種子號碼，越高階連絡人，影響力越弱。

●聯繫強度：

根據兩個號碼之間通話頻次、週期性、主被叫關係等來判斷兩個號碼之間緊密的程度，

用於衡量兩個人之間可以互相影響的程度。

●有效連絡人：

聯繫強度達到某個特定值以上的連絡人

●黑號個數/比例：

在某個特定網路中被標為黑名單的號碼個數/比例

Google的PageRank是個很好的計算網頁排名的演算法，我們借鑒其能量傳輸的理念，並在此基礎上做了些針對性的改進：對於連絡人我們只考慮5階以內，並對聯繫強度設定了閥值，只考慮大於特定強度的連絡人，同時區分主被叫關係，在此條件下可以得到初始網路。

通過聚類、能量傳輸等模型把7億人群分割成若干個子網路，然後計算各價連絡人中黑號個數、比例、網路大小等指標，並根據聯繫強度等資訊差異性賦權，最終得出每個號碼和黑號的緊密程度。

社交網路分析的解決方案

前面提到金融借貸機構目前面臨的兩個難題：1）金融白戶：無任何征信資訊；2）團夥欺詐，下面分別看一下如何用社交網路分析方法來解決這些難題。

一、金融白戶。這一類人沒有自身資料，傳統模型已失效。但近朱者赤、近墨者黑，在一個人的緊密朋友圈中，如果有些人借債不還，但並未受到應有懲罰，這種行為經常可以傳遞給其周邊的人；同樣好的行為也會傳遞。

我們相信，同一圈子裡人的經濟、生活狀態往往趨於相近，信用等級也會趨同，對於白戶，用其緊密朋友圈的資料填補其自身空白是個不錯的選擇。另外，根據一個人在某個子網路中的主被叫頻次、比例等，可以計算出每個人在網路中的位置、影響力，進而得到其可以影響其他人的權重。

最終，我們用“白戶”緊密連絡人的加權信用等級來代表他自己的信用等級。這個方法在實戰中得到了很好的驗證。

二、團夥欺詐。現在機構面臨的欺詐很多都是組織有序的團夥欺詐。他們一旦發現某些平臺的風控漏洞，就會集中作案，以期短時間內獲得巨額利潤。

舉個例子，聚信立的蜜蜂報告已被數百家機構採用，並廣泛應用到風控流程中。有些犯罪團夥對放貸機構如何根據聚信立報告做審批有深入瞭解，就會偽裝大量符合機構審批條件（如穩定的帳單、合理的連絡人個數、通話時長等）的個體進行騙貸。

從單個申請人看，很難發現其欺詐性。但如果看整個網路，就會發現某些圈子裡的人的開戶時間、連絡人個數、通話時間、通話頻率等方面都驚人的相似。類似的欺詐行為往往有相似的網路結構，比較容易判斷這些號碼是被一個團夥整體運作。通過計算特定網路內個體的同質性或高度一致性以及網路結構，來抓團夥欺詐就容易的多。

除了風控領域，社交網路也可以有廣泛應用，如精准行銷等，這不是今天話題的重點，就不再贅述。

大資料風控的發展方向

風控技術經過數十年的發展，無論是基於個人身份資訊（如年齡、收入、職業等）還是個人設備資訊（如使用手機、電腦的行為資料）的資料採擷，都有了長足的進展，分析方法上，從評分卡、決策樹到神經網路、機器學習，技術也日漸成熟；而基於社交網路分析的風險控制才剛剛開始，隨著互聯網金融的快速發展，團夥欺詐也日趨專業化同時迅速膨脹，社交網路分析結合大資料處理技術必將是應對新形勢下欺詐的一個利器。

作者簡介：

羅皓，聚信立CEO&創始人，湖南大學精算學學士。國立愛爾蘭大學統計學碩士、中國第一批SAS認證統計師。曾任通用電氣金融公司、渣打銀行、Discover信用卡建模師、產品風險經理、資料採擷主管等。超過10年資料採擷及風險建模經驗。

歡迎更多大資料企業、愛好者投稿資料猿，來稿請直接投遞至：tougao@datayuan.cn