華文網

專訪平安科技:金融業已進入深度人工智慧階段,背後是你看不到的黑科技

近日,平安科技人臉識別團隊在國際權威人臉識別公開測試集LFW(Labeled Faces in the Wild)中,獲得在無限制條件下人臉驗證測試(Unrestricted,Labeled Outside Data Results)0.9960±0.0031的成績。

目前,很多成果在 LFW 人臉資料集上的準確率都停留在 99.5% 左右,平安科技團隊的成績意味著人工智慧技術之人臉識別又獲得了突破,

人臉識別、人工智慧作用于金融業有了更穩固的保障。

據雷鋒網瞭解,這項技術,來自于平安科技人工智慧實驗室,以及大資料平臺等團隊。這次測試結果的發佈,是平安科技的領先技術在國際學術層面的一次亮相。

日前,雷鋒網與平安科技智慧引擎部總經理兼大資料首席總監、“千人計畫”國家特聘專家肖京博士,

以及平安科技人工智慧實驗室主任、首席AI科學家劉飛進行了對話,談及平安科技在人工智慧研發和應用的進展與未來思考。

劉飛

AI助長金融

一般來說,在LFW做到99.5%以後,就表明了有基本的人臉識別演算法能力,但商用級人臉識別的挑戰與LFW還不太一樣。

與實驗室穩定的環境條件不同,實際應用環境中各種不確定因素比如,在手機採集照片去比對身份證照片,但這個身份證照片的解析度是被壓縮過的,而且還帶有一些浮水印等情況,都是對技術的考驗。而商用級的人臉識別應用,已經基於這些不確定因素而進行開發。

早在2013年,平安就針對人臉識別方面開始做了一個前期的調研。從2014年開始,平安科技組建了自己的人工智慧實驗室團隊,

開始研究演算法和核心技術應用。

這個目前不到50人的實驗室團隊,以深度學習為主,負責研究解決集團業務中包括機器視覺、自然語言領域的問題,以及研發電腦認知領域的新事物。

在2015年,肖京博士也加盟平安科技,負責平安科技大資料分析挖掘,及人工智慧在風險管控、欺詐識別、互聯網健康醫療、智慧運營以及個性化精准行銷等金融業務場景的研發及應用。

目前,人眼識別準確率的極限是97.53%,2016年開始,平安科技的人臉識別技術的精准度在很多測試條件下已達99%以上。從核心技術研究到產品、工程、技術的實現,再應用到業務層面,平安科技只用了一年的時間。當前,該項技術已應用於108個場景,超過1.03億+使用人次。

劉飛表示,人臉並不是穩定的生物特徵,在年齡、妝容等因素影響下識別精度也隨之受到影響。目前,基於平安體系內多年積累的大資料資源,

平安人臉識別技術自優化的架構可以應對人臉隨年齡的增加而發生的變化,包括大家關心的同卵雙生雙胞胎問題,只要對應照片被收錄,同樣可以被識別。

人臉識別技術作為人工智慧核心一環,目前已經應用到金融、安防、身份識別類等嚴肅應用上,以金融業為例,包括刷臉開卡、刷臉取款,保險中理賠對象識別等等。

AI技術的成熟運用,是“未來銀行”、“新金融”的基礎。比如,人臉識別技術全球首發應用于平安普惠小額貸款 “平安i貸2.0”的融資場景。用戶通過“平安i貸”APP申請貸款時,只需要打開手機攝像頭,由系統拍攝並抓取使用者若干面部影像,再進行檢測,即可遠端完成身份核實,最快實現3分鐘放貸。自開通以來,通過“刷臉”完成的業務量已達日均三萬。

平安科技研究深度學習,走不一樣的路

人工智慧在綜合金融的大規模應用,關鍵在於安全、準確、高效,某些規則性問題下,效率和成效甚至比人做得更出色,比如人臉識別。然而,這背後的摸索,如同黑暗隧道中前行時看到的曙光。

更少的資料,更高的精度

現在平安科技的人臉識別技術準確率達到了99.6%,對於最後的極限,劉飛說,在擁有足夠多的資料量以後,我們完全有可能往更極限的目標靠近。

但是,在很多場景下採集資料是很難的。劉飛說,“理論上說如果有更多的資料就能怎麼樣,但在理論上就做不到。比如自動駕駛的領域,它為了做到足夠安全,需要捕捉事故現場的特徵,但是你不可能去製造事故。”

所以,平安科技在研究的是,如何通過較少的樣本來達到更高的精度。劉飛表示,如果要用比較少的資料也能訓練出很高水準的話,法寶在於演算法。“我們最近就有一個讓人興奮的研究課題,也是最近這幾年在學術界也有提及的,叫‘one-shot learning’技術。”“one-shot learning”技術,可以在一個單點領域有足夠高效、深入的應用。

與此同時,和大家都希望部署的大規模神經網路不同,平安也在追求的是,做一個精緻小巧的網,它能夠應用到更加多樣的平臺上,同時精度不被損失。“事實上,我們覺得資料還可以再少一些。我們現在是百萬級的資料,但實際上已經可以做到只需要幾十萬的資料,訓練出99%以上的精度。”

AI規模化應用,需要通用型AI

劉飛表示,其實我們現在的人工智慧技術在解決當前的問題是相對分立和孤立的,人臉識別通過圖像就解決了身份識別的問題,而至於其它的方向,比如識別一個目標物體,一個電話、一輛汽車,它又是一個問題。目前人工智慧,包括深度學習的介入,還是正在解決這些單獨的問題,甚至還用不同的方法解決單個問題。

比如前文提及的“one-shot learning”技術,事實上,該技術可以在一個單點領域有足夠高效、深入的應用,但對於廣泛的應用來說,用處並不大。

“以往的神經網路無非就是前波網路、反向傳播網路這兩個網路,但也是分別在不同的領域解決問題。”劉飛介紹,在實際業務中,如果能夠把無論是語音方面的東西,還是在人臉和其它的特徵方面,結合起來,然後又重新用在非常複雜的安全領域下,也是非常有前景的。

“人工智慧界還需要一些比較通用的方法,使得人工智慧的技術基於某一個單一方案解決更多的問題。比如現在在研究的多工網路。一個神經網路能不能解決多個不同的問題?包括靜態和動態,”

然而,不同的任務的資料參數都會不同,因此,多工網路將如何實現?其實這門學科也是有歷史的,它叫AGI(通用人工智慧)。

劉飛說:“現在大家普遍的融合方法,是把幾個不同任務的神經網路淺顯地綜合在一起,過程中訓練、研發還是單獨的。比如對卷積神經網路的應用。”

然而,讓劉飛覺得興奮的是,這兩年學術上的突破並不在這方面,“大家發現誰對反向傳播網路有很大貢獻的話,那個成果非常值得驕傲,是非常超前的。”

據雷鋒網瞭解,現在典型的反向神經傳播網路LSTM,是用在了語音辨識領域;還有最近一年左右所湧現出來的生成對抗網路(GANs),也是瞄準在反向傳播網路。

不過,“當然不是說我們馬上就可以找到一種方式把它們都糅合在一起,但從2006年到現在,所有的生物學習獲得突破的問題解決的時候,都是一些在於反向傳播的突破。如果把這些基礎性的理論問題和相應的工程實踐解決好的話,可能我們未來會重新看待和設計用來解決不同領域的神經網路的問題。”

到了今天,我們看到的“刷臉”只是人工智慧技術應用的冰山一角。劉飛指出,由於監管滯後、傳統行業規範的約束,以及人工智慧本身的不可解釋性等原因,當前許多超前的技術儲備尚未能面世。舉例來說,平安科技AI實驗室中,科學家們嘗試通過對人類維持最低只有30毫秒的微表情的研究,拓展人工智慧在情感判斷、服務決策和判斷等應用。“這個還很任重道遠,但是這樣的課題已經在前幾年就被提出來,它還在發展,而且這個發展的過程會很快。”

肖京

從規則利用到資料分析,金融業進入深度人工智慧階段

除了演算法上的摸索,平安科技造的另一個輪子是大資料採擷。這兩件事,都並非一蹴而就的。

據瞭解,平安4年前開始做資料的集中。四年前,正是大資料火熱的時候。肖京博士表示,此前資料存儲在各個不同孤島上,很分散,缺乏強關聯的線索,導致資料缺乏利用的價值,比如需要更精准地識別欺詐時,無法關聯起來的資料無法發揮邏輯分析的作用。

“人工智慧的技術是基於資料的,有資料才有可為。對於金融業來說,現在已經進入到深度人工智慧的階段,讓資料發揮最大的價值。”

劉飛也解釋稱,即便更少的資料、更高的精度成為可能,但我們也不能否認資料的重要性。“當領域進入差異化發展的時候,一方面資料可帶來演算法前瞻的預言,説明做出差異化的演算法成果,同時借助資料規模又能夠較早地投入商用。而能夠較早地商用就意味著,又能幫助我們發現別人還沒有機會發現的問題,從而優化演算法,反復來訓練。”

而做資料集中,這就需要先搭建清洗、整合等一系列的底層資料應用以及平臺。這些做完了以後,最重要還是要挖掘資料的價值。做這麼多事情,所花的力氣也可想而知。對平安來說,其無非是堅持向數位化轉型。目前第一步,是趕上了大資料、AI的列車,通過挖掘資料的價值,來提升客戶的體驗,擴大自身服務能力。

平安科技成立於2008年,目前已擁有超過4000名IT技術人員和IT管理人員。平安科技的成立,是平安集團向IT專業化領域邁進,向“科技金融”模式探索的開始,也是今日其技術自主、能夠率先利用目前最為先進的AI技術創造價值的前提。劉飛向雷鋒網表示,“平安建立人工智慧實驗室,涉及深度學習領域時間不算太晚,我們在人才隊伍、基礎設施的投入方面也不小,我們也有做大規模深度學習研究的龐大GPU計算集群,研發自己的計算平臺。”

肖京博士表示,IT企業的發展要經歷幾個階段——第一個是資訊化;第二個是資料化,資訊流通以後有資料的接入,才有更好的方法能夠利用好這些資訊;第三個是智慧化,有了大量的資料以後怎麼才能讓我們的決策變得更加的智慧。

肖京說道,“在大資料的時代,我們需要有一些機器學習的深度智慧的方法,以服務那些缺乏強關聯資料的長尾使用者。這不是以往基於對明確的業務規則的利用、簡單的統計分析技術能夠完成的。”

平安集團擁有金融業全牌照,業務包括傳統金融業的證券、保險、銀行、理財、征信,同時包括互聯網金融領域的陸金所,互聯網銀行柳丁銀行,以及醫療保險領域的平安好醫生等。根據肖京介紹,平安科技作為技術輸出,其人工智慧技術已應用在平安諸多業務當中,包括金融最核心的大資料征信、風險控制、欺詐識別、市場投資分析等,以及如今最時尚的精准行銷,以及機器學習輔助的精准醫療,用於指定個性化保費等。

人臉識別作為人工智慧在圖像領域中比較成熟的應用,已經讓許多人驚歎不已。但劉飛表示,“人工智慧會推動行業變革和發展的現象,現在只是露了冰山一角。以前沒有人工智慧的時候,一些互聯網金融業務無法開展,現在有了這個技術之後就可以在安全、可控、有保證的情況下開展起來了,這可能就會改變原來延續了幾十年的行業。”

是“未來銀行”、“新金融”的基礎。比如,人臉識別技術全球首發應用于平安普惠小額貸款 “平安i貸2.0”的融資場景。用戶通過“平安i貸”APP申請貸款時,只需要打開手機攝像頭,由系統拍攝並抓取使用者若干面部影像,再進行檢測,即可遠端完成身份核實,最快實現3分鐘放貸。自開通以來,通過“刷臉”完成的業務量已達日均三萬。

平安科技研究深度學習,走不一樣的路

人工智慧在綜合金融的大規模應用,關鍵在於安全、準確、高效,某些規則性問題下,效率和成效甚至比人做得更出色,比如人臉識別。然而,這背後的摸索,如同黑暗隧道中前行時看到的曙光。

更少的資料,更高的精度

現在平安科技的人臉識別技術準確率達到了99.6%,對於最後的極限,劉飛說,在擁有足夠多的資料量以後,我們完全有可能往更極限的目標靠近。

但是,在很多場景下採集資料是很難的。劉飛說,“理論上說如果有更多的資料就能怎麼樣,但在理論上就做不到。比如自動駕駛的領域,它為了做到足夠安全,需要捕捉事故現場的特徵,但是你不可能去製造事故。”

所以,平安科技在研究的是,如何通過較少的樣本來達到更高的精度。劉飛表示,如果要用比較少的資料也能訓練出很高水準的話,法寶在於演算法。“我們最近就有一個讓人興奮的研究課題,也是最近這幾年在學術界也有提及的,叫‘one-shot learning’技術。”“one-shot learning”技術,可以在一個單點領域有足夠高效、深入的應用。

與此同時,和大家都希望部署的大規模神經網路不同,平安也在追求的是,做一個精緻小巧的網,它能夠應用到更加多樣的平臺上,同時精度不被損失。“事實上,我們覺得資料還可以再少一些。我們現在是百萬級的資料,但實際上已經可以做到只需要幾十萬的資料,訓練出99%以上的精度。”

AI規模化應用,需要通用型AI

劉飛表示,其實我們現在的人工智慧技術在解決當前的問題是相對分立和孤立的,人臉識別通過圖像就解決了身份識別的問題,而至於其它的方向,比如識別一個目標物體,一個電話、一輛汽車,它又是一個問題。目前人工智慧,包括深度學習的介入,還是正在解決這些單獨的問題,甚至還用不同的方法解決單個問題。

比如前文提及的“one-shot learning”技術,事實上,該技術可以在一個單點領域有足夠高效、深入的應用,但對於廣泛的應用來說,用處並不大。

“以往的神經網路無非就是前波網路、反向傳播網路這兩個網路,但也是分別在不同的領域解決問題。”劉飛介紹,在實際業務中,如果能夠把無論是語音方面的東西,還是在人臉和其它的特徵方面,結合起來,然後又重新用在非常複雜的安全領域下,也是非常有前景的。

“人工智慧界還需要一些比較通用的方法,使得人工智慧的技術基於某一個單一方案解決更多的問題。比如現在在研究的多工網路。一個神經網路能不能解決多個不同的問題?包括靜態和動態,”

然而,不同的任務的資料參數都會不同,因此,多工網路將如何實現?其實這門學科也是有歷史的,它叫AGI(通用人工智慧)。

劉飛說:“現在大家普遍的融合方法,是把幾個不同任務的神經網路淺顯地綜合在一起,過程中訓練、研發還是單獨的。比如對卷積神經網路的應用。”

然而,讓劉飛覺得興奮的是,這兩年學術上的突破並不在這方面,“大家發現誰對反向傳播網路有很大貢獻的話,那個成果非常值得驕傲,是非常超前的。”

據雷鋒網瞭解,現在典型的反向神經傳播網路LSTM,是用在了語音辨識領域;還有最近一年左右所湧現出來的生成對抗網路(GANs),也是瞄準在反向傳播網路。

不過,“當然不是說我們馬上就可以找到一種方式把它們都糅合在一起,但從2006年到現在,所有的生物學習獲得突破的問題解決的時候,都是一些在於反向傳播的突破。如果把這些基礎性的理論問題和相應的工程實踐解決好的話,可能我們未來會重新看待和設計用來解決不同領域的神經網路的問題。”

到了今天,我們看到的“刷臉”只是人工智慧技術應用的冰山一角。劉飛指出,由於監管滯後、傳統行業規範的約束,以及人工智慧本身的不可解釋性等原因,當前許多超前的技術儲備尚未能面世。舉例來說,平安科技AI實驗室中,科學家們嘗試通過對人類維持最低只有30毫秒的微表情的研究,拓展人工智慧在情感判斷、服務決策和判斷等應用。“這個還很任重道遠,但是這樣的課題已經在前幾年就被提出來,它還在發展,而且這個發展的過程會很快。”

肖京

從規則利用到資料分析,金融業進入深度人工智慧階段

除了演算法上的摸索,平安科技造的另一個輪子是大資料採擷。這兩件事,都並非一蹴而就的。

據瞭解,平安4年前開始做資料的集中。四年前,正是大資料火熱的時候。肖京博士表示,此前資料存儲在各個不同孤島上,很分散,缺乏強關聯的線索,導致資料缺乏利用的價值,比如需要更精准地識別欺詐時,無法關聯起來的資料無法發揮邏輯分析的作用。

“人工智慧的技術是基於資料的,有資料才有可為。對於金融業來說,現在已經進入到深度人工智慧的階段,讓資料發揮最大的價值。”

劉飛也解釋稱,即便更少的資料、更高的精度成為可能,但我們也不能否認資料的重要性。“當領域進入差異化發展的時候,一方面資料可帶來演算法前瞻的預言,説明做出差異化的演算法成果,同時借助資料規模又能夠較早地投入商用。而能夠較早地商用就意味著,又能幫助我們發現別人還沒有機會發現的問題,從而優化演算法,反復來訓練。”

而做資料集中,這就需要先搭建清洗、整合等一系列的底層資料應用以及平臺。這些做完了以後,最重要還是要挖掘資料的價值。做這麼多事情,所花的力氣也可想而知。對平安來說,其無非是堅持向數位化轉型。目前第一步,是趕上了大資料、AI的列車,通過挖掘資料的價值,來提升客戶的體驗,擴大自身服務能力。

平安科技成立於2008年,目前已擁有超過4000名IT技術人員和IT管理人員。平安科技的成立,是平安集團向IT專業化領域邁進,向“科技金融”模式探索的開始,也是今日其技術自主、能夠率先利用目前最為先進的AI技術創造價值的前提。劉飛向雷鋒網表示,“平安建立人工智慧實驗室,涉及深度學習領域時間不算太晚,我們在人才隊伍、基礎設施的投入方面也不小,我們也有做大規模深度學習研究的龐大GPU計算集群,研發自己的計算平臺。”

肖京博士表示,IT企業的發展要經歷幾個階段——第一個是資訊化;第二個是資料化,資訊流通以後有資料的接入,才有更好的方法能夠利用好這些資訊;第三個是智慧化,有了大量的資料以後怎麼才能讓我們的決策變得更加的智慧。

肖京說道,“在大資料的時代,我們需要有一些機器學習的深度智慧的方法,以服務那些缺乏強關聯資料的長尾使用者。這不是以往基於對明確的業務規則的利用、簡單的統計分析技術能夠完成的。”

平安集團擁有金融業全牌照,業務包括傳統金融業的證券、保險、銀行、理財、征信,同時包括互聯網金融領域的陸金所,互聯網銀行柳丁銀行,以及醫療保險領域的平安好醫生等。根據肖京介紹,平安科技作為技術輸出,其人工智慧技術已應用在平安諸多業務當中,包括金融最核心的大資料征信、風險控制、欺詐識別、市場投資分析等,以及如今最時尚的精准行銷,以及機器學習輔助的精准醫療,用於指定個性化保費等。

人臉識別作為人工智慧在圖像領域中比較成熟的應用,已經讓許多人驚歎不已。但劉飛表示,“人工智慧會推動行業變革和發展的現象,現在只是露了冰山一角。以前沒有人工智慧的時候,一些互聯網金融業務無法開展,現在有了這個技術之後就可以在安全、可控、有保證的情況下開展起來了,這可能就會改變原來延續了幾十年的行業。”