您的位置:首頁>正文

百度大腦人工智慧技術圓了走失27年孩子的尋親夢

經濟日報·中國經濟網記者 佘 穎

▶ 因為擔心養父母知道自己尋親會有想法, 付貴堅持不公開自己的幼年照和正面照。 根據記者的觀察, 他和父親比較像, 尤其是眼睛部分。

本報記者 佘 穎攝

▼ 病床上的付貴與家人視頻, 這是27年來他們的第一次見面。

本報記者 佘 穎攝

如果仔細觀察, 4歲的付貴和10歲的付貴還是有點像:眼間距都很開, 鼻樑不是很高, 眼睛的形狀也類似, 只是4歲時臉圓潤些, 10歲時就變成了刀削一般的瓜子臉。

但在長達27年的時間裡, 從未有人發現, 這個遠在福建的男孩就是當初在重慶走失的付貴。

2009年, 付貴將10歲時的照片上傳到“寶貝回家”網站上, 登記資訊為“胡奎”, 出生日期為1986年4月, 失蹤日期為1991年1月1日, 失蹤地點位於福建, 沒有引起一點關注。 2017年1月, 付貴的家人上傳了那張4歲時的照片, 登記姓名為“付貴”, 出生年月為1984年11月16日, 丟失日期為1990年10月16日, 失蹤地點位於重慶市石柱縣大歇鄉。 上傳資訊的不一致以及長相的變化, 導致工作人員並未發現這兩張照片是同一個人。

直到今年3月, 百度與“寶貝回家”合作, 將人工智慧的跨年齡人臉識別技術應用于尋找走失兒童。 從首批2萬多條尋親圖片資料中, 人工智慧初步篩選出30例疑似案例, 付貴就在其中。

今年4月1日, DNA比對成功。 僅僅一個月, 分離27年的親人終於找到了彼此。

靠一張模糊的童年照找到長大後的孩子

1990年, 6歲的付貴被拐賣。 那天, 姑姑送付貴上學, 路上還給他買了一盒爆米花, 囑咐他放學早點回家。 但此後, 付貴再也沒有回來。

當時, 不要說數碼相機、拍照手機, 連普通膠捲相機都沒有普及。 這個重慶石柱農村孩子家中只有一張他4歲時的照片。 照片裡, 付貴還戴著一頂公安帽。 除此以外, 父親付光發手裡再沒有其他照片。

這種情況在我國相當普遍, 尤其是在兒童走失積案中。 時隔多年, 傷心的父母手裡往往只有一張年代久遠的童年照, 甚至是嬰兒照。 這些照片多半是生活照, 孩子可能是側面、歪著頭, 人臉很小, 光線也不一定明亮。

而孩子上傳的照片呢?除了光線、姿態的變化, 往往還多了一道變數——時間。

幼年時期, 孩子生長發育最快, 短短幾年間, 就會發生迥然不同的變化, 僅憑肉眼觀察很難判斷。 工作人員此前未能發現付貴, 也有這個原因。

現在, 人工智慧可以勝任這項任務。

在人工智慧的分析過程中, 原本光線、角度不同的兩張人臉圖片會被轉化為便於識別的統一灰度圖, 並從面部提取一個個特徵點, 再換算成不同維度, 並給每個維度配比上不同的權重。 當兩張照片進行對比時, 會針對每個維度挨個對比, 得出每個維度的相似度得分, 再根據每個維度的權重比例, 計算出總體的匹配度得分, 給出兩張臉的相似程度。

通過應用強化學習、深度學習方式, 百度大腦自主學習了200萬人的近2億張照片, 自主摸索出識別人臉的方法,

並發現了人臉隨年齡變化的規律。 比如, 人工智慧會自主判斷招風耳、高顴骨、朝天鼻, 並意識到這些特徵可能不會有太大改變。 當然, 由於這是人工智慧自己摸索出來的規律, 科學家們也不知道在“它”眼裡, 這些特徵是不是招風耳、高顴骨、朝天鼻。

此前, 百度大腦曾通過觀察一位小女孩4歲時的照片, 在20位少女中準確找到了長大成人後的她, 時間跨度超過15年。 而且, 百度大腦還準確識別出了這是雙胞胎中的妹妹, 沒有誤認成姐姐, 兩者的差距在演算法中不足萬分之一。

有了這樣的技術基礎, 針對“寶貝回家”平臺的資料類型, IDL深度實驗室的人臉團隊運用大規模的跨年齡資料和親子照資料進行了深度學習訓練,

並用訓練好的模型進行跨年齡人臉照片比對。 從2萬張照片裡篩選對比出4歲的付貴和10歲的付貴, 除了計算量更大, 幾乎不存在其他障礙。

正在攻堅根據父母的照片來找孩子

一張4歲的照片, 一張10歲的照片, 幫助付貴找到了親人。 在尋親的人群中, 這算是很幸運的一種。

其他情況難度更大:有些父母沒有孩子的童年照, 只好上傳自己的照片;有些孩子不知道自己是被拐賣的、走失的、抱養的, 自然不會去尋親, 父母即使上傳了照片, 也無濟於事;還有些父母因年事已高、消息閉塞, 不知道還有寶貝尋親、公安部打拐平臺這樣的尋親網站, 無法上傳尋親資訊……

今年3月, 百度團隊與“寶貝回家”對接後發現, 照片篩選對比的難度遠比預估的要大。

“首先是資料量不小,要處理6萬多條資料,其中還有許多無效照片,如部分人員去世、失蹤、無法追尋等。”百度AI平臺部產品經理楊抒含說,“此外,還有照片不規範的情況,如照片經過美化、照片中人物過多、比對年齡區間較大等,都給比對工作增加了難度”。

目前,楊抒含和“AI尋人”專案團隊正在攻堅根據父母的照片來找孩子。這不僅有時間跨度,還涉及遺傳學。

“父母長相和孩子長相的相似性是不確定的,基因的遺傳分為顯性和隱性。比方說,父母一方是大眼睛,那麼孩子可能是大眼睛,也有可能是小眼睛;甚至還有基因突變的情況,孩子的某些特徵是父母雙方都不具備的,父母都是小眼睛,孩子卻是大眼睛,給機器的干擾項要比有效資訊項還多。”楊抒含表示,如何讓機器排除干擾是目前的最大挑戰。

同時,隨著後天的生活狀態、社會環境、個人經歷的不同,先天的臉型也會發生較大變化。比如,孩子如果經常嚼口香糖,腮部肌肉就會發達,臉型會變。孩子在成長過程中,臉部也有可能受傷,傷癒後面部特徵也有改變。也就是說,孩子可能會朝著一個完全未知的方向生長。

為提高識別成功率,百度團隊反復嘗試了各種策略。“例如,將出生日期前後浮動兩三年鎖定範圍,再利用遺失地點等其他條件,把範圍縮小,在小範圍內做比對以提高成功率。”楊抒含記得,今年3月中旬,團隊把第一批篩選出來的30組匹配分數較高的照片提交給了“寶貝回家”,其中有兩組照片是高疑似的,其中一組就是付貴。

與救助站、治安、交通監控系統結合威力更大

“找了這麼多年了,我都不抱希望了。”直到確認消息的前一天,付光發還是不敢相信。他短方臉,凸眉骨,大鼻子,顴骨突起,同樣眼間距很開。

尋親是一條滿是辛酸淚的路。當年發覺兒子走失後,付光發立即報了警,並拉上鄰里親戚把周邊能找的地方找了個遍。每每聽到哪兒有丟失孩子的消息,家裡人都跑過去,拿著照片核實,看是不是付貴。

尋親是一項涉及千萬家庭的大工程,不僅是尋找被拐賣的孩子,還包括被拐賣的婦女、失智老人。外出尋親、發尋人啟事,付貴家的尋親手段也是所有尋親家庭常用的,如果不能在第一時間找回親人,後續努力往往石沉大海。

為提高救助效率,2017年1月,民政部引入百度的人臉識別技術,合作推出了百度尋人平臺。截至今年3月,平臺已對接民政部全國救助尋親網27003名走失者資料。而且,民政部與地方救助站等多方機構協調,確保每一名被送到救助站的走失者,第一時間就能採集圖像資料並上傳資料庫。由於救助站裡的走失人員大都不記得自己的名字、住址等資訊,運用人臉識別技術,可顯著提升求助者找到親人的幾率。

在打拐過程中,公安機關也需要人工智慧的介入。孩子被拐賣後,人販子或收養家庭需要為其辦理各種證件。此前,由於資料庫沒有與尋親平臺對接,人力有限,公安機關往往無法判斷這是不是被拐賣的孩子。而遍佈大街小巷的攝像頭,如果能接入人臉識別平臺,在不侵犯公民隱私的前提下,將極大提高尋人的成功率。

今年全國兩會上,百度董事長李彥宏建議國務院辦公廳牽頭,協調公安部、民政部等“反對拐賣婦女兒童行動工作部際聯席會議”的重要組成單位,統籌企業和社會力量,建立適用于搜尋走失兒童的人臉識別模型,建立覆蓋全國的走失兒童資料庫,將人臉識別技術與治安、交通監控系統相結合,利用人臉識別等大資料和人工智慧技術,進一步提升兒童走失案件的偵破效率與破案率。

“目前,我們和百度已成功對比出30餘對相似圖像,均已交給警方。警方會對這些尋親人進行DNA核實認證。”“寶貝回家”創始人張寶豔表示,希望能通過百度人工智慧與大資料的説明,説明被拐兒童家庭在尋親路上少走彎路,讓更多被拐兒童早日與家人團圓。

“首先是資料量不小,要處理6萬多條資料,其中還有許多無效照片,如部分人員去世、失蹤、無法追尋等。”百度AI平臺部產品經理楊抒含說,“此外,還有照片不規範的情況,如照片經過美化、照片中人物過多、比對年齡區間較大等,都給比對工作增加了難度”。

目前,楊抒含和“AI尋人”專案團隊正在攻堅根據父母的照片來找孩子。這不僅有時間跨度,還涉及遺傳學。

“父母長相和孩子長相的相似性是不確定的,基因的遺傳分為顯性和隱性。比方說,父母一方是大眼睛,那麼孩子可能是大眼睛,也有可能是小眼睛;甚至還有基因突變的情況,孩子的某些特徵是父母雙方都不具備的,父母都是小眼睛,孩子卻是大眼睛,給機器的干擾項要比有效資訊項還多。”楊抒含表示,如何讓機器排除干擾是目前的最大挑戰。

同時,隨著後天的生活狀態、社會環境、個人經歷的不同,先天的臉型也會發生較大變化。比如,孩子如果經常嚼口香糖,腮部肌肉就會發達,臉型會變。孩子在成長過程中,臉部也有可能受傷,傷癒後面部特徵也有改變。也就是說,孩子可能會朝著一個完全未知的方向生長。

為提高識別成功率,百度團隊反復嘗試了各種策略。“例如,將出生日期前後浮動兩三年鎖定範圍,再利用遺失地點等其他條件,把範圍縮小,在小範圍內做比對以提高成功率。”楊抒含記得,今年3月中旬,團隊把第一批篩選出來的30組匹配分數較高的照片提交給了“寶貝回家”,其中有兩組照片是高疑似的,其中一組就是付貴。

與救助站、治安、交通監控系統結合威力更大

“找了這麼多年了,我都不抱希望了。”直到確認消息的前一天,付光發還是不敢相信。他短方臉,凸眉骨,大鼻子,顴骨突起,同樣眼間距很開。

尋親是一條滿是辛酸淚的路。當年發覺兒子走失後,付光發立即報了警,並拉上鄰里親戚把周邊能找的地方找了個遍。每每聽到哪兒有丟失孩子的消息,家裡人都跑過去,拿著照片核實,看是不是付貴。

尋親是一項涉及千萬家庭的大工程,不僅是尋找被拐賣的孩子,還包括被拐賣的婦女、失智老人。外出尋親、發尋人啟事,付貴家的尋親手段也是所有尋親家庭常用的,如果不能在第一時間找回親人,後續努力往往石沉大海。

為提高救助效率,2017年1月,民政部引入百度的人臉識別技術,合作推出了百度尋人平臺。截至今年3月,平臺已對接民政部全國救助尋親網27003名走失者資料。而且,民政部與地方救助站等多方機構協調,確保每一名被送到救助站的走失者,第一時間就能採集圖像資料並上傳資料庫。由於救助站裡的走失人員大都不記得自己的名字、住址等資訊,運用人臉識別技術,可顯著提升求助者找到親人的幾率。

在打拐過程中,公安機關也需要人工智慧的介入。孩子被拐賣後,人販子或收養家庭需要為其辦理各種證件。此前,由於資料庫沒有與尋親平臺對接,人力有限,公安機關往往無法判斷這是不是被拐賣的孩子。而遍佈大街小巷的攝像頭,如果能接入人臉識別平臺,在不侵犯公民隱私的前提下,將極大提高尋人的成功率。

今年全國兩會上,百度董事長李彥宏建議國務院辦公廳牽頭,協調公安部、民政部等“反對拐賣婦女兒童行動工作部際聯席會議”的重要組成單位,統籌企業和社會力量,建立適用于搜尋走失兒童的人臉識別模型,建立覆蓋全國的走失兒童資料庫,將人臉識別技術與治安、交通監控系統相結合,利用人臉識別等大資料和人工智慧技術,進一步提升兒童走失案件的偵破效率與破案率。

“目前,我們和百度已成功對比出30餘對相似圖像,均已交給警方。警方會對這些尋親人進行DNA核實認證。”“寶貝回家”創始人張寶豔表示,希望能通過百度人工智慧與大資料的説明,説明被拐兒童家庭在尋親路上少走彎路,讓更多被拐兒童早日與家人團圓。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示