您的位置:首頁>正文

人臉識別技術的難點分析

人臉識別技術的難點

雖然人臉識別技術經歷了較長的研究階段, 但至今還是被認為是生物特徵識別技術中較為困難的研究課題之一, 其原因在於:

1、背景環境的複雜多樣

在進行人臉識別前需要先對監控場景中的人臉進行定位, 即人臉檢測。 人臉檢測的正確與否直接影響人臉識別性能。 當監控場景的背景較為複雜時, 人臉檢測率也會隨之降低, 因此能夠適應複雜背景環境的人臉檢測演算法是人臉識別技術的難點之一。

2、光照條件的複雜多變

在智慧視頻監控系統的實際應用中, 會由於監控環境光線的變化造成檢測到的人臉圖像存在不同的陰暗變化,

如圖1所示。 FRVT2006測試表明, 不同光照條件下人臉識別雖然在性能上比FRVT2002有顯著提高, 但是還沒在根本上克服光照對識別率的影響。

圖:光線變化對採集到的人臉影響示意圖

3、人臉表情的多樣性

在實際應用過程中, 人臉的表情隨時都可能發生變化。 下圖給出了部分表情變化的人臉圖像。 從下圖可以看出, 當人的表情發生變化時, 可能會引起人臉輪廓以及紋理的變化, 同時由於面部肌肉的牽引, 面部的特徵點的位置也會隨之改變。 不同的表情引起面部的變化都不同, 此外, 不同的人的相同表情影響也不相同, 因此很難用統一的標準來精確劃分各種表情對不同人的影響。

圖:人臉表情變化多樣性示意圖

4、採集人臉的角度多樣性

人臉的角度多樣性主要是指由於拍攝角度的不同導致檢測到的人臉圖像的旋轉, 包括平面旋轉和深度旋轉。 圖3列出了部分不同角度拍攝的人臉圖像。 從下圖可以看出, 與表情變化對人臉圖像的影響相同, 拍攝角度的變化同樣會導致人臉輪廓的變化, 除此之外, 由於角度的變化, 可能會導致人臉的部分特徵無法被正確提取, 進一步導致人臉的錯誤識別。

圖:採集人臉的角度多樣性示意圖

5、遮擋問題

即使是非人為故意遮擋, 在實際應用時檢測到的人臉圖像也經常會出現如帽子、眼鏡等遮擋物, 除了這些, 鬍子以及劉海的變化也直接影響人臉的特徵提取。

當人臉圖像發生遮擋時, 人臉的很多資訊會丟失, 導致人臉識別演算法出錯或失效。

傳統人臉識別系統的步驟

人臉識別系統主要包括四個組成部分:人臉圖像檢測、人臉識別預處理、人臉特徵提取以及特徵匹配與識別。

1、人臉圖像檢測

人臉圖像檢測是人臉識別過程的關鍵環節之一。 人臉檢測是指對於任意一幅給定的圖像, 採用一定的策略對其進行搜索以確定其中是否含有人臉, 如果有, 則返回檢測到的人臉圖像的位置、大小以及姿態。 人臉檢測主要利用人臉圖像的長條圖特徵、顏色特徵、範本特徵、結構特徵以及haar特徵等。

2、人臉圖像預處理

預處理是指在進行人臉識別前, 為了提高識別率,

通過影像處理技術對檢測得到的人臉圖像進行的一系列圖像品質提高。 這些處理主要包括灰度校正、雜訊過濾、光線補償、長條圖均衡化、歸一化等。

3、人臉特徵提取

人臉特徵提取是對人臉進行特徵建模的過程, 提取方法主要分為兩大類:基於知識的表徵方法和基於代數特徵或統計學習的表徵方法。 目前人臉識別技術中使用的人臉特徵主要包括視覺特徵、人臉圖像變換係數特徵, 人臉圖像代數特徵等。 其中基於知識的表徵方法主要是根據人臉五官的形狀描述以及它們之間的距離特性來獲得有助於人臉分類的特徵資料, 其特徵分量通常是使用特徵點間的歐幾裡得距離、曲率或角度等。 基於幾何特徵的表徵方法是指利用人臉五官之間的結構關係的幾何描述進行人臉表徵的方法。

4、人臉匹配與識別 

匹配與識別是指利用上一步提取到的人臉特徵, 與樣本庫中存儲的特徵範本進行搜索匹配, 在這個過程中, 需要預先定義一個閾值, 當相似度超過該閾值, 則輸出匹配結果。

手機人臉識別產業鏈

人臉識別方法大致可以分為兩類:基於2D人臉圖像的人臉識別和基於3D人臉圖像的人臉識別。 其中2D人臉識別是通過2D攝像頭平面成像, 無法接收物理世界中的第三位元資訊(尺寸和距離等幾何資料), 即使演算法及軟體再先進, 在有限的資訊接收狀態下, , 安全級別終究不夠高, 通過照片//視頻/化妝/人皮面具等方式可以很容易進行破解, 無法滿足智慧手機安全級別的需求。

3D人臉識別則是通過3D攝像頭立體成像,能夠識別視野內空間每個點位元的三維座標資訊,從而使得電腦得到空間的3D資料並能夠復原完整的三維世界,並實現各種智慧的三維定位。簡單的說就是機器獲取的資訊多了,分析判斷的準確性有了極大的提升,人臉識別功能可以分辨出平面圖像/視頻/化妝/皮面具/雙胞胎等狀態,適合金融領域和智慧手機等安全級別要求高的應用場景。

1、三種主流的3D成像技術

(1)結構光(Structured Light):結構光投射特定的光資訊到物體表面後,由攝像頭採集。根據物體造成的光信號的變化來計算物體的位置和深度等資訊,進而復原整個三維空間。目前可見的其他創業公司幾乎都沿用此技術路線。

(2)TOF(Time Of Flight,飛行時間):通過專有感測器,捕捉近紅外光從發射到接收的飛行時間,判斷物體距離。

(3)雙目測距(Stereo System):利用雙攝像頭拍攝物體,再通過三角形原理計算物體距離。

微信公眾號:手機結構設計聯盟

在這三種技術當中,哪種技術更適合智慧手機的應用呢?

微信公眾號:手機結構設計聯盟

由上圖可知,三種技術當中只有雙目視覺不適合昏暗環境使用,也就是說我們的智慧手機在夜間無法實現人臉識別解鎖,首先就被排除了。

下面再來看看TOF技術和結構光技術。

TOF技術具有回應時間更快,抗光照表現尚可,深度資訊精確度高、識別距離遠等優勢,但是其也有著解析度低、成本高、功耗高、模組太大的劣勢。

而結構光技術優勢則在於低光下表現良好,解析度更高,成本、功耗適中,主要缺點是易受陽光影響,識別距離短,相應時間稍慢的缺點。

不過就應用于智慧手機上的人臉識別功能,結構光技術應該是要比TOF技術更有優勢。因為通過智慧手機的前置3D系統來進行面部識別這種應用場景本身識別的距離就很近,所以不存在需要支援更遠的識別距離的問題。另外結構光相比TOF技術,短距離的精度更高,也更適合用在手機前置攝像頭上。而且其解析度、相應時間已經足以應對手機端面部識別的需求(採用TOF技術的Project Tango手機是後置3D系統,其作用也不是主要用於面部識別)。

另外,就兩種技術所產生的深度圖來看,TOF深度圖會存在多重反射產生的噪音、邊緣精細度過低、時域濾波導致滯後等問題。而結構光的深度圖則只有邊界線清晰度略低的問題。最後,由於是用在智慧手機這樣的消費類移動設備上,所以成本、功耗也都是需要考慮的因素。

所以總的來說,如果是手機前置3D面部識別系統,結構光技術相比TOF技術更具優勢。蘋果iPhone X的FaceID採用的便是結構光技術。

1

無法滿足智慧手機安全級別的需求。

3D人臉識別則是通過3D攝像頭立體成像,能夠識別視野內空間每個點位元的三維座標資訊,從而使得電腦得到空間的3D資料並能夠復原完整的三維世界,並實現各種智慧的三維定位。簡單的說就是機器獲取的資訊多了,分析判斷的準確性有了極大的提升,人臉識別功能可以分辨出平面圖像/視頻/化妝/皮面具/雙胞胎等狀態,適合金融領域和智慧手機等安全級別要求高的應用場景。

1、三種主流的3D成像技術

(1)結構光(Structured Light):結構光投射特定的光資訊到物體表面後,由攝像頭採集。根據物體造成的光信號的變化來計算物體的位置和深度等資訊,進而復原整個三維空間。目前可見的其他創業公司幾乎都沿用此技術路線。

(2)TOF(Time Of Flight,飛行時間):通過專有感測器,捕捉近紅外光從發射到接收的飛行時間,判斷物體距離。

(3)雙目測距(Stereo System):利用雙攝像頭拍攝物體,再通過三角形原理計算物體距離。

微信公眾號:手機結構設計聯盟

在這三種技術當中,哪種技術更適合智慧手機的應用呢?

微信公眾號:手機結構設計聯盟

由上圖可知,三種技術當中只有雙目視覺不適合昏暗環境使用,也就是說我們的智慧手機在夜間無法實現人臉識別解鎖,首先就被排除了。

下面再來看看TOF技術和結構光技術。

TOF技術具有回應時間更快,抗光照表現尚可,深度資訊精確度高、識別距離遠等優勢,但是其也有著解析度低、成本高、功耗高、模組太大的劣勢。

而結構光技術優勢則在於低光下表現良好,解析度更高,成本、功耗適中,主要缺點是易受陽光影響,識別距離短,相應時間稍慢的缺點。

不過就應用于智慧手機上的人臉識別功能,結構光技術應該是要比TOF技術更有優勢。因為通過智慧手機的前置3D系統來進行面部識別這種應用場景本身識別的距離就很近,所以不存在需要支援更遠的識別距離的問題。另外結構光相比TOF技術,短距離的精度更高,也更適合用在手機前置攝像頭上。而且其解析度、相應時間已經足以應對手機端面部識別的需求(採用TOF技術的Project Tango手機是後置3D系統,其作用也不是主要用於面部識別)。

另外,就兩種技術所產生的深度圖來看,TOF深度圖會存在多重反射產生的噪音、邊緣精細度過低、時域濾波導致滯後等問題。而結構光的深度圖則只有邊界線清晰度略低的問題。最後,由於是用在智慧手機這樣的消費類移動設備上,所以成本、功耗也都是需要考慮的因素。

所以總的來說,如果是手機前置3D面部識別系統,結構光技術相比TOF技術更具優勢。蘋果iPhone X的FaceID採用的便是結構光技術。

1

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示