? 【新東網(wǎng)技術(shù)大咖帶您走進(jìn)人臉識別】這是一個刷臉的時代……
發(fā)布時間: 2017-03-06 15:58:56
文/謝海東 華南研發(fā)
人臉識別是通過分析臉部器官的唯一形狀和位置來進(jìn)行身份鑒別,它是一種重要的生物特征識別技術(shù),應(yīng)用非常廣泛。與其它身份識別方法相比,人臉識別具有直接、友好和方便等特點(diǎn),以“天翼銷售門戶”中的預(yù)受理業(yè)務(wù)為例,傳統(tǒng)的流程:
可以看出,現(xiàn)有的預(yù)受理業(yè)務(wù)中存在大量為實(shí)名認(rèn)證服務(wù)、卻與實(shí)際業(yè)務(wù)流程無關(guān)的環(huán)節(jié),對提升工作效率十分不利。
而引入人像識別之后的業(yè)務(wù)流程:
很明顯,引入人像識別之后,業(yè)務(wù)流程能夠得到極大的簡化。同時,人臉識別問題的研究不僅有重要的應(yīng)用價值,而且在模式識別中具有重要的理論意義,目前人臉識別已成為當(dāng)前模式識別和人工智能領(lǐng)域的研究熱點(diǎn)。
目前在國內(nèi)和國外研究人臉識別的方法有很多,常用的方法有:基于幾何特征的人臉識別方法、基于代數(shù)特征的人臉識別方法、基于連接機(jī)制的人臉識別方法以及基于三維數(shù)據(jù)的人臉識別方法。人臉識別流程圖如圖所示:
基于幾何特征的方法是一種自下而上的人臉檢測方法。研究人員認(rèn)為有一個潛在的假設(shè):人臉或人臉的部件可能具有在各種條件下都不會改變的特征或?qū)傩?,如形狀、膚色、紋理、邊緣信息等?;趲缀翁卣鞯姆椒ǖ哪繕?biāo)就是尋找上述這些不變特征,并利用這些特征來定位人臉。這類方法在特定的環(huán)境下非常有效且檢測速度較高,對人臉姿態(tài)、表情、旋轉(zhuǎn)都不敏感。但是由于人臉部件的提取通常都借助于邊緣檢測算子,因此,這類方法對圖像質(zhì)量要求較高。對光照和背景等有較高的要求,因?yàn)楣庹铡⒃胍?、陰影都極有可能破壞人臉部件的邊緣,從而影響算法的有效性。
模板匹配算法首先需要人TN作標(biāo)準(zhǔn)模板(固定模板)或?qū)⒛0逑刃袇?shù)化(可變模板),然后在檢測人臉時,計(jì)算輸入圖像與模板之間的相關(guān)值,這個相關(guān)值通常都是獨(dú)立計(jì)算臉部輪廓、眼睛、鼻子和嘴各自的匹配程度后得出的綜合描述,最后再根據(jù)相關(guān)值和預(yù)先設(shè)定的閾值來確定圖像中是否存在人臉?;诳勺兡0宓娜四槞z測算法比固定模板算法檢測效果要好很多,但是它仍不能有效地處理人臉尺度、姿態(tài)和形狀等方面的變化。
基于外觀形狀的方法并不對輸入圖像進(jìn)行復(fù)雜的預(yù)處理,也不需要人工的對人臉特征進(jìn)行分析或是抽取模板,而是通過使用特定的方法(如主成分分析方法(PCA)、支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)方法(ANN)等)對大量的人臉和非人臉樣本組成的訓(xùn)練集(一般為了保證訓(xùn)練得到的檢測器精度,非人臉樣本集的容量要為人臉樣本集的兩倍以上)進(jìn)行學(xué)習(xí),再將學(xué)習(xí)而成的模板或者說分類器用于人臉檢測。因此,這也是種自下而上的方法。這種方法的優(yōu)點(diǎn)是利用強(qiáng)大的機(jī)器學(xué)習(xí)算法,快速穩(wěn)定地實(shí)現(xiàn)了很好的檢測結(jié)果,并且該方法在復(fù)雜背景下,多姿態(tài)的人臉圖像中也能得到有效的檢測結(jié)果。但是這種方法通常需要遍歷整個圖片才能得到檢測結(jié)果,并且在訓(xùn)練過程中需要大量的人臉與非人臉樣本,以及較長的訓(xùn)練時間。近幾年來,針對該方法的人臉檢測研究相對比較活躍。
在基于代數(shù)特征的人臉識別中,每一幅人臉圖像被看成是以像素點(diǎn)灰度為元素的矩陣,用反映某些性質(zhì)的數(shù)據(jù)特征來表示人臉的特征。但在這種矩陣對應(yīng)的多維空間中,并不是每一部分都包含有價值的信息,故一般情況下,需要通過某種變換,將如此巨大的空間中的這些點(diǎn)映射到一個維數(shù)較低的空間中去。然后利用對圖像投影間的某種度量來確定圖像間的相似度,最常見的就是各種距離度量。 在基于代數(shù)特征的人臉識別方法中,主成分分析法(PCA)是目前研究者使用最多的方法之一。而完整的PCA(PrincipalComponentAnalysis)人臉識別的應(yīng)用包括四個步驟:
1、 人臉圖像預(yù)處理;
2、 讀入人臉庫,訓(xùn)練形成特征子空間;
3、 把訓(xùn)練圖像和測試圖像投影的上一步驟中得到的子空間上;
4、 選擇一定的距離函數(shù)進(jìn)行識別。
基于連接機(jī)制的識別方法的代表性有神經(jīng)網(wǎng)絡(luò)和彈性匹配法。
神經(jīng)網(wǎng)絡(luò)(ANN)在人工智能領(lǐng)域近年來是一個研究熱門,基于神經(jīng)網(wǎng)絡(luò)技術(shù)來進(jìn)行人臉特征提取和特征識別是一個積極的研究方向。神經(jīng)網(wǎng)絡(luò)通過大量簡單神經(jīng)元互聯(lián)來構(gòu)成復(fù)雜系統(tǒng),在人臉識別中取得了較好的效果,特別是正面人臉圖像。常用的神經(jīng)網(wǎng)絡(luò)有:BP網(wǎng)絡(luò)、卷積網(wǎng)絡(luò)、徑向基函數(shù)網(wǎng)絡(luò)、自組織網(wǎng)絡(luò)以及模糊神經(jīng)網(wǎng)絡(luò)等。BP網(wǎng)絡(luò)的運(yùn)算量較小耗時也短,它的自適應(yīng)功能使系統(tǒng)的健壯性增強(qiáng)。神經(jīng)網(wǎng)絡(luò)用于人臉識別,相比較其他方法,其可以獲得識別規(guī)則的隱性表達(dá),缺點(diǎn)是訓(xùn)練時間長、運(yùn)算量大、收斂速度慢且容易陷入局部極小點(diǎn)等。彈性匹配法采用屬性拓?fù)鋱D代表人臉,拓?fù)鋱D的每個頂點(diǎn)包含一個特征向量,以此來記錄人臉在該頂點(diǎn)位置周圍的特征信息。拓?fù)鋱D的頂點(diǎn)是采用小波變換特征,對光線、角度和尺寸都具有一定的適應(yīng)性,且能適應(yīng)表情和視角的變化,其在理論上改進(jìn)了特征臉?biāo)惴ǖ囊恍┤秉c(diǎn)。
一個完整的人臉識別系統(tǒng)包括人臉面部數(shù)據(jù)的獲取、數(shù)據(jù)分析處理和最終結(jié)果輸出三個部分。三維人臉識別的基本步驟:
1 、通過三維數(shù)據(jù)采集設(shè)備獲得人臉面部的三維形狀信息;
2 、對獲取的三維數(shù)據(jù)進(jìn)行平滑去噪和提取面部區(qū)域等預(yù)處理;
3 、從三維數(shù)據(jù)中提取人臉面部特征,通過與人臉庫中的數(shù)據(jù)進(jìn)行比對;
4 、用分類器做分類判別,輸出最后決策結(jié)果。
基于三維數(shù)據(jù)的方法中比較有代表性的,是基于模型合成的方法的方法。
基于模型合成的方法,它的基本思想為:輸入人臉圖像的二維信息,用某種技術(shù)恢復(fù)(或部分恢復(fù))人臉的三維信息,再重新合成指定條件下的人臉圖像。典型代表是3D可變形模型和基于形狀恢復(fù)的3D增強(qiáng)人臉識別算法。3D可變形模型首先通過200個高精度的3D人臉模型構(gòu)建一個可變形的3D人臉模型,用這個模型來對給定的人臉圖像擬合,獲得一組特定的參數(shù),再合成任何姿態(tài)和光照的人臉圖像?;谛螤罨謴?fù)的3D增強(qiáng)人臉識別算法則是利用通用的3D人臉模型合成新的人臉圖像,合成過程改變了一定的姿態(tài)與光源情況。
以上就是當(dāng)下常見的一些人臉識別研究方向的簡單描述。當(dāng)然,在海量人臉數(shù)據(jù)比對速度甚至精度方面,現(xiàn)有的自動人臉識別系統(tǒng)可能已經(jīng)超過了人類,但對于復(fù)雜變化條件下的一般人臉識別問題,自動人臉識別系統(tǒng)的魯棒性和準(zhǔn)確度還遠(yuǎn)不及人類。這種差距產(chǎn)生的本質(zhì)原因現(xiàn)在還不得而知,但從模式識別和計(jì)算機(jī)視覺等學(xué)科的角度判斷,這既可能意味著人類尚未找到對面部信息進(jìn)行合理采樣的有效傳感器(考慮單目攝像機(jī)與人類雙眼系統(tǒng)的差別),更可能意味著目前為止的研究都采用了不合適的人臉建模方法(人臉的內(nèi)部表示問題)。但無論如何,賦予計(jì)算設(shè)備與人類相類似的人臉識別能力是眾多該領(lǐng)域研究人員的夢想。相信隨著研究的繼續(xù)深入,人類的認(rèn)識應(yīng)該能夠更加逼近這些問題的正確答案。