依圖NIST奪冠,解密人臉識(shí)別算法原理
近日,由美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院NIST(National Institute of Standards and Technology) 組織的人臉識(shí)別算法測(cè)試FRVT2018結(jié)果公布,三家中國(guó)公司挺進(jìn)前五。其中冠軍被中國(guó)公司依圖科技再度摘得,中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院獲得第二名,排名前五的另一家企業(yè)是曠視科技。
本文引用地址:http://m.butianyuan.cn/article/201806/382456.htmNIST測(cè)試以其評(píng)測(cè)標(biāo)準(zhǔn)的嚴(yán)謹(jǐn)性、一致性和全面性,成為了全球規(guī)模最大、標(biāo)準(zhǔn)最嚴(yán)、競(jìng)爭(zhēng)最激烈、最權(quán)威的人臉識(shí)別算法比賽。
依圖科技其實(shí)是第二次獲得NIST比賽人臉識(shí)別冠軍,去年6月NIST官方公布的測(cè)試結(jié)果中,依圖在千萬(wàn)分之一誤報(bào)下達(dá)到識(shí)別準(zhǔn)確率95.5%,是當(dāng)時(shí)全球工業(yè)界在此項(xiàng)指標(biāo)下的最好水平。今年依圖將這一指標(biāo)提升到了接近極限的水平,即在千萬(wàn)分之一誤報(bào)下的識(shí)別準(zhǔn)確率已經(jīng)接近99%。根據(jù)NIST官方4月發(fā)布的競(jìng)賽結(jié)果,曠視科技也曾登頂榜首,在百萬(wàn)分之一誤報(bào)下的準(zhǔn)確率為97.5%。
中國(guó)公司取得如此戰(zhàn)績(jī),一定程度上代表在人工智能領(lǐng)域,我國(guó)的人臉識(shí)別技術(shù)已經(jīng)走在世界前列,可喜可賀!為此,小編特別想探究一下人臉識(shí)別背后的算法原理。
1.基于幾何特征的方法
基本思想:采用幾何特征進(jìn)行正面人臉識(shí)別一般是通過(guò)提取人眼、口、鼻等重要特征點(diǎn)的位置和眼睛等重要器官的幾何形狀作為分類特征。因?yàn)槿四樣裳劬?、鼻子、嘴巴、下巴等部件?gòu)成,正因?yàn)檫@些部件的形狀、大小和結(jié)構(gòu)上的各種差異才使得世界上每個(gè)人臉千差萬(wàn)別,所以對(duì)這些部件的形狀和結(jié)構(gòu)關(guān)系的幾何描述,可以做為人臉識(shí)別的重要特征。
局限性:基于幾何特征的方法是最早、最傳統(tǒng)的方法,通常需要和其他算法結(jié)合才能有比較好的效果。基于參數(shù)的人臉表示可以實(shí)現(xiàn)對(duì)人臉顯著特征的一個(gè)高效描述,但它需要大量的前處理和精細(xì)的參數(shù)選擇。同時(shí),采用一般幾何特征只描述了部件的基本形狀與結(jié)構(gòu)關(guān)系,忽略了局部細(xì)微特征,造成部分信息的丟失,更適合于做粗分類,而且目前已有的特征點(diǎn)檢測(cè)技術(shù)在精確率上還遠(yuǎn)不能滿足要求,計(jì)算量也較大。
2.特征臉?lè)椒?PCA)
特征臉?lè)椒ㄊ?0年代初期由Turk和Pentland提出的目前最流行的算法之一,具有簡(jiǎn)單有效的特點(diǎn), 也稱為基于主成分分析(principal component analysis,簡(jiǎn)稱PCA)的人臉識(shí)別方法。
基本思想:該方法是先確定眼虹膜、鼻翼、嘴角等面像五官輪廓的大小、位置、距離等屬性,然后再計(jì)算出它們的幾何特征量,而這些特征量形成一描述該面像的特征向量。其技術(shù)的核心實(shí)際為“局部人體特征分析”和“圖形/神經(jīng)識(shí)別算法?!边@種算法是利用人體面部各器官及特征部位的方法。如對(duì)應(yīng)幾何關(guān)系多數(shù)據(jù)形成識(shí)別參數(shù)與數(shù)據(jù)庫(kù)中所有的原始參數(shù)進(jìn)行比較、判斷與確認(rèn)。
局限性:特征臉?lè)椒ㄊ且环N簡(jiǎn)單、快速、實(shí)用的基于變換系數(shù)特征的算法,但由于它在本質(zhì)上依賴于訓(xùn)練集和測(cè)試集圖像的灰度相關(guān)性,而且要求測(cè)試圖像與訓(xùn)練集比較像,所以它有著很大的局限性。
3.神經(jīng)網(wǎng)絡(luò)方法
基本思想:人工神經(jīng)網(wǎng)絡(luò)是一種非線性動(dòng)力學(xué)系統(tǒng),具有良好的自組織、自適應(yīng)能力。目前神經(jīng)網(wǎng)絡(luò)方法在人臉識(shí)別中的研究方興未艾,但在人臉識(shí)別上的應(yīng)用比起前兩類方法來(lái)有一定的優(yōu)勢(shì),因?yàn)閷?duì)人臉識(shí)別的許多規(guī)律或規(guī)則進(jìn)行顯性的描述是相當(dāng)困難的,而神經(jīng)網(wǎng)絡(luò)方法則可以通過(guò)學(xué)習(xí)的過(guò)程獲得對(duì)這些規(guī)律和規(guī)則的隱性表達(dá),它的適應(yīng)性更強(qiáng),一般也比較容易實(shí)現(xiàn)。因此人工神經(jīng)網(wǎng)絡(luò)識(shí)別速度快,但識(shí)別率低 。
局限性:神經(jīng)網(wǎng)絡(luò)方法通常需要將人臉作為一個(gè)一維向量輸入,因此輸入節(jié)點(diǎn)龐大,其識(shí)別重要的一個(gè)目標(biāo)就是降維處理。
影響人臉識(shí)別的關(guān)鍵因素
光照變化
光照變化是影響人臉識(shí)別性能的最關(guān)鍵因素,對(duì)該問(wèn)題的解決程度關(guān)系著人臉識(shí)別實(shí)用化進(jìn)程的成敗。目前有兩種解決思路:第一是利用光照模式參數(shù)空間估計(jì)光照模式,然后進(jìn)行針對(duì)性的光照補(bǔ)償,以便消除非均勻正面光照造成的陰影、高光等影響;第二是基于光照子空間模型的任意光照?qǐng)D像生成算法,用于生成多個(gè)不同光照條件的訓(xùn)練樣本,然后利用具有良好的學(xué)習(xí)能力的人臉識(shí)別算法,如子空間法。
姿態(tài)問(wèn)題
姿態(tài)問(wèn)題涉及頭部在三維垂直坐標(biāo)系中繞三個(gè)軸的旋轉(zhuǎn)造成的面部變化,其中垂直于圖像平面的兩個(gè)方向的深度旋轉(zhuǎn)會(huì)造成面部信息的部分缺失,因此姿態(tài)問(wèn)題成為人臉識(shí)別的一個(gè)技術(shù)難題。
解決姿態(tài)問(wèn)題有三種思路:第一種思路是學(xué)習(xí)并記憶多種姿態(tài)特征,這對(duì)于多姿態(tài)人臉數(shù)據(jù)可以容易獲取的情況比較實(shí)用;第二種思路是基于單張視圖生成多角度視圖,可以在只能獲取用戶單張照片的情況下合成該用戶的多個(gè)學(xué)習(xí)樣本,可以解決訓(xùn)練樣本較少的情況下的多姿態(tài)人臉識(shí)別問(wèn)題,從而改善識(shí)別性能;第三種思路是基于姿態(tài)不變特征的方法,即尋求那些不隨姿態(tài)的變化而變化的特征。
評(píng)論