技術(shù)
導(dǎo)讀:這種計(jì)算機(jī)生成的“萬(wàn)能人臉”作用就像萬(wàn)能鑰匙一樣,可以模仿多個(gè)身份,通過基于人臉識(shí)別的身份驗(yàn)證。
近日,以色列特拉維夫大學(xué)研究人員證明了一種創(chuàng)建“萬(wàn)能人臉(master face)”的方法。
研究人員通過圖像生成系統(tǒng)StyleGAN先生成假的人臉圖像,然后通過算法和分類器對(duì)比篩選出與真實(shí)人臉相似度最高的圖像,最終獲得9張“萬(wàn)能人臉”圖像。
這種計(jì)算機(jī)生成的“萬(wàn)能人臉”作用就像萬(wàn)能鑰匙一樣,可以模仿多個(gè)身份,通過基于人臉識(shí)別的身份驗(yàn)證。
該研究論文題目為《利用網(wǎng)絡(luò)輔助的潛在空間演化生成字典攻擊的萬(wàn)能人臉(Generating Master Faces for Dictionary Attacks with a Network-Assisted Latent Space Evolution)》,已提交至論文預(yù)印本發(fā)布平臺(tái)arXiv上。
論文鏈接:
https://arxiv.org/pdf/2108.01077.pdf
一、萬(wàn)能指紋技術(shù)帶來(lái)靈感
由于其方便性,生物識(shí)別認(rèn)證,特別是人臉識(shí)別認(rèn)證,已日益成為主流,因此現(xiàn)在成為攻擊者的主要目標(biāo)。
攻擊一般的計(jì)算機(jī)認(rèn)證系統(tǒng)時(shí),有破解者會(huì)采取字典式攻擊,通過連續(xù)嘗試多個(gè)輸入來(lái)嘗試通過認(rèn)證系統(tǒng)。
而在現(xiàn)實(shí)世界的生物識(shí)別系統(tǒng)中,人們通常只能嘗試幾次輸入,然后系統(tǒng)就會(huì)鎖定。并且使用生物統(tǒng)計(jì)學(xué)進(jìn)行的匹配并不精確,加之生物學(xué)統(tǒng)計(jì)數(shù)據(jù)的空間分布不均勻,這表明可能少量樣本可以覆蓋更大的人口比例。
特拉維夫大學(xué)研究人員從“萬(wàn)能指紋”研究中獲得了靈感,他們開發(fā)了一種“萬(wàn)能人臉”,來(lái)繞過人臉識(shí)別軟件。
二、通過算法分類對(duì)比,選出9張“萬(wàn)能人臉”
研究人員首先使用人工智能領(lǐng)域廣泛使用的生成模型StyleGAN,來(lái)進(jìn)行“萬(wàn)能人臉”的制作。
▲“萬(wàn)能人臉”訓(xùn)練過程
然后研究人員然后使用算法和神經(jīng)網(wǎng)絡(luò)來(lái)優(yōu)化。有限內(nèi)存矩陣自適應(yīng)進(jìn)化策略(LM-MA-ES)算法是非常適合高維黑匣子優(yōu)化的,但是還需要增加一個(gè)組件,來(lái)推斷哪些人臉是交叉身份認(rèn)證的最佳候選選項(xiàng)。
所以,研究人員創(chuàng)建了一個(gè)“成功預(yù)測(cè)器(Success Predictor)”神經(jīng)分類器,將大量候選人臉圖像篩選出合適、可完成繞過人臉識(shí)別軟件任務(wù)的人臉圖像。
▲“成功預(yù)測(cè)器”神經(jīng)分類器原理
研究人員使用算法和分類器將每一個(gè)系統(tǒng)輸出的虛假人臉都與Labeled Faces in the Wild(LFW)數(shù)據(jù)庫(kù)中5749個(gè)不同人的真實(shí)照片進(jìn)行比較,并給出平均集覆蓋率(Mean Set Coverage,MSC)分?jǐn)?shù),只保留分?jǐn)?shù)高的虛假人臉圖像。
其中對(duì)圖像比較得到的分?jǐn)?shù)會(huì)用于訓(xùn)練進(jìn)化算法,幫助研究人員使用StyleGAN,創(chuàng)建出越來(lái)越多看起來(lái)像數(shù)據(jù)集中真實(shí)存在的人臉圖像。最終得到9張“萬(wàn)能人臉”圖像。
▲九張“萬(wàn)能人臉”
三、能覆蓋超40%數(shù)據(jù)集
研究人員使用“萬(wàn)能人臉”對(duì)三種不同的深度人臉識(shí)別系統(tǒng):dlib、FaceNet、SphereFace進(jìn)行測(cè)試,因?yàn)檫@幾種人臉識(shí)別系統(tǒng)在LFW數(shù)據(jù)集中測(cè)試競(jìng)賽的排名最高。
▲9張生成的圖像所覆蓋的數(shù)據(jù)集的百分比
研究人員實(shí)驗(yàn)得到,9張“萬(wàn)能人臉”覆蓋了這三種人臉識(shí)別系統(tǒng)中42%-64%的數(shù)據(jù)集,也就是說(shuō)9張“萬(wàn)能人臉”可以通過這些人臉識(shí)別系統(tǒng)中42%-64%的身份驗(yàn)證。
結(jié)語(yǔ):人臉識(shí)別系統(tǒng)準(zhǔn)確性備受關(guān)注
隨著人臉識(shí)別技術(shù)的普遍應(yīng)用,除了涉及到隱私保護(hù)問題外,人臉識(shí)別的準(zhǔn)確性同樣是人們熱議的話題。美國(guó)就有幾起因?yàn)槿四樧R(shí)別錯(cuò)誤而錯(cuò)誤發(fā)生逮捕的事件,引起了很大輿論反響。
特拉維夫大學(xué)研究人員其實(shí)給出了很好的思路,從如何破解人臉識(shí)別系統(tǒng)入手反推人臉識(shí)別系統(tǒng)漏洞,這樣可以更好地完善人臉識(shí)別系統(tǒng)。
來(lái)源:VICE、arXiv