人(rén)臉檢測算(suàn)法設置徹底改✘απ≠變圖像搜索-北(běi)京軟件(jiàn)開("π♦kāi)發公司_北(běi)京軟件(jiàn)開(•€kāi)發公司
發表日(rì)期:2018-11-12 14:05:35 文→☆↔€(wén)章(zhāng)編輯:宜天信達 浏覽次數(shβ÷→ù):
早在2001年(nián),兩位計(jì)算(€₽≠suàn)機(jī)科(kē)學家(jiā)Paul Viola和(h '©≤é)Michael Jones就(jiù)引發β♦✔了(le)計(jì)算(suàn)機(jī)人(rén)臉檢測領域的(de)一↑φ♦'(yī)場(chǎng)革命。經過多(duō)年(ni☆'×án)的(de)停滞,他(tā)們的(de)突破是(sh왩)一(yī)種可(kě)以實時(shí)÷✔識别圖像中的(de)面部的(de)算(suàn)法。實際上(shà©₩±©ng),所謂的(de)Viola-Jones算(s×≤uàn)法非常快(kuài)速和(hé)簡單,很(hěn)快(kuài)就(β←jiù)被內(nèi)置到(dào)标準的(de)傻瓜相(xiàng)機ε™™§(jī)中。
他(tā)們的(de)部分(fēn)訣竅是(shì)忽略面$£♣部識别中更加困難的(de)問(wèn)題,而隻關注檢測。他(tā)們也(yě≤←)隻關注從(cóng)正面看(kàn)的(de)面孔,忽略了(le)從(cóα ™πng)一(yī)個(gè)角度看(kàn)到(d★λγào)的(de)任何面孔。鑒于這(zhè)些(xiē∞≈§)界限,他(tā)們意識到(dào)鼻梁通(tōng)常形成一•λ(yī)條垂直線,比附近(jìn)的(de)眼窩更亮§♥£↕(liàng)。他(tā)們還(hái)注™¥意到(dào)眼睛經常處于陰影(yǐng)中,因此形成了(lΩ∏®→e)較暗(àn)的(de)水(shuǐ)平帶。
因此,Viola和(hé)Jones構建了(le)一(yī→₹ ¥)種算(suàn)法,該算(suàn)法首先查找可(k&Ωπě)能(néng)是(shì)鼻子(zǐ)的(d₽β€e)圖像中的(de)垂直亮(liàng)帶,然後查找可(kě)能(nén©∑ g)是(shì)眼睛的(de)水(shuǐ)平暗(àn)帶,然後查找與™€臉相(xiàng)關的(de)其他(tā)一(yī)般模式。
由他(tā)們自(zì)己檢測,這(zhè)些(xiē)≥→特征都(dōu)沒有(yǒu)強烈暗(àn)示面部。但(dàn)是(shì)當≤""它們在級聯中一(yī)個(gè)接一(yī)個(g₽©₽è)地(dì)被檢測到(dào)時(shí),結果是(shì)圖像中¥σ的(de)面部的(de)良好(hǎo)指示。因此,這(zhè)個(gè)過☆★÷"程的(de)名稱:探測器(qì)級聯。由于這(zhè)些(xiē)測試都(dō"u)很(hěn)簡單,因此生(shēng)成的(de)算(suàn)≠"÷✘法可(kě)以快(kuài)速實時(shí)運行(₩✘₽αxíng)。
但(dàn)是(shì),雖然Viola-Jones算ε₩≈(suàn)法對(duì)于從(cóng)正面看(kàn)到(dà↑₽$Ωo)的(de)面部是(shì)一(yī)種啓示,但(dàn≤ )它無法從(cóng)任何其他(tā)角度♦₹÷精确地(dì)發現(xiàn)面部。這(zhè)嚴重限制(zhì)了(±'¥le)它如(rú)何用(yòng)于面部搜索引擎。
這(zhè)就(jiù)是(shì)雅虎對(duì)此問(wε♠☆èn)題感興趣的(de)原因。今天,加利福尼亞州雅虎實驗室的(de)Sac×∑hin Farfade和(hé)Mohammad Sabe↓÷€ rian以及斯坦福大(dà)學附近(jìn)的(de)Li-Ji∞↑a Li,揭示了(le)一(yī)種解決問(wèn)題的(de₹'δ)新方法,即使在部分(fēn)遮擋的(de)情況下(xià)也(yě)可< ≤♦(kě)以在某個(gè)角度發現(xiàn)面部問(wèn)題。他(tā)們說>✔•¥(shuō)他(tā)們的(de)新方法比其他(tā)方法更簡單,但(dà₹♥$n)卻達到(dào)了(le)先進的(de)性能(néng)。γ₹★≥
Farfade和(hé)co使用(yòng¶")一(yī)種根本不(bù)同的(de)方法來(lái)構建他(tā)們的ε ™(de)模型。他(tā)們利用(yòng)近(jìn)®<年(nián)來(lái)在一(yī)種稱為(wèi)深度卷積神經網絡的(☆∑÷&de)機(jī)器(qì)學習(xí)上(shàng)取得(de¶✘ε)的(de)進步。我們的(de)想法是(shì)使用(yòng)大(dà↓)量帶注釋的(de)示例數(shù)據庫來(lái)訓練多(duō)層神經¥₹☆網絡,在這(zhè)種情況下(xià),從(cóng)<£☆®多(duō)個(gè)角度拍(pāi)攝人(ré↕>n)臉照(zhào)片。
為(wèi)此,Farfade和(hé)co創建了(le)一(yī)個(¥™₩gè)包含200,000張圖像的(de)數(shù)據庫,其中包₹括各種角度和(hé)方向的(de)面部以及另外(wài)2000萬張沒有(y$₹ βǒu)面部的(de)圖像。然後他(tā)們在50,000次叠代中以128$α>個(gè)圖像批量訓練他(tā)們的(de)神經網絡。
結果是(shì)一(yī)種算(suàn)法,✘★∑即使在部分(fēn)遮擋的(de)情況下(xià)也(yě)可(ε€☆kě)以從(cóng)各種角度發現(xiàn☆×π≤)面部。它可(kě)以非常精确地(dì)在同一(yī)圖像中發現(xiàn"©)許多(duō)面部。
該團隊稱這(zhè)種方法為(wèi)Deep Dense Fa"α♥ce Detector,并稱它與其他(tā)算(suàn)法相(x±ε£iàng)比較。“我們使用(yòng)其 •↕ 他(tā)基于深度學習(xí)的(de)方法評估了(le)γ✘所提出的(de)方法,并表明(míng)我們的(de)方法可(k&λ₹×ě)以獲得(de)更快(kuài),更準确的(de)結果,&rdquo↑"↓;他(tā)們說(shuō)。
更重要(yào)的(de)是(shì),他(tā)們的(de)算 σ (suàn)法在颠倒時(shí)能(néng)夠更好(hǎo)♥¥∑∞地(dì)識别面部,其他(tā)方法還(hái)沒有(yǒu)完善。并α且他(tā)們說(shuō),使用(yòng£¶)包含更多(duō)颠倒面的(de)數(shù)據集₩↔可(kě)以做(zuò)得(de)更好(hǎo)。&ld$≤quo;我們計(jì)劃使用(yòng)更好(hǎo)的(de)采樣策略和§§$(hé)更複雜(zá)的(de)數(shù)據增強技(jì)術(s∏→÷±hù),以進一(yī)步提高(gāo)所提出的(deε☆)檢測遮擋和(hé)旋轉面部方法的(de)性能(nén&£δg)。”
這(zhè)是(shì)一(yī)項有(yǒu)趣的(de)工(gōn✘g)作(zuò),展示了(le)人(rén)臉檢測的 ✘λ≥(de)快(kuài)速進展。深度卷積神經網絡技(jì)術(shù)本身('≤shēn)隻有(yǒu)幾年(nián)的(de ®>)曆史,已經在對(duì)象和(hé)人(r↔φ'én)臉識别方面取得(de)了(le)重大(dà)進展。
這(zhè)種算(suàn)法的(de)巨大(dà)希望在于圖™像搜索。目前,可(kě)以直接搜索在特定地(dì)點或特定時(shí)間(ji♣εān)拍(pāi)攝的(de)圖像。但(dàn)很(h™✔₽¥ěn)難找到(dào)特定人(rén)物(wù)β↕✘拍(pāi)攝的(de)照(zhào)片。這(zhè)是↕₩"(shì)朝這(zhè)個(gè)方向邁出的(de)一(yī)步。在不(bù)✘€遠(yuǎn)的(de)将來(lái),這(zhè)種能(nén™¶ g)力不(bù)可(kě)避免地(dì)會(huì)伴随我們。
當它到(dào)來(lái)時(shí),世界将變得(de↑λ)更小(xiǎo)。這(zhè)不(bù)僅僅是αφ'(shì)将來(lái)可(kě)以搜索的(de)圖片,而是δφλ♠(shì)數(shù)字化(huà)圖像的(de)整個(gè)曆史,包括大(d↑ Ω✔à)量的(de)視(shì)頻(pín)和ε₹(hé)CCTV鏡頭。無論如(rú)何,這(zhè)将成為(wè≤∞i)一(yī)股強大(dà)的(de)力量。