2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩73頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、人臉檢測(cè)廣泛應(yīng)用于視覺(jué)目標(biāo)檢測(cè),是入臉?lè)治?、定位以及人臉識(shí)別的主要組成成分之一,在眾多的應(yīng)用中(例如安全、新通信接口、生物鑒定和其他方面中)占有主導(dǎo)地位。 給出一幅圖像,人臉檢測(cè)用于尋求圖像中是否存在人臉,如果存在人臉,返回人臉的位置及其內(nèi)容。 自動(dòng)人臉檢測(cè)是一個(gè)相對(duì)較復(fù)雜的問(wèn)題,需要檢測(cè)一幅圖像或者視頻序列中的一個(gè)或者很多人臉,實(shí)際上困難在于人臉是非剛體目標(biāo),對(duì)于兩個(gè)不同的入,人臉外貌有可能會(huì)變化,甚至同一個(gè)人的兩幅照

2、片都有可能不同,取決于光照條件、目標(biāo)情緒狀態(tài)以及姿勢(shì),這就是最近幾十年為什么會(huì)有如此多的方法用來(lái)研究人臉檢測(cè)。對(duì)主要的方法我們做了整體概括,最終致力于研究探測(cè)器,它在取得高檢測(cè)率的同時(shí),處理圖像的速度也是非常之快。每一種方法都是在特定背景下發(fā)展應(yīng)用起來(lái)的,可以把所有的方法主要?dú)w納成兩種:基于圖像的方法和基于特征的方法。第一種方法利用分類(lèi)器掃描整幅圖像,此分類(lèi)器利用給定的樣本集靜態(tài)訓(xùn)練;另外一種方法主要檢測(cè)人臉特征比如眼睛、鼻子等。

3、 論文中,主要研究了介于兩種方法(即基于圖像的方法和基于特征的方法)的中間系統(tǒng),認(rèn)為此中間系統(tǒng)是基于圖像的方法是由于它利用學(xué)習(xí)算法將給定的正負(fù)樣本來(lái)訓(xùn)練分類(lèi)器,這些樣本是精心挑選好的。而認(rèn)為此系統(tǒng)基于特征的原因是由于中間系統(tǒng)的學(xué)習(xí)算法所選擇的特征與人臉特定特征是直接相關(guān)的(眼睛位置,鼻梁對(duì)照)。 每個(gè)輸入圖像通過(guò)四個(gè)階段的檢測(cè),每個(gè)檢測(cè)階段都會(huì)形成假設(shè),并在進(jìn)一步的檢測(cè)中尋找證據(jù)使得假設(shè)成立。 假設(shè)就相當(dāng)于人臉候選區(qū)域

4、,證據(jù)本質(zhì)上就是特定的圖像特征,如果此假設(shè)不成立就退出檢測(cè),成立則進(jìn)入下一個(gè)檢測(cè)階段形成新的假設(shè),以此類(lèi)推,直到最終確定入臉目標(biāo)。這樣功能模塊遵循著由粗到細(xì)的政策。第一階段形成的假設(shè)可以認(rèn)為是最粗略的估計(jì),接下來(lái)的幾個(gè)階段是先前階段的細(xì)化。 人臉檢測(cè)的四個(gè)階段分別是:(1)膚色區(qū)域提取,(2)清除膚色區(qū)域,(3)候選目標(biāo)區(qū)域的選擇,(4)人臉確認(rèn)。 由于膚色顏色的外表取決于光線條件,這就是為什么在準(zhǔn)備階段的第一步,是歸一

5、化圖像中的顏色表面。程序由高于luma5%的相關(guān)像素組成(非gamma-corrected亮度),如果那些像素的數(shù)量非常大(大于100個(gè)),就作為基準(zhǔn)白色。為了使這些基準(zhǔn)白色像素值減低至灰度值255,需要調(diào)整一幅彩色圖像的紅、綠、藍(lán)三種組成成分。如果檢測(cè)到的基準(zhǔn)白色的像素?cái)?shù)量沒(méi)有足夠大,彩色組成成分就不會(huì)改變。 人類(lèi)膚色擁有自己獨(dú)特的色彩分布,這和大部分的非人臉目標(biāo)都是不同的。這就是為什么人類(lèi)膚色可以用來(lái)過(guò)濾輸入圖像以獲得人臉候

6、選目標(biāo)區(qū)域。為了實(shí)現(xiàn)過(guò)濾過(guò)程,需要轉(zhuǎn)換圖像的彩色空間。這個(gè)階段的目的是為了減少搜索區(qū)域,搜索的判斷是基于這樣一個(gè)事實(shí):人臉通常存在于膚色區(qū)域。像素水平的分割利用YCbCr彩色空間坐標(biāo)系統(tǒng)完成膚色區(qū)域提取。在YCbCr彩色空間中,Y分量代表了亮度信息,Cb和Cr分量包含著色度信息。因此可以容易地確定亮度信息。既然原始圖像在RGB彩色空間,為了獲得YCbCr空間信息必須做一定的轉(zhuǎn)換。在下一階段的進(jìn)一步分析之前,轉(zhuǎn)換后得到的二進(jìn)制圖像受支配于

7、簡(jiǎn)單的間隙填充和去除孤立像素點(diǎn)的過(guò)程。 為了確認(rèn)人臉的存在,我們必須掃面整幅圖像以確定膚色區(qū)域并去除不必要的像素。為了減小檢測(cè)區(qū)域,我們需要確定可能存在的人臉區(qū)域,為此僅僅根據(jù)色度分量把像素分成膚色和非膚色兩類(lèi)。注意到假設(shè)我們用灰度圖像替代彩色圖像,這個(gè)預(yù)處理階段并不在考慮范圍之內(nèi),所以直接跳到分類(lèi)階段。 Boosting技術(shù)通過(guò)對(duì)訓(xùn)練樣本的二次加權(quán)改善基礎(chǔ)分類(lèi)器的性能。另一方面,用于boosting的普通分類(lèi)器是2X

8、3的Harr-like新特征集,可以獲得高檢測(cè)率以及快速計(jì)算速率。利用這些新的特征集,訓(xùn)練時(shí)間明顯大大縮短:比之前用的特征集快了整整5倍。 Adaboost選擇小數(shù)量的關(guān)鍵性的特征,并結(jié)合到強(qiáng)分類(lèi)器中?;仡櫳险?,算法是自適應(yīng)的,由于它能處理特別弱假設(shè)的出錯(cuò)率。論文的目的是增慢檢測(cè)性能的同時(shí)減少計(jì)算時(shí)間,通過(guò)組成一個(gè)級(jí)聯(lián)結(jié)構(gòu)的分類(lèi)器就可以達(dá)到這個(gè)目的。工作原理就是快速剔除大量的負(fù)窗口,同時(shí)保持幾乎所有的正樣本,利用更多的完全分類(lèi)

9、器分類(lèi)相應(yīng)多的子窗口。為了達(dá)到這個(gè)目的,級(jí)聯(lián)結(jié)構(gòu)的第一階段只要包含較少的特征,這樣可以獲得高檢測(cè)率(100%),但是誤檢率卻高達(dá)(40%)。這種人臉檢測(cè)方法顯而易見(jiàn)是不可以接受的,但是成功利用這些越來(lái)越有區(qū)分行的檢測(cè)階段就可能達(dá)到快速檢測(cè)的目標(biāo)。 把這個(gè)級(jí)聯(lián)結(jié)構(gòu)和退化決策圖表作比較,如果在某一階段中,檢測(cè)到子窗口有人臉,并且會(huì)在下個(gè)階段中繼續(xù)研究探討。以此進(jìn)行,直到在某一階段子窗口檢測(cè)為非人臉目標(biāo),或者所有階段都分類(lèi)成人臉目標(biāo)。

10、最后這種情況候選區(qū)域才會(huì)被考慮成正樣本。 論文結(jié)合膚色檢測(cè)方法和學(xué)習(xí)算法檢測(cè)不同位置處的人臉,因此,輸入應(yīng)該是任意圖像,而輸出應(yīng)該是同一幅圖像,并且在任何人臉存在區(qū)域有一個(gè)矩形框區(qū)域。本中間系統(tǒng)直接檢測(cè)圖像以尋找任何有可能存在的正樣本(即人臉),同時(shí)對(duì)圖像的子窗口也采取相同的方式,如果圖像部分中的矩形不是人臉,此次檢測(cè)就會(huì)認(rèn)為是負(fù)檢測(cè)(即認(rèn)定假設(shè)不成立,是非人臉)。 測(cè)試集中的圖像尺寸是任意的,而正負(fù)訓(xùn)練樣本集的圖像尺寸

11、必須是一致的。在不同光照條件下取得包含人臉的圖像組成了正訓(xùn)練樣本集,訓(xùn)練樣本集實(shí)際上通過(guò)人為掃描正樣本產(chǎn)生,并把圖像縮放成一個(gè)標(biāo)準(zhǔn)尺寸,訓(xùn)練集中的負(fù)訓(xùn)練樣本集由包含非人臉目標(biāo)的圖像組成,這些圖像都是隨意取得的。 除了檢測(cè)準(zhǔn)確率多少這個(gè)目標(biāo)和任務(wù)外,第二個(gè)主要的目標(biāo)是實(shí)時(shí)性能,響應(yīng)時(shí)間取決于所要測(cè)試圖像的尺寸,因此這樣大小尺寸圖像的實(shí)時(shí)時(shí)間就有可能是不相同的,較大圖像尺寸的響應(yīng)時(shí)間要比較小圖像尺寸的響應(yīng)時(shí)間長(zhǎng)些從檢測(cè)項(xiàng)目速度、訓(xùn)練

12、項(xiàng)目速度以及寫(xiě)項(xiàng)目的所付出的努力幾個(gè)方面來(lái)講,論文的主要目的是:學(xué)習(xí)怎么樣檢測(cè)某些類(lèi)型圖像中的人臉,此中間系統(tǒng)的成功之處在于,它是其他系統(tǒng)的基礎(chǔ)例如人臉識(shí)別和面部表情識(shí)別。 論文的貢獻(xiàn)可以總結(jié)為以下幾個(gè)方面: 1、論文中人臉檢測(cè)方法結(jié)合基于圖像的方法和基于特征的方法,充分利用了這兩種方法的優(yōu)點(diǎn),減少了兩種方法所具備的不足(結(jié)合其優(yōu)勢(shì),摒棄 其劣勢(shì))。 2、描述了訓(xùn)練中所用到的特征集類(lèi)型。這些特征(眼睛,鼻

13、子等等)大大減低了訓(xùn)練時(shí)間,比用傳統(tǒng)特的征集快了5倍。 3、建立了一個(gè)快速而且可靠的人臉檢測(cè)方法,基于學(xué)習(xí)人臉,遮擋人臉(即有外物遮擋,比如眼鏡,帽子之類(lèi)的東西)和有一定角度的人臉(即人臉傾斜了一定角度)。 此系統(tǒng)并沒(méi)有特殊的硬件,只有計(jì)算機(jī)和相機(jī)。在光照條件變化范圍內(nèi),實(shí)驗(yàn)結(jié)果證明檢測(cè)側(cè)面和旋轉(zhuǎn)人臉的有效性,檢測(cè)率高達(dá)96%,誤檢率僅為6%。 這里并不存在“魔幻”的答案能簡(jiǎn)單解釋?zhuān)瑧?yīng)用論研究的技術(shù)實(shí)時(shí)檢測(cè)人臉?biāo)?/p>

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論