2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩165頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、在許多領(lǐng)域,多媒體內(nèi)容都出現(xiàn)了爆發(fā)式增長,如何更有效地訪問這些領(lǐng)域的全球信息數(shù)據(jù)庫已經(jīng)成為新的迫切需求。由于這些領(lǐng)域中的系統(tǒng)所提交的復(fù)雜數(shù)據(jù)并沒有傳統(tǒng)數(shù)據(jù)庫管理系統(tǒng)(Database Management Systems-DBMS)中的數(shù)據(jù)所具有的全面排序?qū)傩?,因而使我們在搜索體驗的質(zhì)量上遇到了一個重大挑戰(zhàn)。檢索出精確的答案是對傳統(tǒng)的數(shù)據(jù)庫管理系統(tǒng)應(yīng)用程序的基本要求,然而,新開發(fā)的數(shù)據(jù)庫系統(tǒng)正在被越來越多地要求支持更為復(fù)雜的數(shù)據(jù)類型,如

2、圖像、視頻、音頻、時間序列甚至DNA序列等。正是由于存在對這些數(shù)據(jù)類型的處理需求,使得在數(shù)據(jù)管理系統(tǒng)中出現(xiàn)了多媒體數(shù)字數(shù)據(jù)庫(Multimedia DigitalDatabase-MDD)這類系統(tǒng)。目前,多媒體數(shù)字數(shù)據(jù)庫在科學(xué)應(yīng)用方面已經(jīng)變得越來越普及,其領(lǐng)域涵蓋了娛樂、磁共振成像、學(xué)習(xí)管理系統(tǒng)等。在這些多媒體數(shù)字數(shù)據(jù)庫中的信息,對于每一個希望在各種各樣的應(yīng)用程序中使用它們的人來說,通常被期望是容易訪問的。在多媒體數(shù)字數(shù)據(jù)庫中出現(xiàn)的數(shù)據(jù)

3、,例如圖像,是半結(jié)構(gòu)化、非均質(zhì)、且容量龐大的,通常存儲在大型磁盤陣列中。各種類型的用戶,包括遙感、時裝設(shè)計、出版、醫(yī)藥、建筑、甚至預(yù)防犯罪等領(lǐng)域,他們在使用這種數(shù)據(jù)庫時,都希望系統(tǒng)能夠提供高效的圖像搜索、瀏覽和檢索工具。這就引發(fā)了多媒體信息檢索(Multimedia Information Retrieval-MIR)領(lǐng)域的一個重要研究課題,即有效且高效的圖像相似性搜索。
  雖然許多現(xiàn)代搜索算法對于求解各類優(yōu)化問題來說既快速也有

4、效,但在多媒體數(shù)字數(shù)據(jù)庫中通常由于存在大量的參數(shù),這些搜索算法可能并非同樣有效。多媒體數(shù)字數(shù)據(jù)庫需要操作大矩陣,檢索大量信息,且對存儲容量有很大要求,這些因素很可能會導(dǎo)致某些可用的搜索算法變得速度緩慢或者根本無法正常運行。多媒體域中的對象可以被轉(zhuǎn)化為某個度量空間中的對象,這些對象可以用一個適當定義的度量函數(shù)來描述。在這種情況下,搜索技術(shù)可能需要借助某種優(yōu)化方法以便在度量空間中找到查詢向量與被檢索圖像之間最接近的特征點。搜索這些最接近的特

5、征點,就引出了相似性數(shù)據(jù)檢索問題。這種類型的相似性查詢對于許多數(shù)據(jù)挖掘問題以及多媒體數(shù)據(jù)庫應(yīng)用來說尤為重要。
  相似性搜索,可以簡單地定義為針對一個給定的查詢對象搜索出一組相似的對象,它是多媒體信息檢索中的一項關(guān)鍵任務(wù)。在應(yīng)用時,對象通常都被表示成高維的向量。用于大型集復(fù)雜多媒體數(shù)字數(shù)據(jù)庫的相似性搜索技術(shù),其性能的優(yōu)劣取決于搜索算法和索引結(jié)構(gòu)。在一個度量空間M中給定一個包含S點的集合,并且給定一個查詢點q∈M,那么相似性搜索問題

6、可以定義為在集合S中找到與q最接近的點。通常情況下,度量空間M被定義為一個d維的歐幾里德空間,而距離則采用歐式距離進行測量。目前被提出來用于數(shù)字多媒體數(shù)據(jù)庫相似性搜索的方法通常都是基于信息檢索領(lǐng)域之外的技術(shù),其中最常見的一種方法就是奇異值分解法(Singular Value Decomposition-SVD)。所謂奇異值分解,是指將圖像的特征轉(zhuǎn)換為離散的元或項,它是一種圖像分解技術(shù),可以用來計算一個矩陣的奇異值、偽逆陣和秩。奇異值分解

7、法目前已經(jīng)被應(yīng)用到基于色彩的多媒體內(nèi)容的索引和檢索中。顏色可以提供一種魯棒的檢索技術(shù),基于顏色已經(jīng)開發(fā)出了一些新的可擴展的瀏覽算法和一些語義可視化界面,這些瀏覽算法允許用戶訪問各種龐大的多媒體數(shù)據(jù)庫,而語義可視化界面則可以將對象組件集成到一個統(tǒng)一的多媒體瀏覽和檢索系統(tǒng)中。目前,關(guān)于顏色感知和顏色空間的研究,已有很多研究成果。在基于內(nèi)容的圖像檢索(Content-Based Image Retrieval-CBIR)領(lǐng)域,對于目標識別和攝

8、影圖像的相似性搜索來說,顏色已經(jīng)被證明是一種非常好的鑒別特征?;趦?nèi)容的圖像檢索是一種用于從圖像數(shù)據(jù)庫中提取相似圖像的技術(shù),該技術(shù)利用圖像固有的視覺內(nèi)容來執(zhí)行查詢操作。對于一個給定的圖像數(shù)據(jù)庫,基于內(nèi)容的圖像檢索會抽取每幅圖像的特征并相應(yīng)地給這些圖像編索引。在經(jīng)典的基于內(nèi)容的圖像檢索系統(tǒng)中執(zhí)行一次搜索,其結(jié)果往往依賴于輸入圖像的各種特征信息。隨著技術(shù)的進步,包括數(shù)碼相機的不斷普及以及管理大型信息數(shù)據(jù)庫越來越變得可能,基于內(nèi)容的圖像檢索技

9、術(shù)已經(jīng)被證明是更有效和更實用的,它可以使用戶免除以前繁瑣、主觀且容易出錯的圖像描述任務(wù),因此顯著地改善了檢索系統(tǒng)的實用性。
  一幅圖像的低級顏色特征可以用一個顏色直方圖來表征。顏色直方圖表示法,不僅可以有效地刻畫出一幅圖像的整體色彩特征,而且還可以定義一種用于測量多媒體數(shù)字數(shù)據(jù)庫中兩幅圖像之間相似性的方法。在基于內(nèi)容的圖像檢索系統(tǒng)中,顏色直方圖是最常用到的特征。表達和描述顏色的一種系統(tǒng)的方法就是使用顏色模型。光譜的可見光部分,占

10、主導(dǎo)地位的是紅色、綠色和藍色(RGB),它們被視為可見光譜的主要顏色。
  為了獲得所需的圖像感知信息,在開始圖像相似性檢索之前,要做的第一件重要工作就是對圖像進行增強處理。圖像增強包括去除圖像噪聲、放大對比度以及放大某些細節(jié)。對于原始圖像數(shù)據(jù),增強處理可能還包括提高圖像亮度值的動態(tài)范圍。我們知道,若背景光過強或照明不足,都有可能導(dǎo)致圖像的亮度值很小?;蛘?,圖像的亮度值可能太大以至于無法被顯示設(shè)備有限的位平面所容納。當現(xiàn)場照明在空

11、間中呈現(xiàn)很大變化時,對大多數(shù)圖像來說,這個問題也許會變得更加復(fù)雜。在這種情況下,背景可能會變得太暗或者太亮。我們的目標就是要對這種類型的圖像進行加工處理,以改善圖像的局部對比度。
  直方圖均衡化(Histogram Equalization-HE)是一種最簡單、最常用的圖像對比度增強技術(shù)。利用這種技術(shù),通過指定輸入圖像各像素的亮度值使得輸出圖像含有均勻的亮度分布,可以有效地提高圖像直方圖的動態(tài)范圍。
  彩色圖像對比度增強

12、的經(jīng)典方法都是以直方圖均衡化為基礎(chǔ)的,但它們并不是直方圖均衡化簡單直接的擴展。這是因為彩色圖像具有某些特定的特征,包括亮度(L)、飽和度(S)和色調(diào)(H)等屬性,這些屬性在增強圖像的對比度時都需要適當加以考慮。對于某種具體應(yīng)用而言,為了使用一個好的顏色空間,可能需要在顏色空間之間進行顏色變換。當一個算法將RGB顏色坐標(RGB空間)轉(zhuǎn)換到另一個不同的空間,如HSV空間(指由色調(diào)H、飽和度S和純度V所構(gòu)成的空間)或者YCbCr空間(Y是亮

13、度分量,Cb和Cr分別為藍色差和紅色差的色度分量)等后,彩色成分與非彩色成分會變得更加互不相關(guān)。這使得我們可以將顏色采用色調(diào)、飽和度和亮度來表示,這種表示方法與人類視覺系統(tǒng)處理顏色的生理學(xué)模型更加接近。
  迄今為止,雖然已經(jīng)有一些圖像增強的方法被提出,但為了獲得更好的圖像質(zhì)量和降噪性能,為了更加不失真地轉(zhuǎn)換圖像,我們根據(jù)文獻[10]所提出的算法進行了圖像增強的研究。該算法通過按比例增大或縮小離散余弦變換(DiscreteCosi

14、ne Transform-DCT)的各個系數(shù)可以實現(xiàn)對彩色圖像進行增強處理,其獨到之處在于,除了處理亮度分量和大大改進圖像韻視覺效果之外,它還可以處理顏色成分。
  離散余弦變換技術(shù)是一種在數(shù)據(jù)壓縮中經(jīng)常使用的變換編碼方法,它把正交矩陣的時序變?yōu)轭l率信號,是一種近似于傅立葉變換的正交變換。這種變換具有輸入序列的功率(平方和)同變換序列的功率相等的特點。也就是說,如果在某一部分由于變換導(dǎo)致功率集中的話,那么其它部分的功率將變小。一般

15、來說,圖像信號具有在低頻段功率集中的特性,因而使高頻段的功率變小。另外,人眼對高頻段信號的視覺特性也不太敏感。利用這些特性,可對低頻段部分進行細量化,而對高頻段部分進行粗量化。
  離散余弦變換DCT的處理步驟是,先將整體圖像分解成N×N個像素塊,再對這些塊像素逐一進行DCT變換。由于大多數(shù)圖像高頻分量較小,相應(yīng)于圖像高頻成分的失真不太敏感,所以可以采用更粗的量化,在保證所要求的圖像質(zhì)量下,舍棄某些次要信息,這樣,傳送變換系數(shù)所用

16、的數(shù)據(jù)率要大大低于傳送像素所用的數(shù)據(jù)率。數(shù)據(jù)傳送到接收端后,再通過反離散余弦變換(反向DCT即IDCT)變回到樣值。
  為了高效存儲和高效傳輸圖像以及減少計算的復(fù)雜性,圖像通常被壓縮成JPEG格式(Joint Photographic Experts Group-JPEG)。在JPEG壓縮格式的基本構(gòu)建塊中,離散余弦變換是一種被廣泛采用的圖像壓縮標準,它可以把圖像從空域轉(zhuǎn)換到壓縮域。離散余弦變換系數(shù)的空間頻率特性為在離散余弦變換

17、域中定義對比度測量方法提供了一種自然的方式。使用壓縮域表示圖像的另一個好處是,由于光譜分離,使得我們可以通過不同方式處理各種頻率分量來達到增強圖像特征的目的。
  目前,在分塊離散余弦變換域內(nèi),針對彩色圖像和灰度圖像都已經(jīng)提出了一些不同的圖像增強算法,如Alpha-Rooting算法、多對比度增強算法等,有些算法還可以同時利用離散余弦變換的直流(DC)系數(shù)和交流(AC)系數(shù)來處理交流(AC)系數(shù)。對每個分塊進行獨立處理可能會導(dǎo)致分

18、塊效應(yīng),這在分塊離散余弦變換域內(nèi)極為常見。如何有效解決這個問題是塊處理過程中非常關(guān)鍵的一步。為此,在本文中我們提出了一種特別的處理方法,該方法可以有效消除離散余弦變換的高頻(高次諧波分量的)系數(shù),從而使得各分塊的邊緣變得光滑。
  本文的一個重要貢獻在于對輸入圖像的查詢質(zhì)量進行了精細的改進,有助于獲得更高質(zhì)量的搜索結(jié)果。我們的主要目的是想進一步對輸入的查詢圖像進行增強處理,以提高圖像所呈現(xiàn)信息的可解釋性(可解讀性),從而為相似性檢

19、索的應(yīng)用提供更高質(zhì)量的圖像。這個目的是通過抑制圖像噪聲、提高圖像對比度和亮度來實現(xiàn)的。我們所提出的查詢質(zhì)量改進方法在于突顯、加強或者平滑圖像的特征,這一改進過程并不會增加數(shù)據(jù)中固有的信息內(nèi)容,但它確實可以提高所選擇特征的動態(tài)范圍,從而使這些特征可以很容易地被檢測到。目前,雖然已有幾種改進算法可以對彩色圖像進行增強處理,但在我們的研究中,僅限于采用那些基于人工智能技術(shù)的強魯棒性方法。文獻[9]的作者,應(yīng)用基于遺傳編程(GeneticPro

20、gramming-GP)的全局對比度增強改進技術(shù),通過改變輸入圖像的色彩分布圖,使得輸入圖像可以滿足人類解釋的要求。在文獻[12]中,我們的研究表明,將遺傳算法(Genetic Algorithms-GAs)應(yīng)用到經(jīng)過增強處理后的圖像,還可以進一步實現(xiàn)對圖像的優(yōu)化。只要在遺傳算法進化過程中始終保存“最好解”,那么就有可能使搜索逐步演變成期望的相似性搜索。
  粒子群優(yōu)化算法(Particle Swarm Optimization-

21、PSO)是另一種現(xiàn)代的啟發(fā)式尋優(yōu)算法,它也可以用來改進輸入圖像的查詢質(zhì)量。在局部PSO增強和改進模型中,使用了以給定圖像中每個像素鄰域的灰度級分布為基礎(chǔ)構(gòu)造的變換函數(shù)。與遺傳算法相同,基于PSO算法的圖像增強方法,要求選擇一個適應(yīng)度函數(shù)以建立評價個體優(yōu)劣的適應(yīng)度準則。采用這種增強方法,需要被增強的圖像有一個相對較高的邊緣亮度。所以,適應(yīng)度準則應(yīng)該與邊緣像素的數(shù)量和亮度成正比。要生成一幅增強圖像,需要用到剛剛提到的變換函數(shù),它既包含輸入圖

22、像的全局信息又包含其局部信息。
  在基于內(nèi)容的圖像檢索系統(tǒng)搜索模式中,研究人員已對采用主動學(xué)習(xí)方法產(chǎn)生了越來越大的興趣。學(xué)習(xí)對象之間的相似性度量,是機器學(xué)習(xí)領(lǐng)域一個一般性但卻很重要的問題,它可以用在多媒體信息檢索過程中。設(shè)計一個查詢優(yōu)化方案可以視為一個機器學(xué)習(xí)任務(wù)。查詢優(yōu)化方案在解決一些大規(guī)模的應(yīng)用問題中特別有用,比如,像搜索出一幅與給定圖像相似的圖像這類任務(wù)?;谌斯ど窠?jīng)網(wǎng)絡(luò)(Artificial Neural Network

23、s-ANNs)的學(xué)習(xí)算法通常用于使相似性匹配功能偏向或者符合用戶的查詢興趣。人工神經(jīng)網(wǎng)絡(luò)是模仿高等動物大腦的某些信息存儲和處理能力而開發(fā)的數(shù)學(xué)模型。一個人工神經(jīng)網(wǎng)絡(luò)是由一些神經(jīng)元通過相互連接而形成的一個網(wǎng)絡(luò)拓撲,在每對神經(jīng)元之間的連接上都有一個可調(diào)節(jié)的加權(quán)系數(shù),這個系數(shù)起著生物神經(jīng)系統(tǒng)中神經(jīng)元的突觸強度的作用,它可以加強或者減弱上一個神經(jīng)元的輸出對下一個神經(jīng)元的刺激。這個加權(quán)系數(shù)通常被稱作為權(quán)值。人工神經(jīng)網(wǎng)絡(luò)最具有吸引力的特征是,使用某

24、些學(xué)習(xí)算法以及少數(shù)訓(xùn)練樣本就可以教會它們執(zhí)行計算任務(wù)。Holland、Wu和Chechik等學(xué)者都曾指出,人工神經(jīng)網(wǎng)絡(luò)可以通過各種進化算法加以優(yōu)化,使其性能得到改善。
  在人工神經(jīng)網(wǎng)絡(luò)中,學(xué)習(xí)起著極其重要的作用。學(xué)習(xí)過程也是神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值被調(diào)整、修改的過程。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力是由其網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)訓(xùn)練算法決定的。反向傳播算法(Backpropagation-BP)是目前最常用的訓(xùn)練神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法,它已被證明在訓(xùn)練前饋多層

25、感知器時非常成功。在我們設(shè)計的基于內(nèi)容的相似性檢索系統(tǒng)中,多層神經(jīng)網(wǎng)絡(luò)的實現(xiàn)分為兩個階段。第一階段是訓(xùn)練,在此過程中樣本數(shù)據(jù)庫中的圖像被標記,以便用于被選擇。圖像被標記后,通過低層的顏色描述算符處理后形成神經(jīng)網(wǎng)絡(luò)的輸入。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,輸入圖像的每個特征向量都會與從樣本數(shù)據(jù)庫中搜索到的圖像的一個目標向量相關(guān)聯(lián),該目標向量的基數(shù)等于訓(xùn)練數(shù)據(jù)庫((樣本數(shù)據(jù)庫)中組的數(shù)量。反向傳播學(xué)習(xí)規(guī)則在網(wǎng)絡(luò)訓(xùn)練過程中一直使用,直到神經(jīng)網(wǎng)絡(luò)實現(xiàn)收斂為

26、止。神經(jīng)網(wǎng)絡(luò)的收斂與樣本數(shù)據(jù)庫中圖像的標簽有關(guān)。網(wǎng)絡(luò)訓(xùn)練完成后,第二階段就是利用樣本數(shù)據(jù)庫中其它圖像的信息來生成高級的特征向量。然后,采用標準的歐幾里德相似性度量法,將從樣本數(shù)據(jù)庫中搜索得到的結(jié)果圖像的輸出向量與儲存在樣本數(shù)據(jù)庫中的高級特征向量進行比較,以檢查輸出的結(jié)果圖像是否與輸入的查詢圖像相似。學(xué)習(xí)可以只依靠正樣本,如用于重新加權(quán)方法或基于Mahalanobis距離方法的那些樣本,或者既依靠正樣本也依靠負樣本。
  最初,由于

27、用戶心中事先并沒有相似性的概念,所以神經(jīng)網(wǎng)絡(luò)所有的權(quán)值都是統(tǒng)一設(shè)置的,大小相等。搜索的靈活性主要來自于對權(quán)值的調(diào)整。要克服這種限制,可以讓用戶嘗試運用案例查詢的方法。當然,所用到的案例,在其非文本查詢的表達式中必須包含與用戶正在尋找的資料相關(guān)的多媒體項。近來,在很多多媒體檢索系統(tǒng)中,已經(jīng)采用案例查詢框架。在我們的檢索系統(tǒng)實現(xiàn)中,所采用的框架使用戶可以通過提供一個案例以及k個與此案例期望的匹配來提出一個相似性查詢Q?;谟脩籼峁┑某跏及咐?/p>

28、,查詢處理器會為這個輸入的查詢案例產(chǎn)生一個內(nèi)部表示模型,我們將此稱為“啟動”查詢。啟動查詢?nèi)缓笈c數(shù)據(jù)庫中的對象集進行匹配,并返回最佳的k個匹配結(jié)果。
  任何圖像檢索系統(tǒng)的性能分析都取決于所采用的相似性度量準則。相似性是利用圖像內(nèi)容描述符進行計算的,這些描述符將輸出圖像的特征向量與相似性度量準則結(jié)合在一起,以表達圖像特有的感知特性。對于一幅給定的查詢圖像,連同它的顏色特征一起,檢索準確度越高,則反映檢索得到的結(jié)果圖像與輸入的查詢圖

29、像特征向量之間距離的度量指標就越好。在圖像檢索中,已經(jīng)用到了多種距離測量方法。在本文中,我們采用歐幾里德距離度量法,因為無論是從檢索的有效性還是檢索的效率來看,它都被認為是最理想的距離測量方法,它可以將搜索引導(dǎo)到最相似的被檢索圖像。
  本文的主要貢獻包括:
  (1)提出了一種基于人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的有監(jiān)督學(xué)習(xí)優(yōu)化方法與離散余弦變換系數(shù)優(yōu)化方法相結(jié)合的混合圖像增強技術(shù),以改進在多媒體信息檢索系統(tǒng)中相似性搜索的質(zhì)量。將該技術(shù)應(yīng)

30、用于圖像數(shù)據(jù),可以使正確檢索到的相似圖像(即與查詢圖像為同一類圖像)的數(shù)量達到最大化。與以前那些直接提取圖像數(shù)據(jù)進行訓(xùn)練而沒有對圖像的檢索質(zhì)量作進一步改進的方法相比,我們提出的這種技術(shù)可以有效地優(yōu)化查詢圖像的離散余弦變換系數(shù)的縮放比例并通過有監(jiān)督的人工神經(jīng)網(wǎng)絡(luò)算法顯著地改善查詢圖像的檢索性能,阿時使得系統(tǒng)的資源利用率達到最大而查詢所需的等待時間最小。所提出的混合圖像增強技術(shù)包含兩個模塊,一個用于增強輸入的查詢圖像,另一個則對增強后的圖像

31、再做進一步的精細改進和優(yōu)化。實驗結(jié)果證實,采用所提出的這種圖像增強技術(shù),衡量圖像檢索性能的幾個標準指標都得到明顯的改進。
  (2)提出了一種基于離散余弦變換算法與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合的圖像壓縮算法,以高效壓縮圖像的各種特征信息并在壓縮域增強圖像的對比度。該算法具有以下優(yōu)點:第一,能夠成功地探索圖像的自然場景并全面地對自然場景的內(nèi)容進行編碼,以獲得圖像場景分類的魯棒表達形式;第二,可以增強原始圖像中較暗和較亮區(qū)域的細節(jié),同時又不增強

32、原始圖像的噪聲信息以及影響原始圖像的可壓縮性;第三,具有較低的計算復(fù)雜性。為了提高處理速度,我們也對離散余弦變換系數(shù)的分布特征進行了研究。由于經(jīng)離散余弦變換壓縮后的輸入圖像其特征信息的動態(tài)范圍被大大提高,使得圖像的質(zhì)量得到提高,從而使得搜索算法的整體性能也得到提高。實驗結(jié)果表明,所提出的算法不僅可以改進圖像的動態(tài)范圍和對比度,而且可以有效地消除離散余弦變換在對每個像素塊進行獨立壓縮時所產(chǎn)生的塊效應(yīng)并減少噪聲信息。
  (3)提出通

33、過對解碼器中的量化表進行加權(quán)處理利用JPEG壓縮算法在離散余弦變換域內(nèi)對輸入的原始查詢圖像進行增強。圖像數(shù)據(jù)隨要求不同可具有不同的形式,這些要求會影響數(shù)據(jù)的存儲、處理和表達。圖像檢索系統(tǒng)設(shè)計的目標之一就是要允許和確保所有各種形式的數(shù)據(jù)在操作上的易用性和存儲上的高效性,運用JPEG壓縮算法可以有效地實現(xiàn)這兩個目標。由于在壓縮域內(nèi)大多數(shù)離散余弦變換的系數(shù)經(jīng)量化后的值為零,使得算法的存儲要求和計算開銷都被大大減小,從而可加快算法的執(zhí)行速度。使

34、用JPEG壓縮格式,還給我們提供了一種在離散余弦變換域中定義圖像對比度測量的自然方式,同時也將圖像從空域轉(zhuǎn)換到壓縮域。
  (4)提出了一種基于人工神經(jīng)網(wǎng)絡(luò)的有監(jiān)督學(xué)習(xí)算法用于提高排序函數(shù)的自動學(xué)習(xí)性能,以提高圖像的檢索質(zhì)量并減少對手工調(diào)整參數(shù)的依賴。該算法的優(yōu)點是可以提高學(xué)習(xí)速度、簡化計算并且可以采用高速硬件加以實現(xiàn)。增強學(xué)習(xí)是一種理想的學(xué)習(xí)算法,可以用來訓(xùn)練排序模型,因而可以直接優(yōu)化檢索系統(tǒng)的性能。在對圖像進行增強處理的過程中

35、采用人工神經(jīng)網(wǎng)絡(luò)技術(shù),對圖像數(shù)據(jù)的增強過程及產(chǎn)生的最終結(jié)果有直接效果。從文中的分析可以看出,結(jié)合了學(xué)習(xí)策略的搜索算法可以使檢索過程更加高效,得到的結(jié)果也更加接近最優(yōu)解。此外,在圖像相似性搜索算法中,我們還引入了一種新的圖像選擇準則,它能更好地反映圖像相似性檢索和排序的目標,使算法在對解空間進行搜索時,總能找到一個具有最小代價函數(shù)的最優(yōu)解。
  我們對所提出的多媒體信息檢索系統(tǒng)的性能進行了測試實驗,并對圖像檢索結(jié)果進行了分析。實驗結(jié)

36、果表明,對于各種不同視覺質(zhì)量的輸入查詢圖像,我們的檢索系統(tǒng)都能產(chǎn)生高質(zhì)量的輸出結(jié)果。性能測試證實,與沒有改進的查詢圖像相比,我們提出的圖像增強及精細改進技術(shù)有效地增強了查詢圖像的視覺質(zhì)量,改進了查詢圖像的檢索性能。我們將基于人工神經(jīng)網(wǎng)絡(luò)的有監(jiān)督訓(xùn)練方法與離散余弦變換相結(jié)合,使得檢索產(chǎn)生的結(jié)果圖像與輸入的查詢圖像之間的相似性距離指標可以到達高精度檢索的要求。
  總的來說,本文所提出的基于顏色的查詢質(zhì)量改進技術(shù)為在多媒體信息檢索系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論