版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、<p> 編 號: </p><p> 審定成績: </p><p> 重慶郵電大學(xué)移通學(xué)院</p><p><b> 畢業(yè)設(shè)計(論文)</b></p><p> 填表時間: 2013年06月</p><p> 重慶郵電大學(xué)
2、移通學(xué)院教務(wù)處制</p><p> 設(shè)計(論文)題目:圖像有損壓縮技術(shù)的研究</p><p> 重慶郵電大學(xué)移通學(xué)院畢業(yè)設(shè)計(論文)任務(wù)書</p><p> 設(shè)計(論文)題目 圖像有損壓縮技術(shù)的研究 </p><p> 學(xué)生姓名 系別 通信工程 專業(yè) 通信工程
3、 班級 12 </p><p> 指導(dǎo)教師 高飛 職稱 講師 聯(lián)系電話 </p><p> 教師單位 重慶郵電大學(xué)移通學(xué)院 下任務(wù)日期 2013 年 1 月 5 日</p><p> 備注:此任務(wù)書由指導(dǎo)教師填寫,并于畢業(yè)設(shè)計(論文)開始前下達給學(xué)生。&l
4、t;/p><p><b> 摘 要</b></p><p> 有損壓縮技術(shù)是利用了人類對圖像或聲波中的某些頻率成分不敏感的特性,允許壓縮過程中損失一定的信息;雖然不能完全回復(fù)原始數(shù)據(jù),但是所損失的部分對理解原始圖像的影響縮小,卻換來了大得多的壓縮比。常見的聲音、圖像、視頻壓縮基本都是有損的。在多媒體應(yīng)用中,常見的壓縮方法有:預(yù)測編碼,變換編碼,矢量量化編碼,分形編碼
5、等,混合編碼是近年來廣泛采用的方法。</p><p> 有損數(shù)據(jù)壓縮方法是經(jīng)過壓縮、解壓的數(shù)據(jù)與原始數(shù)據(jù)不同但是非常接近的壓縮方法。有損數(shù)據(jù)壓縮又稱破壞型壓縮,即將次要的信息數(shù)據(jù)壓縮掉,犧牲一些質(zhì)量來減少數(shù)據(jù)量,使壓縮比提高。它是與無損數(shù)據(jù)壓縮對應(yīng)的壓縮方法。根據(jù)各種格式設(shè)計的不同,有損數(shù)據(jù)壓縮都會產(chǎn)生丟失:壓縮與解壓文件都會帶來漸進的質(zhì)量下降。</p><p> 本文首先論述了數(shù)字圖
6、像壓縮技術(shù)的概況及發(fā)展趨勢,詳細(xì)介紹了現(xiàn)代圖像壓縮技術(shù)的標(biāo)準(zhǔn)、分類及主要算法。其次著重就圖像的有損壓縮技術(shù)進行了研究和討論。通過查閱大量文獻,系統(tǒng)的分析了有損壓縮技術(shù),介紹了主要有損壓縮的方法:預(yù)測編碼、變換編碼、基于模型編碼等有損壓縮的主要技術(shù),最后通過結(jié)合無損壓縮從精確度及壓縮比率等方面與損壓縮進行詳細(xì)比較,更深層次的對損壓縮技術(shù)進行了解。并得出圖像有損壓縮技術(shù)的特點和優(yōu)勢,以及在未來壓縮領(lǐng)域中的應(yīng)用方向。</p>&
7、lt;p> 【關(guān)鍵詞】有損壓縮 無損壓縮 壓縮編碼技術(shù) 比較 變換編碼</p><p><b> ABSTRACT</b></p><p> Lossy compression is to use the human is not sensitive to image or sound waves of certain frequency comp
8、onents of the features that allow compression loss in the process of certain information; Although not fully recover the raw data, but the loss of part of understanding the influence of the original image is narrow, but
9、the much larger compression ratio. Common voice, image and video compression are hurt. In multimedia applications, the common compression method are: predictive coding, transfo</p><p> Lossy data compressio
10、n method is compressed and decompressed data with different but very close to the original data compression method. Lossy data compression is also called destructiveness compression, data compression is of secondary impo
11、rtance, sacrifice some quality to reduce the amount of data, to improve the compression ratio. It is corresponding compression and lose data compression method. According to different various format design, the lost can
12、produce lossy data compression: compres</p><p> This paper first discusses the general situation and development trend of digital image compression technology, introduced the modern standards, classificatio
13、n and main algorithm of image compression technology. Secondly emphasize image lossy compression techniques are studied and discussed. Through consulting a large number of literature, systematic analysis of lossy compres
14、sion technology, introduces the main lossy compression methods: predictive coding, transform coding, based on the lossy co</p><p> 【Key words】Lossy compression Lossless compression Coding and compressing
15、technology Compare transform coding</p><p><b> 目 錄</b></p><p><b> 前 言1</b></p><p> 第一章 圖像壓縮技術(shù)的研究及進展2</p><p> 第一節(jié) 圖像壓縮技術(shù)概述2</p>
16、;<p> 第二節(jié) 圖像壓縮技術(shù)標(biāo)準(zhǔn)2</p><p> 一、靜止圖像壓縮標(biāo)準(zhǔn)2</p><p> 二、運動圖像壓縮標(biāo)準(zhǔn)3</p><p> 第三節(jié) 圖像壓縮技術(shù)分類6</p><p> 第四節(jié) 圖像壓縮技術(shù)的發(fā)展趨勢7</p><p> 第五節(jié) 本章小結(jié)7</p&g
17、t;<p> 第二章 圖像有損壓縮技術(shù)8</p><p> 第一節(jié) 有損壓縮概述8</p><p> 第二節(jié) 有損壓縮機制9</p><p> 第三節(jié) 本章小結(jié)10</p><p> 第三章 圖像有損壓縮的主要編碼技術(shù)11</p><p> 第一節(jié) 預(yù)測編碼11</
18、p><p> 一、脈沖編碼調(diào)制11</p><p> 二、差分脈沖編碼調(diào)制12</p><p> 三、自適應(yīng)差分脈沖編碼調(diào)制13</p><p> 第二節(jié) 變換編碼14</p><p> 第三節(jié) 基于模型編碼15</p><p> 一、基于語義編碼16</p>
19、<p> 二、基于物體編碼17</p><p> 第四節(jié) 分形編碼18</p><p> 一、分形編碼的思路18</p><p> 二、分形編碼的方法和步驟19</p><p> 三、分形編碼的特點19</p><p> 第五節(jié) 其它編碼20</p><p&
20、gt;<b> 一、子帶編碼20</b></p><p> 二、矢量量化編碼21</p><p><b> 三、感知編碼22</b></p><p> 第六節(jié) 本章小結(jié)23</p><p> 第四章 圖像有損壓縮與無損壓縮比較25</p><p>
21、第一節(jié) 有損壓縮技術(shù)的優(yōu)缺點25</p><p> 一、有損壓縮的優(yōu)點25</p><p> 二、有損壓縮的缺點25</p><p> 第二節(jié) 無損壓縮技術(shù)的優(yōu)缺點26</p><p> 一、無損壓縮的優(yōu)點26</p><p> 二、無損壓縮的缺點26</p><p>
22、 第三節(jié) 兩種不同圖像壓縮方式的綜合比較27</p><p> 一、兩種壓縮方式在精確度上的比較27</p><p> 二、兩種壓縮方式擁有不同的壓縮比率27</p><p> 三、兩種壓縮方式可逆性的差別27</p><p> 第四節(jié) 本章小結(jié)28</p><p><b> 結(jié)
23、論29</b></p><p><b> 致 謝30</b></p><p><b> 參考文獻31</b></p><p><b> 附 錄33</b></p><p><b> 一、英文原文33</b></p&g
24、t;<p><b> 二、英文翻譯36</b></p><p><b> 前 言</b></p><p> 在我們的生活中無論是普通人還是一些工作在科研領(lǐng)域的科技工作者,都會對數(shù)據(jù)信息進行傳輸與存儲有所接觸。隨著數(shù)字時代的到來,影像的制作、處理和存儲都脫離了傳統(tǒng)的介質(zhì),相比傳統(tǒng)方式,數(shù)字圖像有著傳統(tǒng)方式無法比擬的優(yōu)越性。而
25、對大量圖像數(shù)據(jù)進行傳輸要保證其傳輸?shù)馁|(zhì)量、速度等,對其進行存儲也要考慮其大小容量等。所以,要解決大量圖像數(shù)據(jù)的傳輸與存儲,在當(dāng)前傳輸媒介中,存在傳輸帶寬的限制,故在一些限制條件下傳輸盡可能多的活動圖像,如何能對圖像數(shù)據(jù)進行最大限度的壓縮,并且保證壓縮后的重建圖像能夠被用戶所接受等問題,就成為研究圖像壓縮技術(shù)的問題之源。</p><p> 圖像壓縮的目的就是把原來較大的圖像用盡量少的字節(jié)表示和傳輸,并且要求復(fù)原圖
26、像有較好的質(zhì)量。利用圖像壓縮可以減輕圖像存儲和傳輸?shù)呢?fù)擔(dān),使圖像在網(wǎng)絡(luò)上實現(xiàn)快速傳輸和實時處理。圖像數(shù)據(jù)之所以可以進行壓縮,主要是因為一般原始圖像數(shù)據(jù)是高度相關(guān)的,都含有大量的冗余信息。圖像壓縮編碼的目的就是消除各種冗余,并在給定的畸變下用盡量少的比特數(shù)來表征和重建圖像,使它符合預(yù)定應(yīng)用場合的要求。</p><p> 雖然人們總是期望無損壓縮,但冗余度很少的信息對象,用無損壓縮技術(shù)并不能得到可接受的結(jié)果。當(dāng)使用
27、的壓縮方法會造成一些信息損失時,關(guān)鍵的問題是看這種損失的影響。有損壓縮經(jīng)常用于壓縮音頻、灰度或彩色圖像和視頻對象等,因為它們并不要求精確的數(shù)據(jù)。在由音頻、彩色圖像、視頻以及其他專門數(shù)據(jù)組成的多媒體對象中,可以單獨使用有損壓縮技術(shù),也可與無損壓縮技術(shù)共同使用。有損壓縮編碼不具有可恢復(fù)性和可逆性,該編碼在壓縮時舍棄冗余的數(shù)據(jù)。所以有損壓縮技術(shù)也走進了人們的視野。</p><p> 第一章 圖像壓縮技術(shù)的研究及進展
28、</p><p> 第一節(jié) 圖像壓縮技術(shù)概述</p><p> 圖像壓縮就是減少表示數(shù)字圖像時需要的數(shù)據(jù)量。是指以較少的比特有損或無損地表示原來的像素矩陣的技術(shù),也稱圖像編碼[1]。</p><p> 在我們的生活中無論是普通人還是一些工作在科研領(lǐng)域的科技工作者,都會對數(shù)據(jù)信息進行傳輸與存儲有所接觸。隨著數(shù)字時代的到來,影像的制作、處理和存儲都脫離了傳統(tǒng)的介
29、質(zhì)(紙、膠片等),相比傳統(tǒng)方式,數(shù)字圖像有著傳統(tǒng)方式無法比擬的優(yōu)越性。但是每種技術(shù)出現(xiàn)的同時,都有制約其發(fā)展的一面。比如數(shù)字電視、遙感照片、由雷達、飛機等提供的軍事偵察圖像、可視電話、會議電視和傳真照片,在教育、商業(yè)、管理等領(lǐng)域的圖文資料、CT機、X射線機等設(shè)備的醫(yī)用圖像、天氣云圖等等,無論是利用哪種傳輸媒介進行傳輸?shù)男畔?,都會遇到需要對大量圖像數(shù)據(jù)進行傳輸與存儲的問題。而對大量圖像數(shù)據(jù)進行傳輸要保證其傳輸?shù)馁|(zhì)量、速度等,對其進行存儲也
30、要考慮其大小容量等。所以,要解決大量圖像數(shù)據(jù)的傳輸與存儲,在當(dāng)前傳輸媒介中,存在傳輸帶寬的限制,故在一些限制條件下傳輸盡可能多的活動圖像,如何能對圖像數(shù)據(jù)進行最大限度的壓縮,并且保證壓縮后的重建圖像能夠被用戶所接受等問題,就成為研究圖像壓縮技術(shù)的問題之源。</p><p> 圖像數(shù)據(jù)之所以可以進行壓縮,主要是因為一般原始圖像數(shù)據(jù)是高度相關(guān)的,都含有大量的冗余信息。圖像壓縮編碼的目的就是消除各種冗余[2],并在給
31、定的畸變下用盡量少的比特數(shù)來表征和重建圖像,使它符合預(yù)定應(yīng)用場合的要求。</p><p> 第二節(jié) 圖像壓縮技術(shù)標(biāo)準(zhǔn)</p><p> 一、靜止圖像壓縮標(biāo)準(zhǔn)</p><p> ① JPEG標(biāo)準(zhǔn):JPEG全名為Joint Photographic Experts Group,是一個在國際標(biāo)準(zhǔn)組織(ISO)下從事靜止圖像壓縮標(biāo)準(zhǔn)制定的委員會。JPEG標(biāo)準(zhǔn)從198
32、6年正式開始制訂,1988年決定采用以圖像質(zhì)量最好的ADCT(Adaptive Discrete Cosine Transform)方式為基礎(chǔ)的算法作標(biāo)準(zhǔn),于1991年3月提出8號標(biāo)準(zhǔn)“連續(xù)色調(diào)靜止圖像的數(shù)字壓縮編碼”,即JPEG標(biāo)準(zhǔn)。它在較低的計算復(fù)雜度下,能提供較高的壓縮比與保真度[3]。</p><p> JPEG采用4種編解碼方式:串行DCT[4](Discrete Cosine Transform)方
33、式、漸進浮現(xiàn)式DCT方式、無失真方式和分層方式。由于JPEG優(yōu)良的品質(zhì),使它在短短幾年內(nèi)就獲得極大的成功。隨著多媒體應(yīng)用領(lǐng)域激增,傳統(tǒng)的JPEG壓縮技術(shù)已無法滿足人們對多媒體影像資料的要求。因此,更高壓縮率以及更多功能的新一代靜止影像壓縮技術(shù)JPEG2000就誕生了。</p><p> ?、?JPEG2000:JPEG2000[5],正式名稱為“ISO 15444”,亦是由JPEG組織負(fù)責(zé)制定。自1997年3月開
34、始籌劃,2000年規(guī)定基本編碼系統(tǒng)的最終協(xié)議草案才提出。JPEG2000與JPEG最大的不同,在于它放棄了JPEG所采用的以DCT為主的區(qū)塊編碼方式,而改用以DWT(Discrete Wavelet Transform)為主的多分辨率編碼方式。JPEG2000的新特征有:</p><p> JPEG2000作為JPEG的升級版,具有良好的低比特率性能,特別是對細(xì)節(jié)豐富的圖像以0.25bpp的比特率進行壓縮時,總
35、體上其壓縮率比JPEG高約30%左右;</p><p> JPEG2000同時支持有損和無損壓縮;而JPEG只支持有損壓縮;</p><p> JPEG2000能實現(xiàn)漸進傳送。它先傳輸圖像的輪廓,然后逐步傳輸圖像數(shù)據(jù)的細(xì)節(jié),接收端重構(gòu)圖像時讓圖像由朦朧到清晰顯示,而不像JPEG那樣由上到下由左到右的顯示; </p><p> JPEG2000支持所謂的“感興趣
36、區(qū)域”編碼(Region of interest coding)??扇我庵付▓D像上感興趣區(qū)域的壓縮質(zhì)量,亦可以選擇指定的部分先解壓縮以突出重點。 </p><p> 二、運動圖像壓縮標(biāo)準(zhǔn)</p><p> (一)MPEG系列 </p><p> MPEG(Moving Picture Experts Group)運動圖像專家組成立于1988年,專門從事運動圖像
37、和伴音編碼的標(biāo)準(zhǔn)制定。MPEG最初的三個任務(wù)是制定1.5Mb/s,10Mb/s,40Mb/s的壓縮編碼標(biāo)準(zhǔn),即MPEG-1、MPEG-2、MPEG-3,后因MPEG-2的功能使MPEG-3多余,故MPEG-3被撤消。MPEG-4于1994年開始制定,其目的是實現(xiàn)甚低碼率的音/視頻壓縮編碼。</p><p> MPEG-1是1991年11月提出草案,1992年11月通過,1993年8月公布的。它適用于1.5Mb/
38、s速率的數(shù)字存儲媒體的運動圖像及伴音的壓縮編碼。MPEG-1追求高的壓縮比,去除圖像序列的時間冗余度,同時滿足多媒體等隨機存取的要求。它的圖像類型有三種:I圖像,采用內(nèi)部編碼,不參照其他圖像,亦稱內(nèi)部編碼圖像[6];P圖像,采用預(yù)測編碼,參照前一幅I或P圖像作運動補償編碼,亦稱預(yù)測編碼;B圖像,采用雙向預(yù)測編碼,參照前一幅和后一幅I或P圖像作雙向運動補償編碼,亦稱雙向預(yù)測圖像。</p><p> MPEG-2制
39、定于1994年,其設(shè)計目標(biāo)是高級工業(yè)標(biāo)準(zhǔn)的圖像質(zhì)量以及更高的傳輸率。它進一步提高了壓縮比,改善了音頻、視頻質(zhì)量,采用的核心技術(shù)是分塊DCT和幀間運動補償預(yù)測技術(shù)。MPEG-2所能提供的傳輸率在3~10Mb/s間,在NTSC制下的分辨率可達720×486;可提供廣播級的視像和CD級的音質(zhì);向下兼容MPEG-1,使得大多數(shù)MPEG-2解碼器可播放MPEG-1格式的數(shù)據(jù),如VCD;MPEG-2除了作為DVD的指定標(biāo)準(zhǔn)外,還可以用于為
40、廣播、有線電視網(wǎng)、電纜網(wǎng)絡(luò)以及衛(wèi)星直播提供廣播級的數(shù)字視頻;MPEG-2可提供一個較廣范圍的壓縮比,以適應(yīng)不同畫面質(zhì)量、存儲容量以及帶寬的要求。</p><p> MPEG-4是對數(shù)字音/視頻數(shù)據(jù)進行壓縮、通信、存取和操作管理等的新標(biāo)準(zhǔn),并為各種通信環(huán)境提供一種通用的技術(shù)解決方案。MPEG專家組深入分析了信息領(lǐng)域中計算機、通信以及以電視為代表的消費電器即3C交叉融合的方式后,認(rèn)為MPEG-4應(yīng)提供用于通信的新方
41、式,其中心是基于內(nèi)容的AV信息存儲、處理與操作,支持交互性、高壓縮比以及通用存儲性等功能。在其結(jié)構(gòu)上應(yīng)具有適應(yīng)性與可擴張性,以適應(yīng)軟、硬件技術(shù)的不斷發(fā)展,及時融合新的技術(shù)。由于MPEG-4的中心是基于內(nèi)容與交互性的,它就不再對低碼率范圍做出特別要求。</p><p> MPEG-4在通信信息描述中,首次提出了對象的概念,如視頻對象VO(Video Object)、音頻對象AO(Audio Object)等,這是
42、一個新的飛躍。在編碼方案上,MPEG-4仍是以塊為基礎(chǔ)的混合編碼。MPEG-4標(biāo)準(zhǔn)主要應(yīng)用于視頻電話、視頻電子郵件和電子新聞等,其傳輸速率要求較低,在4.8~64kb/s之間,分辨率為176144。MPEG-4利用很窄的帶寬,通過幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以求以最少數(shù)據(jù)獲得最佳圖像質(zhì)量。MPEG-4更適用于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控。</p><p> MPEG-7由MPEG委員會于1998年10月提出提議,2
43、001年9月正式成為國際標(biāo)準(zhǔn),又稱為“多媒體內(nèi)容描述接口(Multimedia Content Description Interface)”,其目標(biāo)是建立對多媒體信息內(nèi)容的標(biāo)準(zhǔn)化描述,試圖規(guī)范不同種類多媒體信息的描述而不受表達形式的限制。這些描述要與信息內(nèi)容直接相關(guān)以便用來快速有效的查詢、訪問各種多媒體信息。</p><p> MPEG-7的應(yīng)用范圍廣泛,既可以應(yīng)用于存儲,也可用于流式應(yīng)用(如廣播、將模型加入
44、Internet等)。它可以在實時或非實時環(huán)境下應(yīng)用,如數(shù)字圖書館、多媒體編輯等。另外,MPEG-7在教育、新聞、導(dǎo)游信息、娛樂、研究業(yè)務(wù)、地理信息系統(tǒng)、醫(yī)學(xué)、購物、建筑等各方面均有較深的應(yīng)用潛力。</p><p> MPEG-21是基于“多媒體框架(Multimedia Framework)標(biāo)準(zhǔn)”的,其最終目的是建立一個多媒體框架,以通過預(yù)購網(wǎng)絡(luò)和設(shè)備使多媒體資源在用戶之間透明方便的使用。MPEG-21的基本
45、框架要素包括數(shù)字項目說明、內(nèi)容表示、數(shù)字項目的識別和描述、內(nèi)容管理和使用、知識產(chǎn)權(quán)管理和保護、終端和網(wǎng)絡(luò)、事件報告等。它支持的功能有:通過網(wǎng)絡(luò)存儲,使用并交互操作多媒體對象;實現(xiàn)多種業(yè)務(wù)模型,包括對版權(quán)和交易的自動管理;對內(nèi)容進行隱私的尊重等。目前,這一標(biāo)準(zhǔn)仍處于開發(fā)當(dāng)中。</p><p> ?。ǘ〩.26X系列 </p><p> 1984年國際電報電話咨詢委員會的第23研究組建立了
46、一個專家組專門研究電視電話的編碼問題。經(jīng)過研究與努力,1988年形成草案,1990年12月通過ITU-T的H.261[7]建議。</p><p> H.261是ITU-T針對可視電話和會議、窄帶ISDN等要求實時編碼和低延時應(yīng)用提出的一個編碼標(biāo)準(zhǔn)。它允許“采用p64kbit的圖像業(yè)務(wù)的圖像編解碼”,因而H.261簡稱p64。其中p是一個整數(shù),取值范圍為1~30,對應(yīng)比特率為64kb/s~1.92Mb/s。它建議
47、采用中間格式CIF(Common Intermediate Format)和QCIF(Quarter CIF)解決不同制式通信的矛盾;解決了編碼算法問題。H.261采用了運動補償預(yù)測和離散余弦變換相結(jié)合的混合編碼方案,獲得很好的圖像壓縮效果。</p><p> 1995年,在H.261的基礎(chǔ)上,ITU-T總結(jié)當(dāng)時國際上視頻圖像壓縮編碼的最新進展,針對低比特率視頻應(yīng)用制定了H.263標(biāo)準(zhǔn)。它提高了運動補償?shù)木龋?/p>
48、常用于超低速率的圖像傳輸,被公認(rèn)為是以像素為基礎(chǔ)的采用第一代編碼技術(shù)的混合編碼方案所能達到的最佳結(jié)果。之后,ITU-T又對其進行了補充,以提高編碼效率,增強編碼功能。補充修訂的版本有1998年的H.263+,2000年的H.263++。H.263采用第一代編碼技術(shù),在低速率視頻傳輸質(zhì)量,抗誤碼能力方面有明顯提高,在視頻業(yè)務(wù)傳輸中得到廣泛應(yīng)用。</p><p> 與H.261只能工作在CIF、QCIF兩種格式不同
49、,H.263的信源編碼器可以工作于5種圖像格式:QCIF、Sub-QCIF、CIF、4CIF、16CIF。另外,H.263還在H.261基本編碼算法的基礎(chǔ)上提供了四種可選編碼模式:非限制運動矢量模式、基于語法的算術(shù)編碼模式、高級預(yù)測模式以及PB幀模式。由于僅限于五種固定圖像大小、形狀和時鐘頻率,它應(yīng)用的靈活性較低。</p><p> H.263+[8]即ITU-T在1998年通過的H.263第二版,增加了12個
50、新的高級模式,修正了第一版中的非限制運動矢量模式。修訂版首先在視頻格式多樣性上做了改進,還提出一些新技術(shù):如附加增強信息模式和增強參考幀再采樣模式,進一步擴大適用范圍,支持圖像凍結(jié)和快照,以及多分辨率視頻的應(yīng)用,同時還增加了一些新技術(shù)來增強抗誤碼的能力:如分片結(jié)構(gòu)模式、增強參考幀選擇模式等,使視頻信號經(jīng)過壓縮編碼后能夠在具有較大噪聲干擾的窄帶信道PSTN(Integrate Services Digital Network)和無限移動信
51、道等上傳輸。通過使用去方塊效應(yīng)濾波器,降低分辨率更新模式和修正量化模式等新技術(shù),重建圖像的主觀質(zhì)量顯著提高。由于H.263+的高級模式有些不能同時使用,有些需結(jié)合使用,如何選擇合適的編碼模式結(jié)合,對使用者來說很困難,因此ITU-T于2000年11月提出了H.263++,稱為H.263的第三版。它在H.263+的基礎(chǔ)上增加了三個高級模式。</p><p> H.26L[9]標(biāo)準(zhǔn)是ITU-T和ISO/IEC聯(lián)合制定
52、的最新的圖像壓縮編碼標(biāo)準(zhǔn),它最先由ITU-T的VCEG于1997年提出的,它的目標(biāo)是提出一種更高性能的視頻質(zhì)量有實質(zhì)性提高的視頻編碼標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)于2003年3月完成,在ITU-T中被稱為Recommendation H .264而在ISO/IEC中成為MPEG-4標(biāo)準(zhǔn)的第10部分(ISO/IEC 14496-10 AVC,簡稱MPEG-4-10)。</p><p> H.26L的一個基本概念是引入了兩個不同的層
53、次:視頻編碼層(VCL:Video Coding Layer)以及網(wǎng)絡(luò)適配層(NAL:Network Adapter Layer),前者負(fù)責(zé)對視頻進行高效的壓縮,后者則負(fù)責(zé)根據(jù)網(wǎng)絡(luò)的傳輸需要進行編碼數(shù)據(jù)的打包。H.26L相對于其他標(biāo)準(zhǔn)有以下的特點:低碼率、高質(zhì)量、可達到比H.263+提高一倍以上的編碼效率;廣闊的應(yīng)用范圍,既可用于嚴(yán)格時延限制的實時通信,可用于對時延要求不高的其他應(yīng)用;穩(wěn)健性,在網(wǎng)絡(luò)中傳輸時,有較強的抗誤碼性能;對各種網(wǎng)
54、絡(luò)的友好性,提供了友好的網(wǎng)絡(luò)接口。</p><p> 第三節(jié) 圖像壓縮技術(shù)分類</p><p> 圖像壓縮的優(yōu)點在于,如抗干擾、處理精度高、靈活性好等,其中主要缺點是數(shù)據(jù)量太大,傳輸中占頻帶太寬。數(shù)字圖像數(shù)據(jù)量的壓縮按應(yīng)用不同可分為以下三類:</p><p> ?、?信息保持型數(shù)據(jù)壓縮(無損壓縮):它要求壓縮圖像的比特數(shù)而不丟失任何信息。主要用在圖像信息保存中
55、,要求圖像存儲能保持信息并能快速存取圖像。例如短時隨機存取主要用于處理過程中的各個環(huán)節(jié)的存儲,它要求經(jīng)過不同存儲介質(zhì)多次重復(fù)不變質(zhì)、不失真。又如遙感圖像,攝取地球上許多地區(qū),因來不及處理,可暫時保存以便以后處理。</p><p> ② 保真度型數(shù)據(jù)壓縮:傳送的圖像應(yīng)該能夠適應(yīng)通信的通道限制,若接收端是人觀看的情況,由于人眼的生理特性不需要過高的空間分辨率和灰度分辨率,因此在壓縮過程中允許丟失一些人感覺不到的信息
56、,這就是一種允許微量失真的圖像壓縮。數(shù)字電視、圖像傳輸和多媒體中常用這種壓縮。</p><p> ③ 特征保持型數(shù)據(jù)壓縮(有損壓縮):許多圖像處理的目的是為了計算機的識別、分析、控制,這時并不需要圖像的全部細(xì)節(jié)及灰度細(xì)節(jié)。只要能保存圖像中的感興趣的特征信息,無用信息都可丟掉。例如識別軍艦類型、巡航導(dǎo)彈地形識別等只要輪廓信息就可以了。又如在機場跑道的識別中農(nóng)田、房屋信息皆可丟掉,只保留跑道的圖像信息即可。這些圖像
57、信號可以進行特征保持型數(shù)據(jù)壓縮。圖像編碼也可以根據(jù)編碼所在數(shù)據(jù)域劃分為空間域編碼和變換域編碼。</p><p> 第四節(jié) 圖像壓縮技術(shù)的發(fā)展趨勢</p><p> 從國際數(shù)據(jù)壓縮技術(shù)的發(fā)展尤其是MPEG的發(fā)展可以看出,基于內(nèi)容的圖像壓縮編碼方法是未來編碼的發(fā)展趨勢。它不僅能滿足進一步獲得更大的圖像數(shù)據(jù)壓縮比的要求,而且能夠?qū)崿F(xiàn)人機對話的功能。另外,任意形狀物體的模型建立的關(guān)鍵問題還沒
58、有解決,這嚴(yán)重影響其應(yīng)用的廣泛性。</p><p> 通過元數(shù)據(jù)進行編碼也是今后編碼的發(fā)展方向。元數(shù)據(jù)是指詳細(xì)的描述音/視頻信息的基本元素,利用元數(shù)據(jù)來描述音視頻對象的同時也就完成了編碼,因為此時編碼的對象是圖像的一種描述而不再是圖像本身。從另一個角度來說,進一步提高壓縮比,提高碼流的附屬功能(碼流內(nèi)容的可訪問性、抗誤碼能力、可伸縮性等)也將是未來的編碼的兩個發(fā)展方向。 </p><p>
59、;<b> 本章小結(jié)</b></p><p> 圖像壓縮技術(shù)已經(jīng)為開拓全新的應(yīng)用領(lǐng)域打下了堅實的基礎(chǔ)。圖像壓縮技術(shù)的基本應(yīng)用在更深更廣層次上的應(yīng)用就成為我們研究的熱點。本章重點對現(xiàn)代圖像壓縮技術(shù)進行概括性介紹。圖像壓縮就是減少表示數(shù)字圖像時需要的數(shù)據(jù)量。是指以較少的比特有損或無損地表示原來的像素矩陣的技術(shù),也稱圖像編碼。其次介紹了靜態(tài)與動態(tài)圖像的壓縮標(biāo)準(zhǔn)。最后分別介紹了圖像壓縮技術(shù)的分類
60、。</p><p><b> 圖像有損壓縮技術(shù)</b></p><p> 隨著多媒體技術(shù)和通訊技術(shù)的不斷發(fā)展,多媒體娛樂、信息高速公路等不斷對信息數(shù)據(jù)的存儲和傳輸提出了更高的要求,也給現(xiàn)有的有限帶寬以嚴(yán)峻的考驗,特別是具有龐大數(shù)據(jù)量的數(shù)字圖像通信,更難以傳輸和存儲,極大地制約了圖像通信的發(fā)展,因此圖像壓縮技術(shù)受到了越來越多的關(guān)注。圖像壓縮的目的就是把原來較大的圖像
61、用盡量少的字節(jié)表示和傳輸,并且要求復(fù)原圖像有較好的質(zhì)量。利用圖像壓縮可以減輕圖像存儲和傳輸?shù)呢?fù)擔(dān),使圖像在網(wǎng)絡(luò)上實現(xiàn)快速傳輸和實時處理。</p><p> 第一節(jié) 有損壓縮概述</p><p> 有損壓縮[10]是對利用了人類是絕對圖像或聲波中的某些頻率成分不敏感的特性,允許壓縮過程中損失一定的信息;雖然不能完全回復(fù)原始數(shù)據(jù),但是所損失的部分對理解原始圖像的影響縮小有損壓縮,卻換來了
62、大得多的壓縮比。有損壓縮廣泛應(yīng)用于語音,圖像和視頻數(shù)據(jù)的壓縮。常見的聲音、圖像、視頻壓縮基本都是有損的。</p><p> 有損壓縮可以減少圖像在內(nèi)存和磁盤中占用的空間,在屏幕上觀看圖像時,不會發(fā)現(xiàn)它對圖像的外觀產(chǎn)生太大的不利影響。因為人的眼睛對光線比較敏感,光線對景物的作用比顏色的作用更為重要,這就是有損壓縮技術(shù)的基本依據(jù)。</p><p> 有損壓縮的特點是保持顏色的逐漸變化,刪除
63、圖像中顏色的突然變化。生物學(xué)中的大量實驗證明,人類大腦會利用與附近最接近的顏色來填補所丟失的顏色。例如,對于藍色天空背景上的一朵白云,有損壓縮的方法就是刪除圖像中景物邊緣的某些顏色部分。當(dāng)在·屏幕上看這幅圖時,大腦會利用在景物上看到的顏色填補所丟失的顏色部分。利用有損壓縮技術(shù),某些數(shù)據(jù)被有意地刪除了,而被取消的數(shù)據(jù)也不再恢復(fù)。</p><p> 無可否認(rèn),利用有損壓縮技術(shù)可以大大地壓縮文件的數(shù)據(jù),但是
64、會影響圖像質(zhì)量。如果使用了有損壓縮的圖像僅在屏幕上顯示,可能對圖像質(zhì)量影響不太大,至少對于人類眼睛的識別程度來說區(qū)別不大??墒?,如果要把一幅經(jīng)過有損壓縮技術(shù)處理的圖像用高分辨率打印機打印出來,那么圖像質(zhì)量就會有明顯的受損痕跡。</p><p> 在多媒體應(yīng)用中,常見的壓縮方法[11]有:PCM(脈沖編碼調(diào)制),預(yù)測編碼,變換編碼,插值和外推法,統(tǒng)計編碼,矢量量化和子帶編碼等,混合編碼是近年來廣泛采用的方法。mp
65、3、divX、Xvid、jpeg、rm、rmvb、wma、wmv等都是有損壓縮。有損數(shù)據(jù)壓縮方法是經(jīng)過壓縮、解壓的數(shù)據(jù)與原始數(shù)據(jù)不同但是非常接近的壓縮方法。有損數(shù)據(jù)壓縮又稱破壞型壓縮,即將次要的信息數(shù)據(jù)壓縮掉,犧牲一些質(zhì)量來減少數(shù)據(jù)量,使壓縮比提高。這種方法經(jīng)常用于因特網(wǎng)尤其是流媒體以及電話領(lǐng)域。在這篇文章中經(jīng)常成為編解碼。它是與無損數(shù)據(jù)壓縮對應(yīng)的壓縮方法。根據(jù)各種格式設(shè)計的不同,有損數(shù)據(jù)壓縮都會有g(shù)eneration loss:壓縮與
66、解壓文件都會帶來漸進的質(zhì)量下降。</p><p><b> 有損壓縮機制</b></p><p> 由于圖像數(shù)據(jù)之間存在這一定的冗余,所以使得數(shù)據(jù)的壓縮成為可能。信息論的創(chuàng)始人Shannon 提出把數(shù)據(jù)看作是信息和冗余度[12](redundancy)的組合。所謂冗余度是由于一副圖像的各像素之間存在著很大的相關(guān)性,可利用一些編碼的方法刪去它們,從而達到減少冗余壓縮
67、數(shù)據(jù)的目的。為了去掉數(shù)據(jù)中的冗余,常常要考慮信號源的統(tǒng)計特性,或建立信號源的統(tǒng)計模型。</p><p> 圖像的冗余包括以下幾種:</p><p> ① 空間冗余:像素點之間的相關(guān)性;</p><p> ② 時間冗余:活動圖像兩個連續(xù)幀之間的冗余;</p><p> ③ 信息熵冗余:單位信息量大于其熵;</p><
68、p> ?、?結(jié)構(gòu)冗余:區(qū)域上存在非常強的紋理結(jié)構(gòu);</p><p> ?、?知識冗余:有固定的結(jié)構(gòu),如人的頭像;</p><p> ?、?視覺冗余:某些圖像的失真是人眼不易覺察的。</p><p> 對數(shù)字圖像進行有損壓縮通常利用兩個基本原理:</p><p> 一是數(shù)字圖像的相關(guān)性。在圖像的同一行相鄰像素之間,相鄰像素之間,活動圖
69、像的相鄰幀的對應(yīng)像素之間往往存在很強的相關(guān)性,去除或減少這些相關(guān)性,也即去除或減少圖像信息中的冗余度也就實現(xiàn)了對數(shù)字圖像的有損壓縮。幀內(nèi)像素的相關(guān)稱為空域相關(guān)性。相鄰幀間對應(yīng)像素之間的相關(guān)性稱為時域相關(guān)性。</p><p> 二是人的視覺心理特征。人的視覺對于邊緣急劇變化不敏感(視覺掩蓋效應(yīng)),對顏色分辨力弱,利用這些特征可以在相應(yīng)部分,適當(dāng)降低編碼精度而使人從視覺上并不感覺到圖像質(zhì)量的下降,從而達到對數(shù)字圖像
70、有損壓縮的目的。有損壓縮有兩種壓縮機制[13]:</p><p> ① 有損變換編解碼:首先對圖像或者聲音進行采樣、切成小塊、變換到一個新的空間、量化,然后對量化值進行熵編碼。</p><p> ?、?預(yù)測編解碼:先前的數(shù)據(jù)以及隨后解碼數(shù)據(jù)用來預(yù)測當(dāng)前的聲音采樣或者圖像幀,預(yù)測數(shù)據(jù)與實際數(shù)據(jù)之間的誤差以及其它一些重現(xiàn)預(yù)測的信息進行量化與編碼。有些系統(tǒng)中同時使用這兩種技術(shù),變換編解碼用于壓
71、縮預(yù)測步驟產(chǎn)生的誤差信號。 </p><p><b> 第三節(jié) 本章小結(jié)</b></p><p> 在上一章的基礎(chǔ)上,本章則是介紹了圖像壓縮技術(shù)中的一個重要成員,圖像有損壓縮技術(shù)。有損壓縮是對利用了人類是絕對圖像或聲波中的某些頻率成分不敏感的特性,允許壓縮過程中損失一定的信息;并從實際應(yīng)用角度說明了有損壓縮技術(shù)的特點和應(yīng)用方向;并簡單的介紹了其主流的壓縮方法,這
72、一點將在后一章節(jié)中詳細(xì)介紹。最后對有損壓縮的機制進行介紹。壓縮可以是有損壓縮也可以是無損壓縮,對于如繪制的技術(shù)圖、圖表或者漫畫優(yōu)先使用無損壓縮。</p><p> 第三章 圖像有損壓縮的主要編碼技術(shù)</p><p> 雖然人們總是期望無損壓縮,但冗余度很少的信息對象用無損壓縮技術(shù)并不能得到可接受的結(jié)果。當(dāng)使用的壓縮方法會造成一些信息損失時,關(guān)鍵的問題是看這種損失的影響。有損壓縮經(jīng)常用
73、于壓縮音頻、灰度或彩色圖像和視頻對象等,因為它們并不要求精確的數(shù)據(jù)。在由音頻、彩色圖像、視頻以及其他專門數(shù)據(jù)組成的多媒體對象中,可以單獨使用有損壓縮技術(shù),也可與無損壓縮技術(shù)共同使用。有損壓縮編碼不具有可恢復(fù)性和可逆性,該編碼在壓縮時舍棄冗余的數(shù)據(jù)。有損壓縮技術(shù)逐漸走進了人們的視野。</p><p><b> 第一節(jié) 預(yù)測編碼</b></p><p> 預(yù)測編碼[
74、14]是根據(jù)離散信號之間存在著一定關(guān)聯(lián)性的特點,利用前面一個或多個信號預(yù)測下一個信號進行,然后對實際值和預(yù)測值的差(預(yù)測誤差)進行編碼。如果預(yù)測比較準(zhǔn)確,誤差就會很小。在同等精度要求的條件下,就可以用比較少的比特進行編碼,達到壓縮數(shù)據(jù)的目的。</p><p> 預(yù)測編碼中典型的壓縮方法有脈沖編碼調(diào)制(PCM,Pulse Code Modulation)、差分脈沖編碼調(diào)制(DPCM,Differential Pu
75、lse Code Modulation)、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM,Adaptive Differential Pulse Code Modulation)等,它們較適合于聲音、圖像數(shù)據(jù)的壓縮,因為這些數(shù)據(jù)由采樣得到,相鄰樣值之間的差相差不會很大,可以用較少位來表示。</p><p><b> 一、脈沖編碼調(diào)制</b></p><p> 脈沖編碼調(diào)制[1
76、5](PCM,pulse code modulation)是概念上最簡單、理論上最完善的編碼系統(tǒng)。它是最早研制成功、使用最為廣泛的編碼系統(tǒng),但也是數(shù)據(jù)量最大的編碼系統(tǒng)。PCM的編碼原理比較直觀和簡單,原理框圖如圖3.1所示。在這個框圖中,它的輸入是模擬信號,首先經(jīng)過時間采樣,然后對每一樣值都進行量化,作為數(shù)字信號的輸出,即PCM樣本序列x(0),x(1),...x(n)。圖中的“量化,編碼”可理解為“量化階大小(step-size)”生
77、成器或者稱為“量化間隔”生成器。</p><p> 量化[16]有多種方法。最簡單的是只應(yīng)用于數(shù)值,稱為標(biāo)量量化,另一種是對矢量(又稱為向量)量化。標(biāo)量量化可歸納成兩類:一類稱為均勻量化,另一類稱為非均勻量化。理論上,標(biāo)量量化也是矢量量化的一種特殊形式。采用的量化方法不同,量化后的數(shù)據(jù)量也就不同。因此,可以說量化也是一種壓縮數(shù)據(jù)的方法。</p><p> 圖3.1 PCM編碼框圖<
78、;/p><p> 二、差分脈沖編碼調(diào)制</p><p> 在PCM系統(tǒng)中,原始的模擬信號經(jīng)過采樣后得到的每一個樣值都被量化成為數(shù)字信號。為了壓縮數(shù)據(jù),可以不對每一樣值都進行量化,而是預(yù)測下一樣值,并量化實際值與預(yù)測值之間的差值,這就是DPCM(Differential Pulse Code Modulation,差分脈沖編碼調(diào)制)。</p><p> 1952年貝
79、爾(Bell)實驗室的C.C.Cutler取得了差分脈沖編碼調(diào)制系統(tǒng)的專利,奠定了真正實用的預(yù)測編碼系統(tǒng)的基礎(chǔ)。DPCM的組成如圖3.2,其中編碼器和解碼器分別完成對預(yù)測誤差量化值的熵編碼和解碼。</p><p> 圖3.2 DPCM系統(tǒng)原理框圖</p><p> DPCM的優(yōu)點是算法簡單,容易硬件實現(xiàn),缺點是對信道噪聲很敏感,會產(chǎn)生誤差擴散。即某一位碼出錯,對圖像一維預(yù)測來說,將使該
80、像素以后的同一行各個像素都產(chǎn)生誤差;而對二維預(yù)測,該碼引起的誤差還將擴散到以下的各行。這樣,將使圖像質(zhì)量大大下降。同時,DPCM的壓縮率也比較低。隨著變換編碼的廣泛應(yīng)用,DPCM的作用已很有限。</p><p> 三、自適應(yīng)差分脈沖編碼調(diào)制</p><p> 進一步改善量化性能或壓縮數(shù)據(jù)率的方法是采用自適應(yīng)量化或自適應(yīng)預(yù)測,即自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)。它的核心想法是:<
81、;/p><p> 利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值。</p><p> 使用過去的樣本值估算下一個輸入樣本的預(yù)測值,使實際樣本值和預(yù)測值之間的差值總是最小。它的編碼簡化框圖如圖3.3所示。</p><p> 圖3.3 ADPCM方框圖</p><p> ?、?/p>
82、 自適應(yīng)量化:在一定量化級數(shù)下減少量化誤差或在同樣的誤差條件下壓縮數(shù)據(jù),根據(jù)信號分布不均勻的特點,希望系統(tǒng)具有隨輸入信號的變化區(qū)間足以保持輸入量化器的信號基本均勻的能力,這種能力叫自適應(yīng)量化。</p><p> 自適應(yīng)量化必須有對輸入信號的幅值進行估值的能力,有了估值才能確定相應(yīng)的改變量。若估值在信號的輸入端進行,稱前饋自適應(yīng);若在量化輸出端進行,稱反饋自適應(yīng)。信號的估值必須簡單,占用時間短,才能達到實時處理的
83、目的。</p><p> ?、?自適應(yīng)預(yù)測:預(yù)測參數(shù)的最佳化依賴信源的特征,要得到最佳預(yù)測參數(shù)顯然是一件繁瑣的工作。而采用固定的預(yù)測參數(shù)往往又得不到較好的性能。為了能使性能較佳,又不致于有太大的工作量,可以采用自適應(yīng)預(yù)測。</p><p> 為了減少計算工作量,預(yù)測參數(shù)仍采用固定的,但此時有多組預(yù)測參數(shù)可供選擇,這些預(yù)測參數(shù)根據(jù)常見的信源特征求得。編碼時具體采用哪組預(yù)測參數(shù)需根據(jù)特征來自
84、適應(yīng)地確定。為了自適應(yīng)地選擇最佳參數(shù),通常將信源數(shù)據(jù)分區(qū)間編碼,編碼時自動地選擇一組預(yù)測參數(shù),使該實際值與預(yù)測值的均方誤差最小。隨著編碼區(qū)間的不同,預(yù)測參數(shù)自適應(yīng)地變化,以達到準(zhǔn)最佳預(yù)測。</p><p><b> 第二節(jié) 變換編碼</b></p><p> 預(yù)測編碼的壓縮能力是有限的。以DPCM為例,一般只能壓縮到每樣值2~4比特。20世紀(jì)70年代后,科學(xué)家們
85、開始探索比預(yù)測編碼效率更高的編碼方法。人們首先討論了KL變換(Karhunen-Loeve Transform)、傅立葉變換等正交變換,得到了比預(yù)測編碼效率高得多的結(jié)果,但苦于算法的計算復(fù)雜性太高,進行科學(xué)研究可以,實際使用起來很困難。直到20世紀(jì)70年代后期,研究者發(fā)現(xiàn)離散余弦變換DCT與KL變換在某一特定相關(guān)函數(shù)條件下具有相似的基向量,而用DCT的變換矩陣來做正交變換就可以節(jié)省大量的求解特征向量的計算,因而大大簡化了算法的計算復(fù)雜性
86、。DCT的使用使變換編碼壓縮進入了實用階段。小波變換是繼DCT之后科學(xué)家們找到的又一個可以實用的正交變換,它與DCT各有千秋,因而分別被不同的研究群體所推崇。</p><p> 變換的基本原理:變換編碼是指先對信號進行某種函數(shù)變換,從一種信號(空間)變換到另一種(空間),然后再對信號進行編碼。如將時域信號變換到頻域,因為聲音、圖像大部分信號都是低頻信號,在頻域中信號的能量較集中,再進行采樣、編碼,那么可以肯定能
87、夠壓縮數(shù)據(jù)。</p><p> 變換編碼[17]系統(tǒng)中壓縮數(shù)據(jù)有變換、變換域采樣和量化三個步驟。變換本身并不進行數(shù)據(jù)壓縮,它只把信號映射到另一個域,使信號在變換域里容易進行壓縮,變換后的樣值更獨立和有序。這樣,量化操作通過比特分配可以有效地壓縮數(shù)據(jù)。</p><p> 在變換編碼系統(tǒng)中,用于量化一組變換樣值的比特總數(shù)是固定的,它總是小于對所有變換樣值用固定長度均勻量化進行編碼所需的總數(shù)
88、,所以量化使數(shù)據(jù)得到壓縮,是變換編碼中不可缺少的一步。在對量化后的變換樣值進行比特分配時,要考慮使整個量化失真最小。變換編碼是一種間接編碼方法。它是將原始信號經(jīng)過數(shù)學(xué)上的正交變換后,得到一系列的變換系數(shù),再對這些系數(shù)進行量化、編碼、傳輸。圖3.4是變換編碼系統(tǒng)方框圖。</p><p> 圖中接收端輸出信號與輸入信號的誤差是因為輸入端采用量化器的量化誤差所致。當(dāng)經(jīng)過正交變換后的協(xié)方差矩陣為一對角矩陣,且具有最小均
89、方誤差時,該變換稱為最佳變換,也稱Karhunen-Loeve變換[18](K-L變換)。如果變換后的協(xié)方差矩陣接近對角矩陣,該類變換稱為準(zhǔn)最佳變換,典型的有DCT(離散余弦變換)、DFT(離散傅立葉變換)、WHT等。</p><p> 圖3.4 變換編碼、解碼原理框圖</p><p> 第三節(jié) 基于模型編碼</p><p> 從80年代中后期開始,科學(xué)家們
90、開始探討基于模型的編碼,并在包括人臉圖像的編碼等應(yīng)用中使用。如果把以預(yù)測編碼和變換編碼為核心的基于波形的編碼作為第一代編碼技術(shù),則基于模型的編碼就是第二代編碼技術(shù)。N.Jayant指出,壓縮編碼的極限結(jié)果原則上可通過那些能夠反映信號產(chǎn)生過程最早階段的模型而得到。這就是基于模型編碼的思想。一個例子是人類發(fā)音的“清晰聲帶—聲道模型”(The Articulatory Vocal Cord-Vocal Tract Model),它把注意焦點從
91、線性預(yù)測編碼(LPC,Linear Predictive Coding)分析擴展到聲道區(qū)分析,原則上為很低碼率矢量量化提供了強得多的定義域,并允許更好地處理聲帶-聲道的相互作用。另一個例子是人臉的線框(wire-frame)模型,它為壓縮可視電話這類以人臉為主要景物的序列圖像提供了一個強有力的手段。</p><p> 基于模型圖像編碼首先由瑞典Forchheimer等人于1983年提出?;谀P头椒ǖ幕舅枷胧?/p>
92、:在發(fā)送端,利用圖像分析模塊對輸入圖像提取緊湊和必要的描述信息,得到一些數(shù)據(jù)量不大的模型參數(shù);在接收端,利用圖像綜合模塊重建原圖像,是對圖像信息的合成過程。基本原理如圖3.5所示。</p><p> 與經(jīng)典方法中的預(yù)測編碼方法類似,基于模型編碼在發(fā)送端既有分析用的編碼器,同時又有綜合用的解碼器。只有這樣,在發(fā)送端才能獲得與接收端相同的綜合后的重建圖像,并將后者與原始圖像進行“比較”,以確定圖像失真是否低于“某種
93、閾值”,以便修正模型參數(shù)。同經(jīng)典方法比較,基于模型編碼還有兩點顯著不同:</p><p> 編碼失真?;谀P途幋a所引起的失真已從傳統(tǒng)方法的量化誤差轉(zhuǎn)化為幾何失真,并可能進一步轉(zhuǎn)化為物理失真或行為失真。</p><p> 圖3.5 基于模型的圖像編碼基本原理框圖</p><p> 如何評價重建圖像質(zhì)量。傳統(tǒng)的以像素為單位計算原始圖像與重建圖像之間“逼真度”(如
94、均方誤差、信噪比)不能測量幾何失真和物理失真等,從原理上講根本不適用于基于模型編碼。下面分別介紹基于模型的圖像編碼有兩種技術(shù):一種是基于語義編碼,一種是基于物體編碼。</p><p><b> 一、基于語義編碼</b></p><p> 基于語義[19](semantic-based)編碼采用顯示模型(如人物的頭肩部分)去分析和合成運動圖像,景物里的物體三維模型為
95、嚴(yán)格已知。瑞典Forchheimer等人于1983年提出的就是基于語義圖像編碼。由于物體模型的有效性,景物中的物體能夠在語義水平描述。它可以有效地利用景物中已知物體的知識,實現(xiàn)非常高的壓縮比。但它僅能夠處理已知物體,并需要較復(fù)雜的圖像分析與識別技術(shù)。</p><p> 為了實現(xiàn)基于語義的圖像編碼,需要根據(jù)景物中特定的一些物體,預(yù)先建立它們的通用3D模型,最常用的是3D線框模型。3D線框模型由頂點在3D空間運動的
96、互連多角形復(fù)合而成,將色彩信息映射到該模型上就能實現(xiàn)合成。例如,人物頭部3D線框模型不僅給出面部的幾何形狀,而且提供了面部表情的描述。面部表情的變化(例如眨眼、張嘴)可用面部動作編碼系統(tǒng)(FACS,F(xiàn)acial Action Coding System)中的動作單元(AU,Action Unit)來描述。FACS給出一個包含了人臉可能產(chǎn)生的全部基本動作(即AU)的集合,而AU是無法分成更小動作的最小動作。把許多AU按照不同的組合方式一起
97、發(fā)生,就形成了臉上的豐富表情。</p><p> 下面以視頻電話為例說明。在開始通信時,首先把雙方的基本特征(例如3D模型、臉部的表面紋理等)傳輸?shù)綄Ψ?,建立一個與特定人臉匹配的3D模型。接下來,隨著頭部的運動和表情的變化,發(fā)送端抽取頭部的運動參數(shù)和臉部的表情參數(shù),編碼后傳送到對方;接收端根據(jù)已知的3D模型和接收到的各種參數(shù),用圖像綜合技術(shù)獲得重建圖像。系統(tǒng)的關(guān)鍵技術(shù)是:人物頭、臉及肩部(簡稱人臉)3D模型的建
98、立;運動參數(shù)和表情參數(shù)的估計;圖像綜合。</p><p> 為了使已建立的人臉3D模型如同真實人臉一樣“動”起來,必須根據(jù)先驗知識對臉部進行分析,提取有關(guān)的頭部特征參數(shù)及運動狀態(tài)參數(shù)。基于語義常用的人臉部模型見圖3.6,</p><p> 圖3.6 基于語義編碼常用的3D人臉模型(Candide模型)</p><p> 因此,基于語義圖像編碼還不能適合于所有的
99、視頻圖像信號。在大多數(shù)的情況下,視頻圖像信號所表現(xiàn)的自然界是多種多樣的,夠造不出比較合適的模型來表現(xiàn)。目前,基于模型法還是多應(yīng)用于特定的場合,如上述的視頻電話。</p><p><b> 二、基于物體編碼</b></p><p> 德國Hannover大學(xué)的Mu man教授在1989年提出的基于物體(object-based或object oriented)圖像編
100、碼是針對未知物體的,需要實時構(gòu)造物體的模型(沒有先驗知識的)?;谖矬w編碼不采用顯示模型,適用于處理更一般的已知或未知的物體,因此預(yù)期有更廣泛的應(yīng)用前景。</p><p> 處理時,首先運用圖像分析技術(shù),對景物進行分層次的描述,將物體與背景分割出來。對于分割后得到的每個實際三維物體,分別用一個物體模型來描述,并用該模型物體在二維圖像平面上的投影(模型圖像)來逼近真實圖像。基于物體編碼只追求最終模型能與輸入圖像一
101、致,不要求模型物體與真實物體的形狀嚴(yán)格一致。因此,假設(shè)模型是一個具有一般意義的模型,它既可以是二維的,也可以是三維的。每個分割出來的實際運動物體,用運動參數(shù)集、形狀參數(shù)集和色彩參數(shù)集進行描述,然后再對這三個參數(shù)集進行編碼與傳送。根據(jù)所假設(shè)的物體模型不同,參數(shù)集會有些變化?,F(xiàn)在基于物體編碼所用的模型有4種:2D剛體模型,2D柔體模型,3D剛體模型,3D柔體模型。</p><p> 對于活動圖像的基于物體編碼系統(tǒng)的
102、核心技術(shù)是景物的分層次描述、運動估值和運動分割。從原理上講,因無需模式識別與先驗知識,且不受可視電話中頭肩圖像那樣的限制,對于圖像分析要簡單得多,因而有更廣泛的應(yīng)用前景。但因未能充分利用景物的知識,或只能在低層次上運用物體知識,編碼效率不如基于語義方法。因此應(yīng)根據(jù)實際需要來決定具體選用哪一類方法。</p><p> 目前,基于模型編碼進一步的研究方向是把基于物體編碼與基于語義編碼等結(jié)合起來,取長補短。</
103、p><p><b> 第四節(jié) 分形編碼</b></p><p><b> 一、分形編碼的思路</b></p><p> 1988年1月,美國Georgia理工學(xué)院的M.F.Barnsley在BYTE發(fā)表了分形壓縮方法。分形編碼法(Fractal Coding)的目的是發(fā)掘自然物體(比如天空、云霧、森林等)在結(jié)構(gòu)上的自相
104、似形,這種自相似形是圖像整體與局部相關(guān)性的表現(xiàn)。分形壓縮正是利用了分形幾何中的自相似的原理來實現(xiàn)的。首先對圖像進行分塊,然后再去尋找各塊之間的相似形,這里相似形的描述主要是依靠仿射變換確定的。一旦找到了每塊的仿射變換,就保存下這個仿射變換的系數(shù),由于每塊的數(shù)據(jù)量遠(yuǎn)大于仿射變換的系數(shù),因而圖像得以大幅度的壓縮。分形編碼以其獨特新穎的思想,成為目前數(shù)據(jù)壓縮領(lǐng)域的研究熱點之一。分形編碼、基于模型編碼與經(jīng)典圖像編碼方法相比,在思想和思維上有了很
105、大的突破,理論上的壓縮比可超出經(jīng)典編碼方法兩三個數(shù)量級。</p><p> 二、分形編碼的方法和步驟</p><p> 以平面點集合與圖像為例,迭代函數(shù)[20]系統(tǒng)壓縮編碼大致步驟為:</p><p> ?、?圖像分割:首先將原圖(集合X或圖像)預(yù)分割(或預(yù)分解)為若干分形子圖X(m) (m=1,2,…,M),使得每一個子圖X(m)具有一定的分形結(jié)構(gòu),及其局部與
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 畢業(yè)設(shè)計(論文)圖像有損壓縮技術(shù)的研究
- 靜態(tài)圖像有損壓縮技術(shù)的研究.pdf
- 圖像有損壓縮方法研究.pdf
- 半調(diào)圖像的有損壓縮算法研究.pdf
- 基于壓縮感知的多光譜圖像有損壓縮技術(shù)研究.pdf
- 多-高光譜圖像有損壓縮技術(shù)研究.pdf
- 通過有損壓縮技術(shù)實現(xiàn)自然圖像有效分割.pdf
- 基于上下文的多維圖像的無損-有損壓縮技術(shù).pdf
- 面向有損壓縮的視頻圖像的去霧算法.pdf
- 加密域中圖像的參數(shù)自適應(yīng)有損壓縮方法研究.pdf
- 一種易于硬件實現(xiàn)的圖像有損壓縮算法.pdf
- 基于分類DCT的高光譜有損壓縮算法研究.pdf
- 基于角度差鏈碼有損壓縮算法的研究.pdf
- 圖像壓縮處理技術(shù)研究畢業(yè)論文
- 1,其他。正向離散余弦變換4.4.2jpeg有損壓縮算法計算兩維的dct
- 基于小波變換的圖像壓縮方法[畢業(yè)論文]
- 顯微視頻圖像的編碼與壓縮【畢業(yè)論文】
- 基于硬件的遙感圖像有損小波壓縮系統(tǒng).pdf
- 畢業(yè)論文——圖像增強技術(shù)綜述
- 圖像邊緣檢測技術(shù)畢業(yè)論文
評論
0/150
提交評論