版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、<p><b> 本科畢業(yè)設(shè)計論文</b></p><p> 題 目 數(shù)字圖像縮放技術(shù)研究 </p><p> 專業(yè)名稱 電子信息工程 </p><p> 學生姓名 </p><
2、;p> 指導教師 </p><p> 畢業(yè)時間 2006年7月 </p><p><b> 畢業(yè) 任務書</b></p><p><b> 一、題目</b></p><p> 數(shù)字圖像縮放技術(shù)研
3、究</p><p> 二、指導思想和目的要求</p><p> 數(shù)字圖像分辨率放大和縮小技術(shù)是數(shù)字電視的關(guān)鍵技術(shù)之一。本題目要求:</p><p> 學習數(shù)字圖像處理知識, 重點學習用于數(shù)字圖像縮放的插值算法。</p><p> 學習MATLAB仿真計算環(huán)境,學會MATLAB編程。</p><p> 搜集并研
4、究目前國際上主流的圖像放大/縮小技術(shù),用MATLAB進行編程和實驗,對比其中重要算法的性能和運算量;</p><p> 通過學習和完成本題目,使學生掌握較深的圖像處理專業(yè)知識并鍛煉和提高獨立科研能力。</p><p><b> 三、主要技術(shù)指標</b></p><p> 總結(jié)當前數(shù)字電視的視頻格式,圖像分辨率;</p>&l
5、t;p> 研究用于圖像放大/縮小技術(shù)的三種經(jīng)典插值算法,并編寫MATLAB程序?qū)崿F(xiàn)所有算法;</p><p> 搜集并研究目前國際上主流的圖像放大/縮小技術(shù),研究其中幾種主要的插值算法,并編寫MATLAB程序?qū)崿F(xiàn)這幾種算法;</p><p> 對MATLAB程序進行圖像縮放實驗,對比這幾種算法的性能和運算量;</p><p><b> 四、進
6、度和要求</b></p><p> 第1-3周:學習數(shù)字圖像處理知識, 重點學習用于數(shù)字圖像縮放的插值算法,查閱相關(guān)資料。</p><p> 第3-6周:搜集目前國際上主流的圖像放大/縮小技術(shù),學習MATLAB仿真計算環(huán)境。</p><p> 1/2畢設(shè)時間:研究用于圖像放大/縮小技術(shù)的經(jīng)典插值算法和主要的改進算法,用MATLAB編寫程序,進行數(shù)
7、據(jù)試驗,最后進行幾種算法的性能和運算量對比分析。</p><p> 第15-18周:撰寫論文并答辯。</p><p> 五、主要參考書及參考資料</p><p> 章毓晉,《圖像處理與分析》,清華大學出版社 2004年7月</p><p> [日]田村秀行 著,《計算機圖像處理》,科學出版社 2004年6月</p>&l
8、t;p> 閆敬文,《數(shù)字圖像處理技術(shù)與圖像圖形學基本教程》,科學出版社 2002年6月</p><p> 孫兆林,《MATLAB6.X數(shù)字圖像處理》,清華大學出版社2002年5月</p><p> 陳貴明,張明照等,《應用MATLAB語言處理數(shù)字信號與數(shù)字圖像》,科學出版社 2000年1月</p><p> 張志涌,《精通MATLAB6.5》, 北航電
9、子版,2002年12月</p><p> 學生 ___________ 指導教師 ___________ 系主任 ___________</p><p><b> 目 錄</b></p><p><b> 摘 要I</b></p><p> ABSTRACTII</p>
10、;<p><b> 第一章 緒 論1</b></p><p> 1.1 什么是數(shù)字電視1</p><p> 1.2 數(shù)字電視的視頻格式特點1</p><p> 1.3 研究意義和論文內(nèi)容安排2</p><p> 第二章 數(shù)字圖像處理理論基礎(chǔ)3</p><p>
11、2.1 數(shù)學插值介紹3</p><p> 2.1.1 生產(chǎn)實踐上的插值問題3</p><p> 2.1.2 數(shù)學上常見的插值類型3</p><p> 2.2 數(shù)字圖像(image)數(shù)字圖像處理基本知識介紹3</p><p> 2.2.1 什么是數(shù)字圖像3</p><p> 2.2.2 數(shù)字圖像在計算
12、機內(nèi)的處理3</p><p> 2.2.3 數(shù)字圖像處理概述3</p><p> 2.2.4 數(shù)字圖像文件格式3</p><p> 2.3 MATLAB基本知識介紹3</p><p> 2.3.1 MATLAB概述3</p><p> 2.3.2 MATLAB的特點3</p><
13、;p> 2.3.3 MATLAB的主要功能3</p><p> 2.3.4 MATLAB在圖象處理中的應用3</p><p> 第三章 傳統(tǒng)數(shù)字圖像縮放技術(shù)3</p><p> 3.1 數(shù)字圖像縮放技術(shù)概述3</p><p> 3.1.1 什么是數(shù)字圖像縮放3</p><p> 3.1.2
14、數(shù)字圖像縮放的算法概述3</p><p> 3.2 傳統(tǒng)的數(shù)字圖像縮放技術(shù)3</p><p> 3.2.1最近鄰插值(Nearest Neighbor Interpolation)3</p><p> 3.2.2雙線性插值(Bilinear Interpolation)3</p><p> 3.2.3 雙三次插值(Bicubi
15、c Interpolation)3</p><p> 第四章 當今主流數(shù)字圖像縮放技術(shù)的算法3</p><p> 4.1 基于近臨插值與鄰域取平均的圖像縮小算法3</p><p> 4.1.1問題引入3</p><p> 4.1.2 算法實現(xiàn)3</p><p> 4.1.3 算法評價3</p
16、><p> 4.2 基于Ferguson曲面插值的圖像縮放方法3</p><p> 4.2.1 問題引入3</p><p> 4.2.2 算法實現(xiàn)3</p><p> 4.2.3 算法評價3</p><p> 4.3 帶系數(shù)自適應插值算法及其改進3</p><p> 4.3.1
17、 問題引出3</p><p> 4.3.2 數(shù)學推導與算法實現(xiàn)3</p><p> 4.4 基于數(shù)字圖像邊緣提取的插值算法3</p><p> 4.4.1 問題引入3</p><p> 4.4.2 圖像定向插值的一般實現(xiàn)方法3</p><p> 4.4.3 圖像定向插值的簡化算法3</p&g
18、t;<p> 4.4.4 算法評價3</p><p> 4.5 基于多幀圖像融合的提高圖像分辨率的方法3</p><p> 4.5.1 引言3</p><p> 4.5.2 提高分辨率圖像融合的關(guān)鍵技術(shù)3</p><p> 4.5.3 基于共軛梯度算法的圖像融合3</p><p>
19、第五章 縮放算法處理結(jié)果及比較3</p><p><b> 5.1 概述3</b></p><p> 5.2 傳統(tǒng)圖像縮放算法處理結(jié)果3</p><p> 5.3 基于近鄰插值與鄰域取平均的圖像縮小算法性能分析3</p><p> 5.4 基于Ferguson曲面插值的圖像縮放方法分析3</p&g
20、t;<p> 5.5 帶系數(shù)自適應插值算法及其改進分析3</p><p> 5.6 基于數(shù)字圖像邊緣提取的插值算法分析3</p><p><b> 第六章 總 結(jié)3</b></p><p> 6.1 論文總結(jié)3</p><p> 6.2 數(shù)字圖象縮放技術(shù)展望3</p>&l
21、t;p><b> 致 謝3</b></p><p><b> 參考文獻3</b></p><p><b> 畢業(yè)設(shè)計小結(jié)3</b></p><p><b> 摘 要</b></p><p> 本文先對當今數(shù)字電視的視頻格式特點做了一
22、個總結(jié),以數(shù)字電視的視頻格式變換為基礎(chǔ),引出了數(shù)字圖像縮放這一很重要的技術(shù)。接著在數(shù)學上從生產(chǎn)實踐上遇到的插值問題出發(fā),對插值技術(shù)做了一個必要的介紹,指明了目前數(shù)學的常見的插值類型。為了對算法進行實現(xiàn),性能與運算量做一個分析,引入了MATLAB這個功能強大的數(shù)學運算軟件,對其功能、用途以及在數(shù)字圖像處理上常用的函數(shù)做了介紹。</p><p> 數(shù)字圖像縮放技術(shù)主要基于插值算法。本文在介紹插值算法時首先介紹了最近
23、鄰插值、雙線性插值和雙三次差值三種傳統(tǒng)插值算法,并從數(shù)學形態(tài)上分析其插值核函數(shù)引起的計算量和處理效果的不同。在此基礎(chǔ)上研究了當今比較流行的幾種縮放算法,指出它們均是在傳統(tǒng)算法上的改進算法。然后對三種傳統(tǒng)算法和四種改進算法編寫MATLAB程序進行了數(shù)據(jù)實驗,對四種改進算法分別進行必要的運算量與性能分析,并進行對比。最后,對文中所述插值算法做了總結(jié)。</p><p> 關(guān)鍵詞:圖像縮放,插值技術(shù),分辨率變換,數(shù)字電
24、視,圖像處理</p><p><b> ABSTRACT</b></p><p> This paper researches on image scaling technology in HDTV. Firstly, popular HDTV video formats and interpolation algorithms are summarized br
25、iefly. Then, MATLAB, a powerful mathematical software, is introduced.</p><p> Base on introduction of related technologies, three kinds of traditional interpolation algorithms and features of their kernel f
26、unction are analyzed, including Nearest Neighbor Interpolation, Bilinear Interpolation and Bicubic Interpolation.. After that, four popular image scaling algorithms are researched, and all mentioned algorithms are progra
27、mmed on MATLAB. Performances of each algorithm are compared after data experiments on MATLAB. Finally, interpolation algorithms used in image scaling ar</p><p> KEY WORDS: image scaling, interpolation techn
28、iques, resolution transform,</p><p> HDTV, digital image processing</p><p><b> 第一章 緒 論</b></p><p> 隨著信息化時代的到來,數(shù)字化成為其中的主角,可以說信息化的實現(xiàn)是以信息化為前提的。從計算機,互聯(lián)網(wǎng),數(shù)碼相機,到數(shù)字電視無一例外的在演
29、繹著這場數(shù)字化風暴。尤其是數(shù)字電視,正在經(jīng)歷一場數(shù)字化的革命。但不管是數(shù)字電視,還是計算機都在利用數(shù)字化的視頻聲音與圖像等多媒體因素來沖擊人們的感官神經(jīng)。數(shù)字圖像的處理便成了其中的不可或缺的技術(shù),數(shù)字電視接收各種圖像信號,包括標清信號,高清信號等,最終把這些不同分辨率的視頻信號轉(zhuǎn)化為同一種分辨率的視頻信號進行播放。因此,數(shù)字圖像分辨率放大和縮小技術(shù)是所有數(shù)字顯示設(shè)備的關(guān)鍵技術(shù)之一。</p><p> 1.1 什
30、么是數(shù)字電視</p><p> 數(shù)字電視,即HDTV, 全稱High Definition Television,直譯即為“高清晰度電視”,現(xiàn)一般簡稱“高清電視”。與當前采用模擬信號傳輸?shù)膫鹘y(tǒng)電視系統(tǒng)不同,HDTV采用數(shù)字信號傳輸。由于HDTV從電視節(jié)目的采集、制作到電視節(jié)目的傳輸以及用戶終端的接收全部實現(xiàn)數(shù)字化,因此HDTV可以帶給我們極高的清晰度,其分辨率最高可達1920×1080,幀速率高達60
31、fps,視角也由原先的4:3變成了16:9,同時全面應用了數(shù)字技術(shù),其信號抗噪能力也大大加強。</p><p> 1.2 數(shù)字電視的視頻格式特點</p><p> 電視機的圖像分辨率可以用它的固有分辨率來表示,固有分辨率是指電視機或其他顯示設(shè)備無需采用行倍頻、行內(nèi)插或其他形式的分辨率變換手段而本身就能做到的圖像分辨率。它通常用水平方向像素和垂直方向像素兩者相乘來表示。例 如1027*
32、768對于如等離子電視、液晶顯示電視或數(shù)字光處理電視等一類固定像素的顯示器來說固有分辨率與它們的實際像素排列結(jié)構(gòu)相同。</p><p> 電視的畫面清晰度是以水平清晰度作為單位。通俗地說,我們可以把電視機上的畫面以水平方向分割成很多很多掃描線,分得越細,這些畫面就越清楚。而水平線數(shù)的掃描線數(shù)量也就越多。清晰度的單位是電視行(TV line)也稱線意思是從水平方向上看相當于每行掃描線豎立起來,然后乘上)4:3 或
33、者16:9的寬高比,構(gòu)成水平方向的總線數(shù)。</p><p> 數(shù)字電視常見的視頻格式有[1]:</p><p> 1)1080i格式,是標準數(shù)字電視顯示模式1125條水平掃描線1080條可見水平掃描線,16:9,分辨率為1920*1080隔行/60Hz,行頻為33.75KHz。</p><p> 2)720P格式,是標準數(shù)字電視顯示模式。750條水平掃描線,7
34、20條可見水平掃描線,16:9,分辨率為1280*720逐行/60Hz,行頻為45kHz。</p><p> 3)1080P格式,是標準數(shù)字電視顯示模式,1125條水平掃描線,1080條可見水平掃描線,16:9分辨率為 1920*1080逐行掃描,專業(yè)格式。</p><p> 以上標準中i表示隔行P表示逐行TDTV標準是高品質(zhì)視頻信號標準包括1080i,720P,1080P。需要注意的
35、是,對于電視機處理能力(例如帶寬)的要求則是1080i<720P。數(shù)字高清電視的720P,1080I和1080P是由美國電影電視工程師協(xié)會確定的高清標準格式。其中1080P被稱為目前數(shù)字電視的頂級顯示格式。這種格式的電視在逐行掃描下能夠達到1920*1080的分辨率。目前世界上只有60英寸以上的顯示屏才能夠顯示出1920*1080的信號。 目前市場上出現(xiàn)的所謂1080P高清數(shù)字電視并不能真正給消費者帶來1920*1080的圖像。
36、這些彩電只是能夠接收和處理1920*1080格式的信號而已。</p><p> 1.3 研究意義和論文內(nèi)容安排</p><p> 無論是何種視頻格式的終端顯示設(shè)備,其高清信號源都是同樣的分辨率。而當今數(shù)字電視信號終端顯示設(shè)備又是各種各樣的,從普通的CRT,到高檔的液晶,等離子,其顯示方式和大小不盡相同,隨著3G技術(shù)的逐漸成熟,越來越多的手機可以接收數(shù)字電視信號,在小小的屏幕上顯示。這些
37、都需要終端設(shè)備具備數(shù)字圖像的分辨率變換功能,因此數(shù)字圖像縮放技術(shù)顯得越來越重要,本文正是從這個背景出發(fā),來對傳統(tǒng)的以及當今主流的縮放技術(shù)做了一個系統(tǒng)研究。第一章總結(jié)了數(shù)字電視的視頻格式特點;第二章介紹了圖像縮放的數(shù)學基礎(chǔ);第三章和第四章是論文主要內(nèi)容詳盡介紹傳統(tǒng)插值于主流插值算法并進行算法實現(xiàn);第五章對論文所研究算法做了性能與運算量的對比最后是對算法的技術(shù)展望。</p><p> 第二章 數(shù)字圖像處理理論基礎(chǔ)&
38、lt;/p><p> 2.1 數(shù)學插值介紹</p><p> 2.1.1 生產(chǎn)實踐上的插值問題[2]</p><p> 在生產(chǎn)和科研中遇到的函數(shù),不能直接寫出表達式,而只能給定了在區(qū)間[a,b]中互異的n+1個點,,處的函數(shù)值。實際中,常常希望找到這種函數(shù)的近似解析表達式,以便計算在諸之外的點處的函數(shù)值,函數(shù)的導數(shù)或積分,一種常用的辦法就是某個性質(zhì)優(yōu)良,便于計算的
39、函數(shù)類中選出一個函數(shù),使。尋找的方法就是插值法。下面介紹插值法中涉及的一些感念和基本問題。</p><p><b> 1.插值問題</b></p><p> 設(shè)為區(qū)間[a,b]上的連續(xù)函數(shù),且已知點上的值為</p><p> 若存在一個簡單函數(shù),使</p><p><b> ?。?.1)</b>
40、;</p><p> 則稱為的插值函數(shù),點稱為插值節(jié)點,條件(2.1)稱為插值條件,所在區(qū)間[a,b]稱為插值區(qū)間,稱為被插值函數(shù)。求插值函數(shù)的問題(方法)成為插值問題(方法)。</p><p> 如果插值函數(shù)類是代數(shù)多項式,則相應的插值問題成為代數(shù)插值,如果是三角函數(shù),則相應的插值問題成為三角插值。在數(shù)字圖像縮放技術(shù)中運用的插值,一般均為代數(shù)插值。</p><p&
41、gt; 2..代數(shù)插值的幾何意義</p><p> 代數(shù)插值的幾何意義就是通過n+1個點做一條代數(shù)曲線使其近似于代數(shù)曲線y = f(x)。 3.插值余項</p><p> 由插值法的定義可知,在區(qū)間[a,b]上用y = f(x)時,在節(jié)點上有,而在其他點x處一般會有誤差。令</p><p><b> ?。?.2)</b></
42、p><p> 它表示用近似f(x)的截斷誤差,常成為插值多項式的插值余項或截斷誤差。一般地,越小,則近似程度越好。</p><p> 2.1.2 數(shù)學上常見的插值類型[3]</p><p> 數(shù)學上常見的插值類型有:拉格朗日插值(Lagrange),牛頓插值(Newton),埃爾米特插值(Hermite),分段低次插值與三次樣條插值(B-spline).有關(guān)插值詳
43、細問題基本在每本數(shù)值分析書上都有,有興趣的讀者可以參閱《數(shù)值分析》。</p><p> 2.2 數(shù)字圖像(image)數(shù)字圖像處理基本知識介紹</p><p> 2.2.1 什么是數(shù)字圖像</p><p> 所謂數(shù)字圖像就是把傳統(tǒng)圖像的畫面分割成如圖2.1所示的被成為像素(picture element, 簡稱pixel。有時候也用pel這一簡寫詞)的小的離散
44、點,各像素的灰度值也是用離散值即整數(shù)值來表示的。數(shù)字圖像(digital imagine)和傳統(tǒng)的圖像即模擬圖像(picture)是有差別的。</p><p><b> 圖2.1 數(shù)字圖像</b></p><p> 為了從一般的照片,景物等模擬圖像中得到數(shù)字圖像,需要對傳統(tǒng)的模擬圖像進行采樣與量化兩種操作(二者統(tǒng)稱為數(shù)字化)[5]。</p><
45、p><b> 采樣</b></p><p> 采樣(sampling)就是把在時間上和空間上連續(xù)的圖像變成離散點(采樣點,即像素)的集合的一種操作。</p><p> 圖像基本上是在二維平面上連續(xù)分布的信息形式要把它輸入到計算機中,首先要把二維信號變成一維信號,因此要進行掃描(scanning)。最常用的掃描方法是在二維平面上按一定間隔順序地從上方順序地沿
46、水平方向的直線(掃描線)掃描,從而取出濃淡值(灰度值)的線掃描(Laster掃描)。對于由此得到的一維信號,通過求出每一特定間隔的值,可以得到離散的信號。對于運動圖像除進行水平,垂直兩個方向的掃描以外,還有進行時間軸上的掃描。</p><p> 通過采樣,如設(shè)橫向的像素數(shù)為M,縱向的像素數(shù)為N,則畫面的大小可以表示為“M*N”個像素。</p><p><b> 量化</
47、b></p><p> 經(jīng)過采樣,圖像被分解成在時間上和空間上離散分布的像素,但是像素的值(灰度值)還是連續(xù)值。像素的值,是指白色-灰色-黑色的濃淡值,有時候也指光的強度(亮度)值或灰度值。把這些連續(xù)的濃淡值或灰度值變?yōu)殡x散的值(整數(shù)值)的操作就是量化。</p><p> 如果把這些連續(xù)變化的值(灰度值)量化為8bit,則灰度值被分成0-2552的256個級別,分別對應于各個灰度
48、值的濃淡程度,叫做灰度等級或灰度標度。</p><p> 在0-255的值對應于白-黑的時候,有以0為白,255為黑的方法,也有以0為黑,255為白0的方法,這取決于圖像的輸入方法以及用什么樣的觀點對圖像進行處理等,這是在編程時應特別注意的問題。但在只有黑白二值的二值圖像的情形,一般設(shè)0為白,1為黑。</p><p> 對連續(xù)的灰度值賦予量化級的,即灰度值方法有:均勻量化(unifor
49、m quantization),線性量化(liner quantization),對數(shù)量化,MAX量化,錐形量化(tapered quantization)等。</p><p> 3. 采樣、量化和圖像細節(jié)的關(guān)系</p><p> 上面的數(shù)字化過程,需要確定數(shù)值N和灰度級的級數(shù)K。在數(shù)字圖像處理中,一般都取成2的整數(shù)冪,即:</p><p><b>
50、 (2.3)</b></p><p><b> (2.4)</b></p><p> 一幅數(shù)字圖像在計算機中所占的二進制存儲位數(shù)b為:</p><p><b> (2.5)</b></p><p> 例如,灰度級為256級(m=8)的512×512的一幅數(shù)字圖像,需要大
51、約210萬個存儲位。隨著N和m的增加,計算機所需要的存儲量也隨之迅速增加。</p><p> 由于數(shù)字圖像是連續(xù)圖像的近似,從圖像數(shù)字化的過程可以看到。這種近似的程度主要取決于采樣樣本的大小和數(shù)量(N值)以及量化的級數(shù)K(或m值)。N和K的值越大,圖像越清晰。</p><p> 2.2.2 數(shù)字圖像在計算機內(nèi)的處理</p><p> 設(shè)一幅圖像f(x,y),我
52、們?nèi)魧λ鞯乳g隔的采樣,在x,y方向上都取N個采樣點,總共為N×N個圖像點。每一像素f (i, 1=0,1,2, …N-1)就是點的灰度值。形成離散化了的坐標和灰度值可以用一個矩陣來表示,其行和列的交點標出圖像的每個像素,該數(shù)字圖像矩陣可表示為圖2.2</p><p> 圖2.2 數(shù)字圖像矩陣</p><p> 在計算機中對數(shù)字圖像進行處理時,實質(zhì)上就是在對量化后的矩陣進行
53、處理。</p><p> 從原理上將,傳統(tǒng)的彩色圖像分析是基于RGB色彩空間的,但是RGB空間是顏色顯示空間,并不適合人的視覺特性,對目標物體的顏色模式描述復雜,各個分量之間冗余信息多,計算量大,而HSV空間通過對RGB顏色進行變換,能體現(xiàn)人眼辨別顏色特點。在HSV空間,圖像特征明顯,易于進行邊緣檢測,分割和目標識別處理。</p><p> 顏色可用明度、色調(diào)和飽和度來描述,人眼看到的
54、任一顏色都是這三個特性的綜合效果。明度是光作用于人眼時所引起的明亮程度的感覺,它與被觀察物體的發(fā)光強度有關(guān),由于其強度不同,看起來可能亮一些或暗一些。色調(diào)是當人眼看到一種或多種波長的光時所產(chǎn)生的彩色感覺,不同的波長產(chǎn)生不同的顏色感覺,如紅、橙、黃、綠、青、藍、紫等。色調(diào)是彩色的最重要的屬性,是彩色光在“質(zhì)”方面的特征。如某物體在白光下呈現(xiàn)綠色,是因為它僅反射了綠色光分量。飽和度是指顏色的純度,即摻入白色光的程度,飽和度的高低決定于彩色光
55、中混入的白色光數(shù)量,白色光愈少,飽和度越高。飽和度是彩色光在“量”的方面的特征。人眼大概能識別128種不同的色調(diào)和130種不同的色澤(色飽和度級)。</p><p> 2.2.3 數(shù)字圖像處理概述[5]</p><p> 數(shù)字圖像處理的英文名稱是”Digital Image Processing”。通常所說的數(shù)字處理是指用計算進行的處理,因此也稱計算機圖像處理(Computer Im
56、age Processing)??偟膩碚f,數(shù)字圖像處理包括以下幾項內(nèi)容:</p><p><b> (1)點運算</b></p><p> 點運算主要是針對圖像的象素進行加、減、乘、除等運算。圖像的點運算可以有效的改善圖像的直方圖分布,這對提高圖像的分辨率以及圖像的均衡都是非常有益的。</p><p><b> (2)幾何處理&
57、lt;/b></p><p> 幾何處理主要包括圖像的坐標變換、圖像的移動、縮小、放大、旋轉(zhuǎn)、多個圖像的配準以及圖像的扭曲校正等。幾何處理是最常見的圖像處理手段,幾乎任何圖像處理軟件都提供了最基本的圖像縮放功能。</p><p><b> (3)圖像增強</b></p><p> 圖像增強的作用最主要是突出圖像中最重要的信息,同時減
58、弱或除去不重要的信息。常用的方法有直方圖增強和偽彩色增強等。</p><p><b> (4)圖像復原</b></p><p> 圖像復原的主要目的是去除干擾和模糊,從而恢復圖像的本來面目。例如去除噪聲復原處理。</p><p> (5)圖像形態(tài)學處理</p><p> 圖像形態(tài)學是數(shù)學形態(tài)學的延伸,是一門獨立的
59、研究學科。利用圖像形態(tài)學技術(shù),可以實現(xiàn)圖像的腐蝕、細化和分割等效果。</p><p><b> (6)圖像編碼</b></p><p> 圖像編碼研究屬于信息論中信源編碼的范疇,其主要宗旨是利用圖像信息的統(tǒng)計特性及人類的視覺特性對圖像進行高效編碼,從而達到壓縮圖像的目的。</p><p><b> (7)圖像重建</b&g
60、t;</p><p> 圖像重建是一門新興的數(shù)字圖像處理技術(shù),主要是利用采集的數(shù)據(jù)來重建出圖像。其主要算法有代數(shù)法、迭代法、傅立葉反投影法和使用最廣泛的卷積反投影法等。</p><p><b> (8)模式識別</b></p><p> 模式識別也是數(shù)字圖像處理的一個新的研究方向。當今的模式識別方法通常有三種:統(tǒng)計識別法、句法結(jié)構(gòu)模式識別
61、法和模糊識別法。</p><p> 本文所討論的數(shù)字圖像縮放技術(shù)主要是圖像分辨率的變換,屬于數(shù)字圖像的幾何處理的范疇。</p><p> 2.2.4 數(shù)字圖像文件格式[6]</p><p> 計算機圖像常用文件格式</p><p> PCX(Windows Paintbrush)格式??商幚?,4,8,16,24位等圖像數(shù)據(jù)。文件內(nèi)容
62、包括:文件頭(128字節(jié)),圖像數(shù)據(jù)擴展調(diào)色板數(shù)據(jù)。</p><p> BMP(Windows Bitmap)格式。有1,4,8,24位非壓縮圖像,8位RLE(Run-length Encoded )圖像。文件內(nèi)容包括:文件頭(一個BITMAP FILEHEADER數(shù)據(jù)結(jié)構(gòu)),位圖信息數(shù)據(jù)塊(位圖信息頭BITMAP INFOHEADER和一個顏色表)和圖像數(shù)據(jù)。</p><p> HD
63、F(Hierarchical Data Format)格式。有8位,24位光柵數(shù)據(jù)集。</p><p> JPEG(Joint Photographic Experts Group)格式,是一種成為聯(lián)合圖像專家組的圖像壓縮格式。</p><p> TIFF(Tagged Image File Format)格式。處理1,4,8,24位非壓縮圖像,1,4,8,24位packbit壓縮圖像
64、,一位CCITT壓縮圖像等。文件內(nèi)容包括:文件頭,參數(shù)指針表與參數(shù)域,參數(shù)數(shù)據(jù)表和圖象數(shù)據(jù)四部分。</p><p> XWD(X Windows Dump)格式。1,8位Zpixmaps,XYbitmaps,1位XYpixmaps。</p><p> TGA格式。處理1,4,8,16,24位非壓縮圖像和行程編碼(RLE)圖像。文件由5個固定長度字段和3個可變長度字段組成。</p&
65、gt;<p> MATLAB圖像處理工具箱支持的四種基本圖像類型:</p><p><b> 索引圖像</b></p><p> 索引圖像包括圖像矩陣與顏色圖數(shù)組,其中,顏色圖是按圖像中顏色值進行排序后的數(shù)組。對于每個像素,圖像矩陣包含一個值,這個值就是顏色圖中的索引。顏色圖為m*3雙精度值矩陣,各行分別指定紅綠藍(RGB)單色值。Colormap
66、=[R,G, B],R,G,B為值域為[0,1]的實數(shù)值。</p><p> 圖像矩陣與顏色圖的關(guān)系依賴于圖像矩陣是雙精度型還是uint8(無符號8位整型)類型。如果圖像矩陣為雙精度類型,第一點的值對應于顏色圖的第一行,第二點對應于顏色圖的第二行,依次類推。如果圖像矩陣是uint8,有一個偏移量,第0點值對應于顏色圖的第一行,第一點對應于第二行,依次類推;uint8長用于圖形文件格式,它支持256色。</
67、p><p><b> 灰度圖像</b></p><p> 在MATLAB中,灰度圖像是保存在一個矩陣中的,矩陣中的每一個元素代表一個像素點。矩陣可以是雙精度類型,其值域為[0,1];也可以為uint8類型,其數(shù)據(jù)范圍為[0,255]。矩陣的每個元素代表不同的亮度或灰度級。</p><p><b> 二進制圖像</b>&l
68、t;/p><p> 二進制圖像中,每個點為兩離散值中的一個,這兩個值代表開或關(guān)。二進制圖像保存在一個由二維的由0(關(guān))和1(開)組成的矩陣中。從另一個角度講,二進制圖像可以看成為一個僅包括黑與白的灰度圖像,也可以看作只有兩種顏色的索引圖像。</p><p> 二進制圖像可以保存為雙精度或uint8類型的雙精度數(shù)組,顯然使用uint8類型更節(jié)省空間。在圖像處理工具箱中,任何一個返回二進制圖像
69、的函數(shù)都是以uint8類型邏輯數(shù)組來返回的。</p><p><b> RGB圖像</b></p><p> 與索引圖像一樣,RGB圖像分別用紅,綠,藍三個亮度值為一組,代表每個像素的顏色。與索引圖像不同的是,這些亮度值直接存在圖像數(shù)組中,而不是存放在顏色圖中。圖像數(shù)組為M*N*3,M,N表示圖像像素的行列數(shù)。</p><p> 2.3
70、MATLAB基本知識介紹 </p><p> 2.3.1 MATLAB概述[8]</p><p> MATLAB 最初是作為矩陣實驗室 (Matrix Labora2tory) 用來提供通往 LINPACK和EISPACK矩陣軟件包接口的。后來,它逐漸發(fā)展成為通用科技計算和圖視交互系統(tǒng)的程序語言,其數(shù)據(jù)的基本單元是矩陣。它的指令表達與數(shù)學、工程中常用的習慣形式十分相似,從而使許多用 C
71、 或 Fortran 實現(xiàn)起來十分復雜費時的問題用 MATLAB 就可以輕松地解決。MATLAB 的典型應用包括 :數(shù)學計算、算法研究、數(shù)據(jù)分和計算結(jié)果可視化、建模與仿真等。</p><p> 2.3.2 MATLAB的特點</p><p> MATLAB 有三大特點 :一是功能強大。主要包括數(shù)值計算和符號計算、計算結(jié)果和編程可視化、數(shù)學和文字統(tǒng)一處理、離線和在線計算。二是界面友好,編
72、程效率高。MATLAB 是一種以矩陣為基本單元的可視化程序設(shè)計語言,語法結(jié)構(gòu)簡單,數(shù)據(jù)類型單一,指令表達與標準教科書的數(shù)學表達式相近。三是開放性強。MATLAB有很好的可擴充性可以把它當成一種更高級的語言去使用。使用它很容易編寫各種通用或?qū)S脩贸绦颉?lt;/p><p> 2.3.3 MATLAB的主要功能</p><p> MATLAB 之所以成為世界頂級的科學計算與數(shù)學應用軟件 ,是
73、因為它隨著版本的升級與不斷完善而具有愈來愈強大的功能。</p><p> (1) 數(shù)值計算功能。MATLAB 出色的數(shù)值計算功能是使之優(yōu)于其他數(shù)學應用軟件的決定性因素之一。</p><p> (2) 符號計算功能。MATLAB 符號運算的獨特之處:無須事先對變量賦值,而所得的結(jié)果以標準的符號形式表達 ,符號計算的整個過程以字符進行。</p><p> (3)
74、數(shù)據(jù)分析功能。MATLAB 可以給計算數(shù)據(jù)以二維、三維乃至四維的圖形表現(xiàn)。這不僅使數(shù)據(jù)間的關(guān)系清晰明了 ,而且對于揭示其內(nèi)在本質(zhì)有著非常重要的作用。</p><p> (4) 動態(tài)仿真功能。MATLAB 提供了一個模擬動態(tài)系統(tǒng)的交互程序 SIMULINK,用戶通過簡單的鼠標操作 ,就可建立起直觀的系統(tǒng)模型 ,并進行仿真。</p><p> (5) 圖形文字統(tǒng)一處理功能。MATLAB N
75、otebook成功地將Microsoft Word 與 MATLAB 集成為一個整體 ,為文字處理、科學計算、工程設(shè)計營造了一個完美統(tǒng)一的工作環(huán)境。它既擁有 Word 強大的文字處理功能 ,又能從 Word 訪問MATLAB 的數(shù)據(jù)計算和可視化結(jié)果。</p><p> 2.3.4 MATLAB在圖象處理中的應用[8]</p><p> 圖像處理工具包是由一系列支持圖像處理操作的函數(shù)組成
76、的。所支持的圖像處理操作有:圖像的幾何操作、鄰域和區(qū)域操作、圖像變換、圖像恢復與增強、線性濾波和濾波器設(shè)計、變換(DCT變換等) 、圖像分析和統(tǒng)計、二值圖像操作等。下面就MATLAB 在圖像處理中各方面的應用分別進行介紹。</p><p> (1) 圖像文件格式的讀寫和顯示。MATLAB 提供了圖像文件讀入函數(shù) imread(),用來讀取如:bmp,tif、tiff、pcx 、jpg 、gpeg 、hdf、xw
77、d等格式圖像文;圖像寫出函數(shù) imwrite() ,還有圖像顯示函數(shù) image()、imshow()等等。</p><p> (2) 圖像處理的基本運算。MATLAB 提供了圖像的和、差等線性運算 ,以及卷積、相關(guān)、濾波等非線性算。例如,conv2(I,J)實現(xiàn)了I,J兩幅圖像的卷積。</p><p> (3) 圖像變換。MATLAB 提供了一維和二維離散傅立葉變換(DFT) 、快速
78、傅立葉變換(FFT) 、離散余弦變換 (DCT) 及其反變換函數(shù),以及連續(xù)小波變換(CWT)、離散小波變換(DWT)及其反變換。</p><p> (4) 圖像的分析和增強。針對圖像的統(tǒng)計計算MATLAB 提供了校正、直方圖均衡、中值濾波、對比度調(diào)整、自適應濾波等對圖像進行的處理。</p><p> (5) 圖像的數(shù)學形態(tài)學處理。針對二值圖像,MATLAB 提供了數(shù)學形態(tài)學運算函數(shù);蝕
79、(Erode)、膨脹(Dilate)算子,以及在此基礎(chǔ)上的開 (Open)、閉(Close)算子、厚化 (Thicken) 、薄化 (Thin) 算子等豐富的數(shù)學形態(tài)學運算。</p><p> 以上所提到的 MATLAB在圖像中的應用都是由相應的MATLAB函數(shù)來實現(xiàn)的,使用時,只需按照函數(shù)的調(diào)用語法正確輸入?yún)?shù)即可。具體的用法可參考MATLAB豐富的幫助文檔。圖像邊緣對圖像識別和計算機分析十分有用,在MATL
80、AB中,函數(shù) edge()用于灰度圖像邊緣的提取,它支持六種不同的邊緣提取方法,即Sobel方法、Prewitt 方法、Robert 方法,Laplacian2Gaussian方法、過零點方法和Canny方法。</p><p> 第三章 傳統(tǒng)數(shù)字圖像縮放技術(shù)</p><p> 3.1 數(shù)字圖像縮放技術(shù)概述</p><p> 3.1.1 什么是數(shù)字圖像縮放<
81、;/p><p> 一般來說,數(shù)字圖像縮放就是指圖像分辨率的變換。包括由高分辨率圖像轉(zhuǎn)變?yōu)榈追直媛蕡D像和有低分辨率圖像轉(zhuǎn)變?yōu)楦叻直媛蕡D像。數(shù)字圖像縮放是圖像處理領(lǐng)域里非常常見的操作,屬于數(shù)字圖像的幾何變換范疇。隨著信息科技的發(fā)展,圖像縮放技術(shù)的應用范圍越來越廣,包括計算機圖像處理軟件中的應用,互聯(lián)網(wǎng)上的多媒體瀏覽,數(shù)字電視視頻傳輸與顯示領(lǐng)域,天文與氣象觀測領(lǐng)域,軍事領(lǐng)域,醫(yī)學圖像應用領(lǐng)域及數(shù)碼照片拍攝與處理領(lǐng)域。總之
82、只要有視頻多媒體的地方,有圖像處理的地方,都會有數(shù)字圖像縮放技術(shù)的身影。隨著數(shù)字化時代的到來,該技術(shù)會越來越多的得到應用。本文主要針對于數(shù)字電視領(lǐng)域圖像縮放,因此在算法上有較強的針對性,對于一些在數(shù)字電視領(lǐng)域難以實現(xiàn)的算法不做過多研究。</p><p> 3.1.2 數(shù)字圖像縮放的算法概述</p><p> 就目前來說,數(shù)字圖像縮放技術(shù)主要是應用數(shù)學上的插值理論,使用插值(Interp
83、olation)算法。傳統(tǒng)的圖像插值算法有最近鄰插值(Nearest Neighbor Interpolation),雙線性插值(Bilinear Interpolation),雙三次插值(Bicubic Interpolation)。傳統(tǒng)插值算法在MATLAB中都有相應的工具函數(shù),屬于比較成熟的算法。在當今流行的插值算法多是對傳統(tǒng)插值算法的改進,包括基于近臨插值與鄰域取平均的圖像縮小算法,基于Ferguson曲面插值的圖像縮放方法,帶
84、系數(shù)自適應插值算法及其改進,基于數(shù)字圖像邊緣提取的插值算法及改進,基于圖像增強技術(shù)提高圖像分辨率方法,隨著小波技術(shù)的發(fā)展,還有越來越多的基于小波的圖像插值算法。但本人覺得由于基于圖像增強技術(shù)提高圖像分辨率方法和基于小波的圖像插值算法計算量過大,加上當今硬件處理速度的限制,很難應用于數(shù)字電視的視頻處理領(lǐng)域,達到實時處理的要求。隨著硬件技術(shù)的發(fā)展有望應用于數(shù)字電視視頻處理領(lǐng)域。</p><p> 3.2 傳統(tǒng)的數(shù)字
85、圖像縮放技術(shù)[7]</p><p> 由于圖像像素的灰度值是離散的,因此一般的處理方法是對原來在整數(shù)點坐標上的像素值進行插值生成連續(xù)的曲線(面),然后在插值曲線(面)上重新采樣以獲得放大或縮小圖像像素的灰度值。以一維空間像素的灰度插值為例,圖3.1所示的是將原圖的5個像素縮小為4個像素的過程:先根據(jù)~這五個像素的灰度值采用選定的插值算法生成插值曲線,再對該曲線進行重采樣得到縮小后的四個像素~,從而實現(xiàn)圖像的縮放
86、。下面簡要介紹目前常用的三種插值采樣方法。</p><p> 圖3.1圖像縮放中的插值和重采樣</p><p> 3.2.1最近鄰插值(Nearest Neighbor Interpolation)</p><p> 1.近鄰插值數(shù)學概述</p><p><b> 插值核函數(shù)為:</b></p>&
87、lt;p><b> 其頻域變換為:</b></p><p> 其核函數(shù)及對應的傅立葉變換頻譜圖如圖3.2為:</p><p> 圖 3.2 近鄰插值核函數(shù)及其傅立葉變換頻譜圖</p><p><b> 2.實現(xiàn)方法</b></p><p> 將目的圖像的某個坐標通過計算得到一個浮點坐
88、標,對其進行簡單的取整處理就得到一個對應原照片圖像的整數(shù)坐標,目的照片圖像坐標的像素值。具體算法為:設(shè)處理的目的圖像的坐標為,圖像的縮放比例為m ,則對應原圖像的浮點坐標為( x/ m , y/ m) ,對該坐標取整得到對應原照片圖像的整數(shù)坐標,目的照片圖像在該坐標的像素值。顯然該方法就是取該浮點坐標最鄰近的左上角對應的像素值。</p><p><b> 3 算法評價</b></p&
89、gt;<p> 對于二維圖像。該法是“取待采樣點周圍4個相鄰像素點中距離最近的1個鄰點的灰度值作為該點的灰度值”。此算法雖然計算簡單,但由于僅用對該采樣點影響最大的(即最近的)像素的灰度值作為該點的值,而沒有考慮其他相鄰像素的影響(相關(guān)性),因此重新采樣后的圖像灰度值有明顯的不連續(xù)性,像質(zhì)損失較大。</p><p> 3.2.2雙線性插值(Bilinear Interpolation)</
90、p><p> 1.線性插值數(shù)學概述</p><p><b> 插值核函數(shù):</b></p><p><b> 其頻域變換為:</b></p><p> 其核函數(shù)及對應的傅立葉變換頻譜圖如圖3.3所示:</p><p> 圖 3.3雙線性插值核函數(shù)及其傅立葉變換頻譜圖&l
91、t;/p><p><b> 2.實現(xiàn)方法</b></p><p> 雙線性內(nèi)插法通過線性插值的方式來得到目的圖像的像素值。我們通過近鄰取樣法知道,對于一個的像素,其坐標通過反向變換可得到一個浮點坐標,我們可令其為( i + u, j + v) ,其中 i 和j 均為負整數(shù), u 和v 為[0,1]區(qū)間的浮點數(shù),則這個目的像素的值可由原圖像中坐標為( i , j) ,
92、( i+1,j) , (i ,j +1) , (i +1,j +1)所對應的值的線性插值來決定,即= (1 - u) (1 - v) f ( i ,j) + (1 - u) vf ( i , j +1) + u(1 - v) f ( i +1, j) + uvf ( i +1,j +1)。其示意圖如圖3.4所示:</p><p> 圖 3.4雙線性插值算法實現(xiàn)示意圖</p><p>&l
93、t;b> 3.算法評價</b></p><p> 與最鄰近法相比。雙線性內(nèi)插法由于考慮了待采樣點周圍四個直接鄰點對待采樣點的影響,因此基本克服了前者灰度不連續(xù)的缺點,但其代價是計算量有所增大。但進一步看,由于此方法僅考慮四個直接鄰點灰度值的影響,而未考慮到各鄰點間灰度值變化率的影響,因此具有低通濾波器的性質(zhì),使縮放后圖像的高頻分量受到損失,圖像的輪廓變得較模糊。用此方法縮放后的圖像與原圖像相
94、比,仍然存在由于計算模型考慮不周而產(chǎn)生的圖像質(zhì)量退化與精度降低的問題。</p><p> 3.2.3 雙三次插值(Bicubic Interpolation)</p><p> 3.2.3.1 雙三次插值的數(shù)學概述</p><p><b> 插值核函數(shù):</b></p><p><b> 其頻域變換為:
95、</b></p><p> 其核函數(shù)及對應的傅立葉變換頻譜圖如圖3.5所示:</p><p> 圖 3.5雙三次插值插值核函數(shù)及其傅立葉變換頻譜圖</p><p><b> 2.實現(xiàn)方法</b></p><p> 對雙線性內(nèi)插法的改進,即不僅考慮到四個直接鄰點灰度值的影響,還考慮到各鄰點間灰度值變化率
96、的影響,立方卷積法利用了待采樣點周圍更大鄰域內(nèi)像素的灰度值作三次插值(4*4=16個像素點)。利用上述插值核函數(shù)提供的公式進行插值。計算時取周圍的16個像素點,其示意圖如圖3.6所示:</p><p> 圖 3.6 雙三次插值算法實現(xiàn)示意圖</p><p> 該像素的灰度值f(x,y)為: 式中各矩陣含義如下:</p><p><b> 3.算法評價
97、</b></p><p> 雙線性內(nèi)插法相比,立方卷積法不僅考慮了直接鄰點的灰度值對待采樣點</p><p> 的影響,還考慮了鄰點間灰度值變化率的影響,因此后者所求得的待采樣點灰度值更接近原(采樣)值。此方法用進一步增大計算量來換取待采樣點精度的進一步提高,因此并不是最佳的插值算法。</p><p> 第四章 當今主流數(shù)字圖像縮放技術(shù)的算法<
98、;/p><p> 4.1 基于近臨插值與鄰域取平均的圖像縮小算法</p><p><b> 4.1.1問題引入</b></p><p> 傳統(tǒng)的圖像縮放算法中,有的有的失真較小但是算法復雜,如雙三次插值;有的運算量小但得到的圖像失真較大,如最近鄰插值和雙線性插值。在對圖像進行縮小的時候存在著圖像信息的損失 ,而且縮小的比例越大,損失越大,從而
99、導致圖像的失真較大,最主要的是在對圖像進行縮小的時候顯然會出現(xiàn)原圖像的多個像素對應同一個像素點從而會產(chǎn)生像素躍越現(xiàn)象。</p><p> 如何合適的選取目的圖像的像素值是圖像縮小的最關(guān)鍵的問題。我們可以通過反向變換法來實現(xiàn)。反向變換法從目的圖像出發(fā),對于一個目的像素 ,通過縮放變換的逆變換 ,找到這個目的像素的原坐標點。但是,存在這樣一個問題 ,即將目的像素的整數(shù)坐標通過反向變換后將得到浮點坐標。</p&
100、gt;<p> 通常對于一個浮點坐標,其對應的點的周圍將有最鄰近的四個或八個像素。取哪一個像點的像素值來作為這個目的像素的值呢?從實質(zhì)上來講,就是怎樣通過鄰近的像素值來計算出一個新的像素值,這個新值就是目的像素的值。傳統(tǒng)三種算法在進行縮小時候,圖像縮小的比例越大,像素躍越現(xiàn)象越明顯,顯然會產(chǎn)生高頻干擾。因此要使得圖像不失真必須采用低通濾波的方式將這些高頻干擾去除。實際上我們處理的時候是將做反變換和濾波同時進行,這樣做的效
101、果更好于是我們運算量與運算結(jié)果上都做了考慮得到此種兼顧運算速度與運算質(zhì)量的圖像縮小算法。</p><p> 4.1.2 算法實現(xiàn)</p><p> 設(shè)原圖像的坐標為,該點的像素值為,目標圖像的坐標為(x,y),該點的像素值為??s小的比例為k, k 在(0,1)區(qū)間取值。則通過反變得到的一個浮點坐標為(x/ k,y/k),對該坐標取整得到一個整數(shù)坐標。這種取得原圖像坐標方法實際和近鄰取樣
102、法完全相同。但是我們不直接利用該點的像素值,而是取該點的周圍的某些點的平均值來作為目標點的像素值。這樣做實際上就是一個低通濾波的過程。我們就稱這種算法為近鄰取樣和鄰域平均相結(jié)合的算法。鄰域平均算法為:令被討論像素的像素值為,以其為中心,窗口像素組成的點集以 A 表示,集內(nèi)像素個數(shù)以L表示。經(jīng)鄰域平均濾波后,像素對應的輸出為:,用窗口像素的平均值代替原來的像素值。鄰域的選取通常有兩種方式:以單位距離為半徑,為一菱形窗口或單位距離的倍為半徑
103、,為一矩形窗口,在本文中我們采取了菱形窗口。具體編程的時候我們使用了如下模板(以距離為5個像素為例)。模板取法如圖4.1所示:</p><p> 圖 4.1 鄰域平均5×5 模板</p><p> 實際該模板為一個5×5的矩陣,使用步驟為:</p><p> (1) 將模板中心和通過近鄰取樣法得到的像素點位置重合;</p>&
104、lt;p> (2) 將模板上系數(shù)與模板下對應像素值相乘;</p><p> (3) 將所有的乘積相加;</p><p> (4) 將和除以模板各系數(shù)之和得到目的圖像對應點像素值。</p><p> 在有些情況下,我們還可以使用權(quán)值不相同的模板。如我們認為距離中心像素遠的點對目的像素的影響小,我們就可以將他們的權(quán)值設(shè)小一些,相反距離中心像素近的點對目的像
105、素的影響大,就可以將他們的權(quán)值設(shè)大一些。下面是一個權(quán)值和距離成反比的5×5模板:</p><p><b> 總的算法流程為:</b></p><p> (1) 讀入原圖像,得到圖像的高度和寬度;</p><p> (2) 通過縮放比例得到目的圖像的高度和寬度,建立空白目的圖像;</p><p> (3)
106、 從上到下,從左往右的順序掃描目的圖像;</p><p> (4) 掃描過程中對每一個目的圖像的坐標 ,利用近鄰法取樣法在原圖像中找到模板中心位置;</p><p> (5) 利用設(shè)定的模板進行鄰域平均得到目的圖像掃描點的像素值,如果模板覆蓋在原圖像的邊界,要進行邊界處理;</p><p> (6) 掃描完成,圖像的縮小處理也就完成了。</p>
107、<p> 圖4.2 權(quán)值和距離成反比的5×5模板</p><p> 4.1.3 算法評價</p><p> 本文討論的近鄰取樣和鄰域平均相結(jié)合的方法對圖像進行縮小處理,具有算法簡單,失真較小的特點。尤其在處理細節(jié)單調(diào),背景和物體之間區(qū)別明顯的圖像,而且縮小比例較大的時候 ,處理效果較好,比較適合處理人的頭像。但是在處理輪廓很細的圖像的時候,輪廓的顏色失真較大,這方
108、面有待于進一步提高。</p><p> 4.2 基于Ferguson曲面插值的圖像縮放方法</p><p> 4.2.1 問題引入</p><p> 在傳統(tǒng)的插值方法中,鄰近點插值不能保證插值曲面連續(xù),插值后圖像會出現(xiàn)塊狀化(Jaggies)現(xiàn)象,圖像視覺效果不佳,因而在實際的應用極少采用;雙線性插值只能達到連續(xù),在插值處只能保證灰度值連續(xù),不能保證導數(shù)值連續(xù)
109、,因此,在某些要求較高的場合仍不能滿足要求。B樣條插值方法可以達到連續(xù),在插值處可以保證灰度值和直到二階導數(shù)值連續(xù),因而對一些細節(jié)豐富的圖像應用雙三次樣條插值可以得到更好的視覺效果.但由于需要求解線性方程組,其計算時間較長,尤其是在放大倍數(shù)很大時,尤為明顯.本文將計算機圖形學中的Ferguson曲面插值應用于圖像縮放中,提出了一種基于Ferguson雙三次曲面插值的圖像縮放算法.這種方法介于雙線性插值和雙三次樣條插值方法之間,是一種插值
110、方法,插值處灰度值和導數(shù)都連續(xù),細節(jié)表現(xiàn)清楚,因此,從理論上講該法優(yōu)于鄰近點插值方法和雙線性插值方法.由于它是一種局部插值方法,不需要求解線性方程組,因而計算速度比雙三次樣條插值要快得多.</p><p> 4.2.2 算法實現(xiàn)</p><p> 1.Ferguson雙三次曲面</p><p> 給定雙三次參數(shù)曲面 4個角點處的幾何信息:位置矢量(i,j=0,
111、1),沿向的切矢,以及四個角點處的扭矢,則滿足以上幾何條件的雙三次曲面可表示為:</p><p><b> ?。?.1)</b></p><p><b> 其中:,</b></p><p> 由公式(4.1)定義的曲面稱為Coons雙三次曲面.在實際計算時,4個角點處扭矢不容易確定.如果令上述公式中4個扭矢為零,即令&
112、lt;/p><p> 此時由公式(4.1)定義的曲面就稱為Ferguson雙三次曲面.</p><p> 2.Ferguson雙三次曲面插值</p><p> 對于給定的原始圖像,在本文的算法中,插值曲面由M*N張Ferguson雙三次曲面片組成。</p><p><b> ?。?.2)</b></p>
113、<p> 其中,,,的含義同上。</p><p><b> (4.3)</b></p><p> 整張插值曲面按如下方式定義:當時令</p><p><b> ?。?.4)</b></p><p> 在矩陣(4.3)中,左上角代表像素的灰度值,均已知。左下角代表在4個角點處灰度值關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)字圖像縮放技術(shù)研究 畢業(yè)論文3
- 數(shù)字圖像縮放及圖像質(zhì)量評價關(guān)鍵技術(shù)研究.pdf
- 醫(yī)學數(shù)字圖像畢業(yè)論文
- 畢業(yè)論文---數(shù)字圖像處理
- 數(shù)字圖像處理畢業(yè)論文
- 數(shù)字圖像處理畢業(yè)論文
- 數(shù)字圖像處理畢業(yè)論文
- 畢業(yè)論文數(shù)字圖像處理論文
- 畢業(yè)論文外文翻譯-數(shù)字圖像處理
- 畢業(yè)論文(論文)數(shù)字圖像去霧算法研究
- 畢業(yè)設(shè)計----數(shù)字圖像處理技術(shù)研究
- 數(shù)字圖像處理論文數(shù)字圖像處理技術(shù)論文.
- 數(shù)字圖像處理與分析畢業(yè)論文
- 數(shù)字圖像處理-圖像縮放的vc++實現(xiàn)
- 數(shù)字圖像分割的多種算法研究-畢業(yè)論文
- 數(shù)字圖像篡改的檢測方法研究【畢業(yè)論文】
- 基于matlab的數(shù)字圖像處理畢業(yè)論文
- 數(shù)字圖像縮放及其質(zhì)量評價方法研究.pdf
- 圖像縮放合成處理畢業(yè)論文
- 畢業(yè)論文——基于matlab數(shù)字圖像增強處理
評論
0/150
提交評論