版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、<p> 本 科 畢 業(yè) 論 文</p><p> 圖像感興趣區(qū)域提取技術(shù)研究</p><p><b> —系統(tǒng)實(shí)現(xiàn)</b></p><p> Region of Interest Extraction Research</p><p> —System Implementation<
2、/p><p><b> 姓 名:</b></p><p><b> 學(xué) 號(hào):</b></p><p><b> 學(xué) 院:軟件學(xué)院</b></p><p><b> 系:軟件工程</b></p><p> 專
3、 業(yè):軟件工程</p><p><b> 年 級(jí):</b></p><p><b> 指導(dǎo)教師: </b></p><p><b> 年 月</b></p><p><b> 摘 要</b></p><p>
4、隨著信息化社會(huì)的到來,多媒體技術(shù)、通信技術(shù)的發(fā)展,人們?cè)絹碓蕉嗟慕佑|到圖像信息。每天都有海量的圖像數(shù)據(jù)產(chǎn)生,并且在因特網(wǎng)上流動(dòng)著。因此怎樣有效地管理,檢索這些龐大的數(shù)據(jù)成為了當(dāng)今越來越多的人關(guān)注并研究的主題。</p><p> 如今傳統(tǒng)的基于關(guān)鍵字的信息檢索技術(shù)因?yàn)椴荒馨凑請(qǐng)D像本身的特點(diǎn)搜索,已逐漸不能滿足要求。因此,基于內(nèi)容的圖像檢索技術(shù)成為了當(dāng)今的一個(gè)研究熱點(diǎn)?;诟信d趣區(qū)域(Region of Inter
5、est,簡稱ROI)的搜索技術(shù)是基于內(nèi)容的圖像搜索技術(shù)的一個(gè)重要的分支,也是圖像檢索技術(shù)的最新發(fā)展形式之一。這種圖像檢索技術(shù),以圖像中最能體現(xiàn)其特點(diǎn)和價(jià)值的區(qū)域來檢索,因此更能體現(xiàn)用戶檢索的目的?;诟信d趣區(qū)域的檢索技術(shù)已經(jīng)被越來越多的人關(guān)注并研究著。</p><p> 感興趣區(qū)域是最能引起用戶興趣、最能表現(xiàn)圖像有價(jià)值內(nèi)容的區(qū)域,因此這項(xiàng)檢索技術(shù)中,如何正確提取感興趣區(qū)域,變得尤其重要。感興趣區(qū)域的提取方法由視
6、覺特征的提取和圖像分割兩個(gè)部分組成。視覺特征的提取是根據(jù)人類的視覺注意從圖像中提取特征量。圖像分割則根據(jù)視覺特征,從原圖中提取感興趣區(qū)域。</p><p> 本文對(duì)目前主流的基于感興趣區(qū)域的圖像搜索技術(shù)中提及的感興趣區(qū)域提取算法進(jìn)行了全面的綜述后,對(duì)提取感興趣區(qū)域的算法進(jìn)行了新的研究與實(shí)踐。</p><p> 關(guān)鍵詞:感興趣區(qū)域;視覺注意;圖像分割</p><p&g
7、t;<b> Abstract</b></p><p> As the advent of the information society, Multimedia and Communication technologies have developed. Everyone contact with image information more frequently. Every day
8、, a mass of image information was produced and flowed though the Internet. Therefore, how to manage and search for these enormous information efficiently has become a focus all around the world.</p><p> By
9、 far, the traditional information search technique which is based on keywords could not meet the current need, because it can not search according to characteristics of the images. Therefore, image search technique based
10、 on contents has become a hot topic. What's more, search technique based on region of interest (ROI) is one important branch, and one of the latest evolving forms. It meets the user's objective better as it's
11、 proceeded according to the most valuable and important characteristic</p><p> ROI is the region that users are most interested in and presents the value of the image, therefore, how to extracts the ROI cor
12、rectly is very important. The method of extracting ROI is made up of two parts. The extracting of visual characteristic gets characteristic value based on human sight. Meanwhile, image segmentation extracts ROI from sour
13、ce based on visual characteristic. </p><p> After summarizing the extracting algorithm which is referred in the mainstream of image search technique based on interested region, this paper is focused on rese
14、arching and practicing on the new algorithm of extracting interested region.</p><p> Keywords: region of interest; visual attention; image segmentation</p><p><b> 目錄</b></p>
15、<p><b> 第一章 緒論1</b></p><p> 1.1 選題背景和研究意義1</p><p> 1.2 國內(nèi)外研究現(xiàn)狀1</p><p> 1.3 本文的主要工作和論文結(jié)構(gòu)3</p><p> 第二章 背景知識(shí)4</p><p> 2.1 圖像在計(jì)算機(jī)
16、中的表示4</p><p> 2.2 高斯低通濾波器4</p><p> 2.3 高斯高通濾波器5</p><p> 2.4 中值濾波器7</p><p> 2.5 高斯圖像金字塔8</p><p> 2.6 本章小結(jié)9</p><p> 第三章 圖像感興趣區(qū)域提取方法
17、10</p><p> 3.1圖像分割算法10</p><p> 3.1.1 邊緣檢測(cè)法10</p><p> 3.1.2 區(qū)域生長法11</p><p> 3.2基于用戶交互的提取方法11</p><p> 3.3基于視覺注意的提取方法12</p><p> 3.3.1
18、視覺注意12</p><p> 3.3.2 顯著圖概念13</p><p> 3.3.3 顯著度圖的生成13</p><p> 3.3.4 根據(jù)區(qū)域生長法提取圖像區(qū)域15</p><p> 3.4 本章小結(jié)16</p><p> 第四章 圖像感興趣區(qū)域提取軟件系統(tǒng)的實(shí)現(xiàn)17</p>
19、<p> 4.1系統(tǒng)結(jié)構(gòu)17</p><p> 4.2算法實(shí)現(xiàn)18</p><p> 4.3界面實(shí)現(xiàn)19</p><p> 4.3.1縮略圖瀏覽窗口20</p><p> 4.3.2詳細(xì)圖像瀏覽窗口23</p><p> 4.3.3控制窗口24</p><p>
20、 4.3.4主框架窗口25</p><p> 4.3.5主框架窗口分隔條26</p><p> 4.3.6 程序?qū)嵗?6</p><p> 4.4 最終效果展示26</p><p> 4.5 本章小結(jié)27</p><p><b> 第五章 總結(jié)28</b></p&g
21、t;<p><b> 致謝29</b></p><p><b> 參考文獻(xiàn)30</b></p><p><b> Contents </b></p><p> Chapter1 Introduction1</p><p> 1.1 Research
22、 Topics’ Background and Significance1</p><p> 1.2 The Status Quo at Home and Abroad1</p><p> 1.3 The main work and contents of this paper3</p><p> Chapter2 Background4</p&
23、gt;<p> 2.1 The expression of image in computer4</p><p> 2.2 Gaussian low-pass filter4</p><p> 2.3 Gaussian high-pass filter5</p><p> 2.4 Median Filter7</p>&l
24、t;p> 2.5 Gaussian Pyramid8</p><p> 2.6 Chapter Summary9</p><p> Chapter3 The method of extracting ROI10</p><p> 3.1 Algorithem of image segmentation10</p><p>
25、; 3.1.1 Edge detection method10</p><p> 3.1.2 Region growing method11</p><p> 3.2 The extracting method based on user interaction11</p><p> 3.3 The extracting method visual a
26、ttention12</p><p> 3.3.1 Visual attention12</p><p> 3.3.2 The concept of saliency map13</p><p> 3.3.3 The generation of saliency map13</p><p> 3.3.4 Extract ima
27、ge region based on Region growing method15</p><p> 3.4 Chapter Summary16</p><p> Chapter4 The implementation of system on extracting ROI of image17</p><p> 4.1 Structure of ap
28、plication17</p><p> 4.2 The implementation of algorithem18</p><p> 4.3 The implementation of user interface19</p><p> 4.3.1 Preview window20</p><p> 4.3.2 Detai
29、led image window23</p><p> 4.3.3 Control window24</p><p> 4.3.4 Mainframe window25</p><p> 4.3.5 Seperator of Mainframe window26</p><p> 4.3.6 Instance of appli
30、cation26</p><p> 4.4 The final effect of display26</p><p> 4.5 Chapter Summary27</p><p> Chapter5 Summary28</p><p> Acknowledgements29</p><p> Re
31、ferences30</p><p><b> 第一章 緒論</b></p><p> 1.1選題背景和研究意義</p><p> 隨著信息化社會(huì)的到來,多媒體技術(shù)、網(wǎng)絡(luò)技術(shù)的發(fā)展,人們?cè)絹碓蕉嗟慕佑|到圖像信息。每天都有海量的圖像信息不斷產(chǎn)生?,F(xiàn)在全人類每年會(huì)產(chǎn)生10億~20億GB的新信息,而這些信息中有20%以上為圖像信息。有人估計(jì)世
32、界上每年產(chǎn)生的新圖像會(huì)達(dá)到800億幅。</p><p> 美國加州某醫(yī)院多年前已將醫(yī)學(xué)X光圖片數(shù)字化。而每張圖片需要8MB的空間來存儲(chǔ)。考慮每天需要做1000張X光片,而一般X光片需要保存7年,這樣一來每年這類圖像數(shù)據(jù)的數(shù)量都將在10^13B的量級(jí)。</p><p> 視覺數(shù)據(jù)的爆炸式增長使得圖像的管理和檢索成為關(guān)鍵問題。如何快速有效地尋找感興趣的相關(guān)信息已變得日趨困難,所以,迫切需要
33、對(duì)海量數(shù)據(jù)實(shí)時(shí)有效管理。傳統(tǒng)的方法是通過關(guān)鍵字的方法,將每一幅圖像都和幾個(gè)關(guān)鍵字想關(guān)聯(lián),通過關(guān)鍵字將圖像分類。但是關(guān)鍵字方式已經(jīng)不能滿足圖像信息飛速發(fā)展的需求,不足以對(duì)這些龐大的圖像信息進(jìn)行全面合理的描述。</p><p> 因此,一種嶄新的圖像檢索技術(shù)——基于內(nèi)容的圖像檢索技術(shù)(Content-Based Image Retrieval, 簡稱CBIR)出現(xiàn)了。這種技術(shù)更能體現(xiàn)出用戶檢索的目的,因此,在信息日
34、益膨脹的情況下,研究這項(xiàng)技術(shù)意義重大。</p><p> 1.2國內(nèi)外研究現(xiàn)狀</p><p> 從90年代基于內(nèi)容的圖像檢索技術(shù)興起至今。CBIR已經(jīng)逐漸成為一個(gè)非?;钴S的研究領(lǐng)域,國內(nèi)外多個(gè)研究機(jī)構(gòu)都在積極充實(shí)這項(xiàng)工作地研究,并取得了一系列令人矚目的成果。比較有代表性的有,國外的BIC系統(tǒng)、Photo book系統(tǒng)、Netra系統(tǒng)、chabot系統(tǒng)、VisualSEEK系統(tǒng)、MAR
35、S系統(tǒng)、惡化Viage圖像搜索引擎等等。國內(nèi)有浙江大學(xué)的基于顏色的檢索系統(tǒng)Photo Navigator、基于形狀的檢索系統(tǒng)Photo Engine、基于內(nèi)容的多媒體檢索系統(tǒng)WebscopCBR、國防科技大學(xué)的MIRC、中國科技學(xué)院計(jì)算機(jī)技術(shù)研究所開發(fā)研制的MIRES等。這些系統(tǒng)的框架和查詢的處理過程很相似,只是采用的特征描述和搜索方法各有特色,性能也有差異,有的已經(jīng)達(dá)到了可以使用的程度,但總的來還不成熟,需要進(jìn)一步的研究來逐漸完善。&
36、lt;/p><p> 目前基于內(nèi)容的圖像檢索有如下幾種技術(shù):</p><p> (1)基于顏色特征的圖像檢索。為提取圖像顏色特征,首先應(yīng)將圖像映射到一個(gè)顏色空間。最常用的顏色空間是RGB空間,然而RGB空間結(jié)構(gòu)不符合人們對(duì)顏色相似性的主觀判斷,因此有人提出了其它顏色空間的概念,如HSV、Luv和Lab空間等。圖像顏色特征提取的一個(gè)有代表性的方法是顏色直方圖,其中HSV空間是直方圖最常用的顏
37、色空間。圖像顏色的統(tǒng)計(jì)直方圖描述了每種色彩在一幅圖像中所占的比例,但是當(dāng)圖像中的顏色特征并不能取遍所有可取值時(shí),統(tǒng)計(jì)直方圖中會(huì)出現(xiàn)一些零值,對(duì)匹配算法的正確性造成干擾。一個(gè)解決辦法就是采用累加直方圖。累加直方圖能減少統(tǒng)計(jì)直方圖中的零值數(shù)目,從而使兩種顏色在特征軸上的距離與它們的相似度成正比。累加直方圖要求信號(hào)本身在特征軸上距離小的兩點(diǎn)要比距離大的兩點(diǎn)更相似,這個(gè)特性對(duì)于顏色簡單、顏色數(shù)目少,從而色度信號(hào)相關(guān)性質(zhì)較簡單的合成圖像來說更容易
38、滿足,而對(duì)色彩較復(fù)雜的自然圖像,一般不適用累加直方圖法。由于人眼對(duì)色度的分辨能力是有限的,因而可認(rèn)為一幅圖像的色度分量在其分布軸上的局部區(qū)間內(nèi)仍滿足累加直方圖有效的條件。因此,可把色度沿分布軸分成若干局部區(qū)間,在各區(qū)間內(nèi)分布應(yīng)用累加直方圖法,這種方</p><p> ?。?)基于紋理特征的圖像檢索。紋理目前尚無統(tǒng)一的定義。John R.Smith等認(rèn)為紋理是指圖像中不依賴于某種顏色或亮度的具有同質(zhì)性的視覺模式,是
39、所有物體表面共有的內(nèi)在特性。Robert M.Haralick等認(rèn)為紋理特征包含了物體表面結(jié)構(gòu)組織排列的重要信息以及它們與周圍環(huán)境的聯(lián)系。圖像紋理的描述模型可分為基于空間性質(zhì)、基于頻域性質(zhì)和基于結(jié)構(gòu)感知性質(zhì)的模型,其中基于空間性質(zhì)的紋理模型包括自相關(guān)函數(shù)、共生矩陣、隨機(jī)分形和隨機(jī)場(chǎng)模型;基于頻域性質(zhì)的紋理模型包括功率譜和小波變換模型;基于結(jié)構(gòu)感知性質(zhì)的紋理模型包括紋理基元法和Tamura紋理特征。基于內(nèi)容的圖像檢索中常用的紋理特征主要包
40、括Tamura紋理特征、自回歸紋理模型、共生矩陣和小波變換等。</p><p> ?。?)基于形狀特征的圖像檢索。形狀的描述方法有很多,一般可分為特征法、變形法和關(guān)系法三種。其中特征法借助一組特征來描述形狀,有些特征描述目標(biāo)形狀的全局特性,如面積、伸長度、主軸方向等,有些特征則描述目標(biāo)邊界的局部特性,如角點(diǎn)、特征點(diǎn)等。這樣某種形狀可用形狀特征空間的點(diǎn),也就是一個(gè)向量來表示。根據(jù)形狀特征表達(dá)時(shí)利用目標(biāo)區(qū)域內(nèi)的象素集
41、合或者利用區(qū)域邊界上的象素集合,特征表達(dá)又可分為內(nèi)部參數(shù)法和外部參數(shù)法。變形法利用把一種形狀轉(zhuǎn)換為另一種形狀所需的投入來描述形狀,這種方法能即時(shí)進(jìn)行形狀差別的估算,但不支持索引。關(guān)系法把形狀分解為一組給定的組元,每個(gè)組元可用某些特征描述,而對(duì)整體的描述既包括對(duì)各個(gè)組元的描述,也包括它們之間聯(lián)系的描述。該方法更多地用于對(duì)復(fù)雜形狀的識(shí)別和描述。</p><p> (4)基于空間特征的圖像檢索。顏色、紋理和形狀等多種
42、特征反映的都是圖像的整體特征,而無法體現(xiàn)圖像中所包含的對(duì)象或物體。事實(shí)上,圖像中對(duì)象所在的位置和對(duì)象之間的空間關(guān)系同樣是圖像檢索中非常重要的特征?;诳臻g關(guān)系特征的圖像檢索可以分為兩類,一類是基于圖像分割的方法,首先對(duì)圖像進(jìn)行自動(dòng)分割,劃分出其中所含的對(duì)象或顏色區(qū)域,然后根據(jù)這些區(qū)域?qū)D像索引。</p><p> 1.3本文的主要工作和論文結(jié)構(gòu)</p><p> 前面的分析已經(jīng)提到,基
43、于區(qū)域的圖像檢索方法是目前基于內(nèi)容的圖像檢索的研究熱點(diǎn)之一,相對(duì)全局圖像特征,使用區(qū)域特征可以對(duì)圖像進(jìn)行更進(jìn)一步的理解和分析,也更容易獲取圖像的語義信息。但是由于圖像分割技術(shù)的不成熟,無法準(zhǔn)確的提取到圖像中的物體,而且用戶可能對(duì)提取的區(qū)域不感興趣,這些無關(guān)區(qū)域不但增減了圖像匹配算法的復(fù)雜度,而且由于不能體現(xiàn)用戶的檢索目的而降低檢索準(zhǔn)確率。</p><p> 基于用戶感興趣區(qū)域的圖像檢索方法體現(xiàn)了用戶的檢索目的,
44、區(qū)分了區(qū)域的重要程度,突出了圖像的主要內(nèi)容,消除了不相關(guān)區(qū)域的干擾。</p><p> 鑒于以上的分析,本文把研究重點(diǎn)放在基于感興趣區(qū)域的搜索技術(shù)中的,提取用戶感興趣區(qū)域的方法上。</p><p> 第二章,介紹了該項(xiàng)技術(shù)中所用到的一些關(guān)鍵性技術(shù)。</p><p> 第三章,仔細(xì)闡述了現(xiàn)有的幾種感興趣區(qū)域的提取方法。</p><p>
45、 第四章,描述了圖像感興趣區(qū)域提取軟件系統(tǒng)的具體實(shí)現(xiàn)。</p><p><b> 第二章 背景知識(shí)</b></p><p> 本章主要對(duì)圖像感興趣區(qū)域提取技術(shù)中所涉及到的一些關(guān)鍵性技術(shù)進(jìn)行了簡單的介紹。</p><p> 2.1 圖像在計(jì)算機(jī)中的表示</p><p> 圖像資源可以用f(x,y)二維函數(shù)形式表示,
46、在特定的坐標(biāo)(x,y)處,f的值或幅度是一個(gè)正的標(biāo)量[1]。根據(jù)這種特點(diǎn)計(jì)算機(jī)中的圖像可以用與f(x,y)有一一對(duì)應(yīng)關(guān)系的一段內(nèi)存空間來表示。</p><p> 在Windows為平臺(tái)的系統(tǒng)中,一個(gè)數(shù)字圖像是經(jīng)常用位圖的形式來保存。微軟的MFC類庫提供了一個(gè)專門的類——CBitmap來操作載入的位圖資源。CBitmap類很好的提供了對(duì)位圖的常規(guī)操作。但是在對(duì)整個(gè)圖像進(jìn)行一些圖像增強(qiáng)算法的時(shí)候,CBitmap就顯
47、得有些力不從心了。因?yàn)樵贑Bitmap對(duì)修改圖像數(shù)據(jù)的操作支持的很有限,而且CBitmap中的圖像數(shù)據(jù)并不是整齊排列的,代表圖像每一行的內(nèi)存數(shù)據(jù)區(qū)域大小并不與圖像的長度成正比,Cbitmap對(duì)象中代表圖像中一行數(shù)據(jù)的內(nèi)存大小需要被4整除[2],因此內(nèi)存空間中會(huì)出現(xiàn)斷點(diǎn)。這樣對(duì)使用尋址操作來得到圖像數(shù)據(jù)時(shí)帶來了很大的不便。</p><p> 因此在實(shí)現(xiàn)關(guān)于圖像算法的時(shí)候需要一種對(duì)大規(guī)模操作支持的,對(duì)外開放內(nèi)存空間
48、的新的數(shù)據(jù)結(jié)構(gòu)。</p><p> 2.2 高斯低通濾波器</p><p> 高斯濾波器是一類根據(jù)高斯函數(shù)的形狀來選擇權(quán)值的線性平滑濾波器。高斯平滑濾波器,也就是高斯低通濾波器,服從正態(tài)分布,對(duì)于處理圖片平滑、去噪聲非常有效[3]。其中,高斯分布參數(shù)Sigma決定了高斯函數(shù)的寬度。 對(duì)于圖像處理來說,常用二維零均值離散高斯函數(shù)作平滑濾波器。二維高斯函數(shù)具有旋轉(zhuǎn)對(duì)稱性,即濾波器在各個(gè)方向
49、上的平滑程度是相同的。一般來說,一幅圖像的邊緣方向是事先不知道的,因此,在濾波前是無法確定一個(gè)方向上比另一方向上需要更多的平滑。旋轉(zhuǎn)對(duì)稱性意味著高斯平滑濾波器在后續(xù)邊緣檢測(cè)中不會(huì)偏向任意方向。高斯函數(shù)是單值函數(shù),這表明,高斯濾波器用像素鄰域的加權(quán)均值來代替該點(diǎn)的像素值,而每一鄰域像素點(diǎn)權(quán)值是隨該點(diǎn)與中心點(diǎn)的距離單調(diào)增減的。這一性質(zhì)是很重要的,因?yàn)檫吘壥且环N圖像局部特征,如果平滑運(yùn)算對(duì)離算子中心很遠(yuǎn)的像素點(diǎn)仍然有很大作用,則平滑運(yùn)算會(huì)使圖
50、像失真。</p><p> …………………………………………………………………(2-1)</p><p> 圖2-1是利用高斯低通濾波器進(jìn)行濾波后的圖和原圖的對(duì)比。從對(duì)比可以看出高斯低通濾波器在圖像處理中起了平滑圖像的作用。</p><p> 圖2-1:高斯低通濾波器處理前后圖像對(duì)比</p><p> 2.3高斯高通濾波器</p
51、><p> 高通濾波器是去掉信號(hào)中不必要的低頻成分,去掉低頻干擾的濾波器。高斯高通濾波器是以高斯平方差函數(shù)為濾波函數(shù)的濾波器。高斯平方差函數(shù)在圖像處理中使得圖像各個(gè)元素之間相互抑制或興奮。</p><p> …………………………………………(2-2)</p><p> 圖2-2展示了高斯平方差函數(shù)在x方向的函數(shù)曲線,可以看出離H軸的距離決定了函數(shù)值是否為負(fù)數(shù)或者是
52、正數(shù)。在圖像處理中利用掩膜進(jìn)行卷積時(shí)函數(shù)值是否為負(fù)決定了是否對(duì)掩模中心點(diǎn)起到了抑制作用。所以,離掩模中心點(diǎn)距離越遠(yuǎn),對(duì)中心點(diǎn)的抑制作用越小,而越近則起到的抑制作用越大。在圖像中,中心點(diǎn)周圍的像素點(diǎn)的強(qiáng)度越大,則進(jìn)行卷積時(shí)對(duì)中心點(diǎn)像素的抑制作用就越大,所以如果中心點(diǎn)不是比周圍的像素點(diǎn)強(qiáng)度大的話很難在競爭中取得勝利而被削弱。這樣,只有強(qiáng)度足夠大的像素點(diǎn)才可能生存下來。對(duì)我們的圖像處理中起到了銳化的作用。</p><p&g
53、t; 圖2-2:高斯平方差函數(shù)曲線</p><p> 圖2-3是利用高斯高通濾波器進(jìn)行濾波后的圖和原圖的對(duì)比。從對(duì)比可以看出高斯低通濾波器銳化了圖像的顯著區(qū)域。</p><p> 圖2-3:高斯高通濾波器處理前后圖像對(duì)比</p><p><b> 2.4中值濾波器</b></p><p> 中值濾波器是統(tǒng)計(jì)濾波
54、器的一種。中值濾波器,將掩模中心點(diǎn)的值用掩模覆蓋的幾個(gè)像素點(diǎn)的中間值來替換掉。中值濾波器對(duì)有一定類型的隨機(jī)噪聲的圖像提供了去噪聲功能,而且,明顯比用小尺寸線性平滑濾波器處理后的模糊程度低[1]。當(dāng)一個(gè)3乘3臨域內(nèi)有一系列像素值(10,20,20,20,15,20,20,25,100),對(duì)這些值排序后為(10,15,20,20,20,20,20,25,100)。那么它們的中值就是20。這樣,中值濾波器的主要功能是使擁有不同灰度的點(diǎn)看起來更
55、接近于他的臨近值,消除圖像的噪聲。</p><p> 圖2-4是中值濾波器進(jìn)行濾波后的圖和原圖的對(duì)比。從這里,可以看出中值濾波器對(duì)圖像的去噪聲能力[1]。</p><p> 圖2-4:中值濾波器處理前后圖像對(duì)比</p><p> 2.5高斯圖像金字塔</p><p> 圖像金字塔是多分辨率圖像處理技術(shù)的一種,多分辨率技術(shù)是指對(duì)圖像采用
56、多尺寸的表達(dá),并在不同尺寸下分別進(jìn)行處理。在很多情況下,圖像中某種尺度下不容易看出或者獲取的特性,在另外的尺寸下很容易看出來或檢測(cè)到。所以利用多尺度,經(jīng)??梢愿行У靥崛D像特征,獲取圖像有用的內(nèi)容。圖像金字塔是一系列金字塔形狀排列的,分辨率逐步降低的圖像集合。</p><p> 如圖2-5所示,金字塔的底部是待處理圖像的高分辨率表示,而頂部是低分辨率的。當(dāng)向金字塔的上層移動(dòng)時(shí),尺寸和分辨率就降低?;A(chǔ)級(jí)J的尺
57、寸是2^J乘2^J,中間級(jí)j的尺寸是2^j乘2^j,其中(0≤j≤J)[1]。</p><p> 圖2-5:圖像金字塔</p><p> 高斯金字塔的形成過程如下圖,先對(duì)金字塔的第j層進(jìn)行高斯低通濾波器濾波。然后對(duì)得到的圖像進(jìn)行以2為步長進(jìn)行抽樣得到第j-1層的圖像,以上步驟迭代直到最后一層圖像形成,其中(1≤j≤J)。</p><p> 圖2-6:高斯金字塔
58、形成過程</p><p><b> 2.6 本章小結(jié)</b></p><p> 本章對(duì)圖像感興趣區(qū)域提取技術(shù)中用到的關(guān)鍵性技術(shù)進(jìn)行了簡單的介紹。圖像在計(jì)算機(jī)中的表示是所有關(guān)于計(jì)算機(jī)的圖像處理系統(tǒng)的基礎(chǔ)。高斯低通濾波器,高斯高通濾波器,均值濾波器是圖像處理技術(shù)中常用的技術(shù)。高斯金字塔也是圖像處理中,分析圖像特點(diǎn)的重要技術(shù)。</p><p>
59、 第三章 圖像感興趣區(qū)域提取方法</p><p> 本章對(duì)目前國內(nèi)外比較流行的圖片分割算法和感興趣區(qū)域提取算法進(jìn)行了介紹。</p><p><b> 3.1圖像分割算法</b></p><p> 在提取圖像的感興趣區(qū)域時(shí),需要利用適當(dāng)?shù)膱D像分割算法,執(zhí)行圖像分割,最終得到感興趣區(qū)域。下面介紹兩種比較常用的圖像分割算法。</p>
60、;<p> 3.1.1 邊緣檢測(cè)法</p><p> 邊緣檢測(cè)是所有基于邊界分割算法的基礎(chǔ)。邊緣是灰度不連續(xù)的結(jié)果,兩個(gè)具有不同灰度值的相鄰區(qū)域之間總存在邊緣。用一階導(dǎo)數(shù)的局部最大值或二階導(dǎo)數(shù)的過零點(diǎn)可以用來方便地檢測(cè)邊緣。梯度算子是一階導(dǎo)數(shù)算子。對(duì)一個(gè)連續(xù)函數(shù)f(x,y),它在(x,y)位置的梯度g可表示為一個(gè)矢量[4]:</p><p> …………………………………
61、…………(3-1)</p><p> 它的模(幅度)和方向角分別為:</p><p> ………………………………………………(3-2)</p><p> 在對(duì)象分割時(shí),如果對(duì)象的部分邊界紋理與相鄰部分背景紋理相近或相同,則在對(duì)象區(qū)域提取時(shí),其邊界線會(huì)出現(xiàn)斷點(diǎn)、不連續(xù)、分段連續(xù)等情況。在圖像中有噪聲干擾時(shí),也會(huì)使輪廓線斷開,所以在對(duì)象區(qū)域提取分割時(shí),未得到閉合的
62、邊界以使對(duì)象區(qū)域完整的分開,應(yīng)經(jīng)歷一個(gè)使不連續(xù)邊界閉合的過程,即邊界閉合,在此利用基于鄰域梯度的邊界閉合技術(shù)。一般,圖像中的對(duì)象應(yīng)具有輪廓或邊界的,勾畫輪廓使用梯度計(jì)算的方法,即求取輪廓各點(diǎn)處梯度的大小和方向。要把斷續(xù)的邊界點(diǎn)連接起來,則需要對(duì)斷開處兩端點(diǎn)梯度的大小和方向檢查其是否相近,如果相近即將該處連接,是否相近,使用閾值的方法予以判斷,如果斷點(diǎn)鄰域處梯度幅度的差在某鄰域內(nèi),梯度方向的差也在某鄰域內(nèi),即認(rèn)為其相近可以使其閉合連接。&
63、lt;/p><p> 3.1.2 區(qū)域生長法</p><p> 區(qū)域生長法首先對(duì)每個(gè)要分割的區(qū)域找一個(gè)種子像素作為生長的起點(diǎn),然后將種子像素周圍的鄰域中與種子像素有相同或相似性質(zhì)的像素合并到種子像素所在的區(qū)域中,像素之間的相似性準(zhǔn)確預(yù)先確定。將這些新像素當(dāng)作新的種子像素繼續(xù)進(jìn)行上面的過程,直到?jīng)]有滿足條件的像素被包含進(jìn)來[4]。</p><p> 區(qū)域生長法有以下
64、3個(gè)要素:</p><p> ?。?)選擇或確定一組能代表目標(biāo)區(qū)域的種子像素。</p><p> ?。?)確定在生長過程中能將相鄰的像素包含進(jìn)來。</p><p> ?。?)制定使生長過程停止的條件或準(zhǔn)則。</p><p> 種子像素的選取一般根據(jù)具體問題的特點(diǎn)來確定。如果對(duì)具體問題有經(jīng)驗(yàn)知識(shí),可人為制定種子像素的特性。若沒有先驗(yàn)知識(shí),可借
65、助生長準(zhǔn)則對(duì)每個(gè)像素進(jìn)行相應(yīng)的計(jì)算,如果計(jì)算結(jié)果呈現(xiàn)聚類情況,則選擇聚類重心的像素作為種子點(diǎn)。</p><p> 區(qū)域生長的關(guān)鍵是選擇合適的生長或相似性準(zhǔn)則,大部分區(qū)域生長準(zhǔn)則使用圖像的局部性質(zhì)。生長準(zhǔn)則的選取不僅依賴于問題本身,也和所利用圖像數(shù)據(jù)的種類有關(guān)。一般生長過程進(jìn)行到?jīng)]有滿足生長準(zhǔn)則的像素時(shí)就停止生長,但常用的基于灰度、紋理的準(zhǔn)則大都基于圖像的局部屬性,并沒有考慮生長的“歷史”,為增加區(qū)域生長的能力需
66、要考慮一些與尺寸、形狀等圖像的全局性質(zhì)有關(guān)的準(zhǔn)則。</p><p> 3.2基于用戶交互的提取方法</p><p> 在理想的情況下提取圖像中的感興趣區(qū)域應(yīng)該以用戶的評(píng)價(jià)為標(biāo)準(zhǔn),選擇用戶感興趣的區(qū)域作為圖像的感興趣區(qū)域。而且用戶是圖像的最終使用者,不同的用戶有不同的背景和要求,所以最省事,最靈活的方法是把感興趣區(qū)域的定義交給用戶來完成[5]。通過人機(jī)交互由用戶選擇圖像中的若干區(qū)域作為感
67、興趣區(qū)域。這樣的方法以用戶為中心,能充分發(fā)揮用戶在檢索過程中的作用,準(zhǔn)確捕獲用戶檢索意圖,有簡單高效的優(yōu)點(diǎn)。這種方法適合于衛(wèi)星遙感圖像,醫(yī)學(xué)圖像等內(nèi)容比較單一的圖像庫中。在一定程度上基于用戶交互的感興趣區(qū)域選取獲得了成功。 但是,這種方法中,區(qū)域搜索和特征提取需要實(shí)時(shí)完成,所以檢索速度較慢。最好的方法是能讓系統(tǒng)自動(dòng)地完成感興趣區(qū)域的提取和索引,并有較高的速度,所以感興趣區(qū)域的自動(dòng)提取方法成為研究的重點(diǎn)。</p><p
68、> 3.3基于視覺注意的提取方法</p><p><b> 3.3.1視覺注意</b></p><p> 視覺注意(Visual attention)是人類視覺(Human vision)研究領(lǐng)域的重要課題,通俗地講,視覺注意就是研究人在觀看圖像時(shí),到底對(duì)什么更加注意。從本質(zhì)上講,視覺注意是屬于神經(jīng)生物學(xué)范疇的概念,它意味著人具有精神或觀察能量能夠集中的技
69、能。</p><p> 研究視覺注意機(jī)制的一個(gè)重要實(shí)驗(yàn)被稱為眼動(dòng)實(shí)驗(yàn)(Eye movement),即:通過大量實(shí)驗(yàn)樣本(人)在觀察圖像時(shí)眼睛的轉(zhuǎn)動(dòng)頻率和視點(diǎn)位置的移動(dòng)歸納出若干能夠影響視覺注意的低層因素和高層因素。</p><p><b> 低層視覺特征有:</b></p><p> ?。?)對(duì)比度:人往往會(huì)更加關(guān)注圖像中顏色或亮度反差較大
70、的地方。</p><p> (2)尺寸:尺寸大的物體更能吸引人的注意;</p><p> (3)形狀:細(xì)長條的物體更能引起人的注意;</p><p> ?。?)顏色:人類視覺對(duì)某些顏色較為敏感如紅色;</p><p> ?。?)運(yùn)動(dòng):運(yùn)動(dòng)的區(qū)域能夠強(qiáng)烈的吸引人的注意;</p><p><b> 高層因素
71、有:</b></p><p> ?。?)位置:人往往對(duì)位于圖像中心的區(qū)域更加關(guān)注;</p><p> ?。?)前景和背景:人們往往更關(guān)心圖像中的前景區(qū)域;</p><p> ?。?)人:圖像中的人或者人臉手等都更加吸引觀察者的注意;</p><p> ?。?)觀察者自身的素質(zhì):觀察者自身的職業(yè)、受教育情況、性別等都會(huì)影響他們注意機(jī)
72、制[5]。</p><p> 實(shí)驗(yàn)表明,人在觀看圖畫時(shí)大部分注視點(diǎn)都集中在被評(píng)為信息量大的區(qū)域上,如觀看人臉時(shí)注視點(diǎn)相對(duì)集中在眼睛和嘴角上,Yarbus 認(rèn)為人的眼睛和嘴是臉部表情功能的部位,信息量大,所以被注視的次數(shù)較多。Noton和Stark讓被試觀察圖像并記錄他們的眼動(dòng)軌跡。他們發(fā)現(xiàn),第一次注視一幅圖像與過一段時(shí)間再看這幅圖像時(shí)眼睛的觀察順序大致相同。眼睛按一個(gè)固定的路線間歇地、重復(fù)地去掃描,從而形成了一
73、個(gè)系列掃描路線。</p><p> 3.3.2 顯著圖概念</p><p><b> 顯著度圖</b></p><p> Itti等研究者提出基于顯著度的注意計(jì)算模型,較好地模擬了人觀察圖像時(shí)注視點(diǎn)的選取過程?;舅枷胧前严袼卦陬伾?、亮度、方向等方面與背景的對(duì)比定義為該點(diǎn)的顯著值(Saliency),對(duì)比越強(qiáng),該點(diǎn)的顯著值就越大,所有點(diǎn)的
74、顯著值構(gòu)成一張顯著圖。這里顯著圖是一幅表明圖像各像素點(diǎn)顯著性的灰度圖像,越亮表明該點(diǎn)的顯著度越大。顯著圖方法的基本思想是把象素在顏色、亮度、方向等方面與背景的對(duì)比定義為該點(diǎn)的顯著值(Saliency),所有點(diǎn)的顯著值構(gòu)成一張顯著圖(Saliency Map)。顯著值的大小表示各點(diǎn)吸引注意的強(qiáng)弱程度[6]。</p><p> 顯著圖方法理論依據(jù)是視覺系統(tǒng)中感受野,側(cè)抑制網(wǎng)絡(luò)的信息處理方式。感受(Receptive
75、 Field)是指視網(wǎng)膜上的一定區(qū)域或范圍,當(dāng)它們受到刺激時(shí)能激活神經(jīng)細(xì)胞的活動(dòng)。通過實(shí)驗(yàn)發(fā)現(xiàn)感受野使視神經(jīng)細(xì)胞對(duì)信號(hào)對(duì)比度的敏感程度要大于對(duì)信號(hào)強(qiáng)弱的敏感程度。并且感受野具有鉤邊效應(yīng)能夠敏銳地監(jiān)測(cè)邊緣。視覺系統(tǒng)的外膝體細(xì)胞和初級(jí)視皮層中狹長的感受野使得皮層細(xì)胞對(duì)刺激的方向敏感。側(cè)抑制是視網(wǎng)膜神經(jīng)細(xì)胞之間存在的一種競爭現(xiàn)象,當(dāng)臨近的兩個(gè)視神經(jīng)感受器同時(shí)受到光照時(shí),其中每個(gè)感受器單元的脈沖發(fā)放頻率都要比它們單獨(dú)受到刺激時(shí)的發(fā)放頻率低。顯著
76、度圖很好地用數(shù)學(xué)模型模擬了視神經(jīng)系統(tǒng)這種信息處理方式[5]。</p><p> 3.3.3顯著度圖的生成</p><p> 顯著圖的生成有以下兩個(gè)步驟:</p><p> ?。?)視覺特征的提取 </p><p> 根據(jù)早期視覺中視皮層所提取的特征,把輸入圖像分解為亮度、紅色、藍(lán)色、黃色和方向等一系列“通道”。為了表示圖像中不同大小的物
77、體,特征提取在不同的尺度上進(jìn)行。先把輸入圖像表示為 9 層的高斯金字塔。其中第 0 層是輸入圖像,1到 8 層分別是用 5x5 的高斯濾波器對(duì)輸入圖像進(jìn)行濾波和采樣形成的,大小為輸入圖像的 1/2 到 1/256。然后對(duì)金字塔的每一層分別提取各種視覺特征:亮度、紅色、藍(lán)色、黃色、綠色、方向,形成亮度金字塔、色度金字塔、和方向金字塔。</p><p> 這樣就把特征表示成為9個(gè)特征金字塔:亮度1個(gè),色度 4 個(gè)(
78、分別是紅色、藍(lán)色、黃色、綠色),方向4個(gè)(分別是4個(gè)不同的方向)。上述四個(gè)色度特征對(duì)黑色和白色的響應(yīng)為零,對(duì)各自所對(duì)應(yīng)的飽和單色(紅色、藍(lán)色、黃色、綠色)有最大的響應(yīng)。 </p><p> 受視網(wǎng)膜中感受野信息處理方式的影響,吸引視覺注意的是特征的對(duì)比而不是特征的絕對(duì)值。為了模擬感受野的中心一外周拮抗的結(jié)構(gòu),對(duì)各種特征分別在特征金字塔的不同尺度間作差。感受野的中心對(duì)應(yīng)于尺度c的特征圖的一個(gè)點(diǎn)(c ∈{2 ,3
79、 ,4}) 感受野的外周對(duì)應(yīng)于尺度s 的特征圖中的相應(yīng)點(diǎn)( s = c + δ, δ∈{3 ,4}) 。由于不同尺度的特征圖大小不同,在作差時(shí)需要把大尺度s 下的特征圖插值,得到和小尺度c 下的特征圖樣大小的圖像。然后逐點(diǎn)作差。得到的是中心( 尺度c) 和外周 ( 尺度c +δ) 的特征的對(duì)比。</p><p> 由于中心尺度c 和外周尺度s之間有3x2=6種組合(2-5, 2-6,3-6,3-7,4-7,4-
80、8),所以上面的每個(gè)式子都可以得到6個(gè)特征圖,共42個(gè)不同尺度的特征圖,分別是6個(gè)亮度特征圖,12個(gè)顏色特征圖,24個(gè)方向特征圖[5]。</p><p><b> ?。?)顯著圖生成</b></p><p> 顯著圖的作用是用標(biāo)量描述圖像各點(diǎn)對(duì)注意的吸引程度,這樣注視點(diǎn)的選擇就轉(zhuǎn)換成在顯著圖中選取最大值的問題。先把每一個(gè)特征圖歸一化到區(qū)間[0 ,1] 以消除和特征相
81、關(guān)的幅度差別。為了消除干擾噪聲突出顯著物體,對(duì)每個(gè)特征圖M分別用二維高斯差函數(shù)進(jìn)行卷積運(yùn)算,并把卷積結(jié)果疊加回原特征圖,使同種特征以側(cè)抑制的方式在空間上競爭。這個(gè)過程描述為:</p><p> 圖3-1:圖像消除干擾操作流程</p><p> 由于高斯差函數(shù)較好地描述了了神經(jīng)元之間長程抑制、短程增強(qiáng)的關(guān)系,所以上述卷積運(yùn)算模擬了同種特征內(nèi)部在局部空間上的競爭。這種競爭的結(jié)果是少數(shù)幾個(gè)均
82、勻分布的勝者,而其余具有較大初始值的區(qū)域由于距離較近而相互抑制得到削弱,從而有利于快速地選擇最顯著的點(diǎn)。</p><p> 分別把每一類( 亮度、色度、方向) 歸一化后的特征圖在第4 級(jí)(δ=4 )相加,得到對(duì)應(yīng)于3 類特征的顯著圖[5]。</p><p> 圖3-2:Itti方法生成的顯著圖</p><p> 3.3.4 根據(jù)區(qū)域生長法提取圖像區(qū)域</
83、p><p> 區(qū)域生長是圖像分割中一種簡單而有效的方法,而且種子點(diǎn)的選取很容易結(jié)合一些高層語意,如果結(jié)合圖像的顯著度圖,對(duì)提取感興趣區(qū)域會(huì)非常有效。</p><p> 區(qū)域生長法可以根據(jù)顯著度圖和相對(duì)位置指示圖選取種子點(diǎn),由種子點(diǎn)開始根據(jù)象素點(diǎn)的顯著值和相對(duì)位置進(jìn)行區(qū)域生長,主要分為如下五個(gè)步驟:</p><p> (1)顏色量化:由于人類視覺對(duì)圖像中平滑區(qū)域顏色
84、的變化對(duì)比紋理區(qū)域顏色的變化更加敏感,因此,采用非均勻量化,對(duì)于紋理區(qū)域采用較為粗略的量化,而對(duì)平滑區(qū)域采用較為精細(xì)的量化。</p><p> (2)相對(duì)位置指示圖:象素點(diǎn)在圖像中的相對(duì)位置信息,即點(diǎn)是處于物體內(nèi)部還是靠近邊緣,對(duì)于種子區(qū)域的選取相當(dāng)重要。文獻(xiàn)介紹了一個(gè)算法根據(jù)圖像中局部區(qū)域內(nèi)的顏色分布來估計(jì)出象素的相對(duì)位置:</p><p> ?。?)感興趣物體種子區(qū)域的選取:在區(qū)域增
85、長技術(shù)中,種子點(diǎn)的選取至關(guān)重要。通常,種子點(diǎn)應(yīng)該是物體上直觀的和具有代表性的區(qū)域。對(duì)于感興趣的物體,種子點(diǎn)應(yīng)該既是圖像中的視覺注意程度較高的點(diǎn)同時(shí)其位置應(yīng)當(dāng)處于物體的內(nèi)部。因此,結(jié)合上面處理容易得到:種子點(diǎn)應(yīng)當(dāng)對(duì)應(yīng)最大的注意度和最小的相對(duì)位置。</p><p> ?。?)感興趣物體的區(qū)域生長:當(dāng)種子點(diǎn)確定后,區(qū)域就從種子點(diǎn)開始增長反復(fù)地將與區(qū)域內(nèi)的點(diǎn)相鄰的且滿足一定的相似性要求的象素點(diǎn)歸入?yún)^(qū)域。</p>
86、;<p> ?。?)合并處理:首先需要填充物體內(nèi)部的一些空洞,這里采用形態(tài)學(xué)中的閉運(yùn)算來完成。另外,相鄰且顏色分布類似的物體應(yīng)該合并。物體內(nèi)顏色分布簡單地采用量化后的顏色直方圖來刻畫,假設(shè)提取出的兩個(gè)感興趣物體a 和b,它們對(duì)應(yīng)的量化顏色直方圖矢量分別為V a 和Vb, 兩個(gè)直方圖的距離小于閾值,就合并它們。</p><p><b> 3.4 本章小結(jié)</b></p&g
87、t;<p> 本章對(duì)當(dāng)今流行的兩種圖像區(qū)域切割算法和感興趣提取算法進(jìn)行了介紹和分析。邊緣檢測(cè)算法是圖像分割算法中最為基礎(chǔ)的算法,而區(qū)域生長算法是圖像切割算法中最為典型的一種算法,通過各種形式的閾值可以演變出各種不同效果的算法。感興趣區(qū)域提取算法中用戶定義感興趣區(qū)域是最為簡單的辦法,而這種辦法通常存在效率低下的問題。基于視覺特征的提取方法則通過模擬人眼的對(duì)圖像的自然反應(yīng),自動(dòng)提取感應(yīng)度最高的區(qū)域,變成了當(dāng)今最為主流的算法之
88、一。</p><p> 第四章 一種新的圖像感興趣區(qū)域提取算法的實(shí)現(xiàn)</p><p> 本章主要對(duì)提取圖像感興趣區(qū)域算法進(jìn)行簡單的闡述之后,對(duì)軟件的整體框架以及實(shí)現(xiàn)細(xì)節(jié)進(jìn)行了闡述。</p><p><b> 4.1系統(tǒng)結(jié)構(gòu)</b></p><p> 感興趣區(qū)域提取程序采用了模塊化程序設(shè)計(jì)的理念,將程序的各個(gè)功能進(jìn)
89、行了模塊化。每一個(gè)模塊對(duì)應(yīng)一個(gè)相應(yīng)的功能,具有更好的可移植性,可擴(kuò)充性及可維護(hù)性。整個(gè)程序分算法和界面兩大部分。這樣使界面和算法的實(shí)現(xiàn)可以分開進(jìn)行,明確了小組分工,讓程序的修改變得容易。</p><p> 圖4-1為程序的總體結(jié)構(gòu)圖: </p><p> 圖4-1:感興趣區(qū)域提取軟件結(jié)構(gòu)圖</p><p> 控制窗口會(huì)對(duì)用戶的每一種操作進(jìn)行響應(yīng),根據(jù)不同種類的
90、操作,將消息發(fā)送到主框架中。主框架接收到消息之后調(diào)用算法模塊中相應(yīng)的算法。此時(shí)算法模塊中的函數(shù)將對(duì)載入的圖像數(shù)據(jù)進(jìn)行運(yùn)算,將結(jié)果保存在主框架中。得出的中間結(jié)果圖像的指針將被傳入縮略圖窗口中,由縮略圖窗口顯示。用戶在縮略圖窗口中選中某一個(gè)中間結(jié)果,縮略圖窗口將該圖像的指針傳入詳細(xì)圖像瀏覽窗口中,由詳細(xì)圖像瀏覽窗口顯示。</p><p> 值得一提的是算法和程序主體部分的分離,可以使是算法的可復(fù)用性加強(qiáng)。如果將算法
91、的參數(shù)接口標(biāo)準(zhǔn)化,則多種符合條件的數(shù)據(jù)結(jié)構(gòu)可以通過實(shí)現(xiàn)接口使用算法。就像C++STL中的容器算法。這使得算法徹底變成了一個(gè)工具。這也可以使算法插件化,需要一種算法的時(shí)候可以動(dòng)態(tài)的方式導(dǎo)進(jìn)程序中使用。以本程序來說也可以使用別的圖形處理的算法,需要的時(shí)候只需把算法部分導(dǎo)入,把實(shí)現(xiàn)了標(biāo)準(zhǔn)接口的數(shù)據(jù)結(jié)構(gòu)放入算法中即可,如此一來程序?qū)⒆兂梢环N測(cè)試某種圖形相關(guān)算法的測(cè)試平臺(tái),并非單一的感興趣區(qū)域提取程序。</p><p>&
92、lt;b> 4.2算法實(shí)現(xiàn)</b></p><p> 依據(jù)以上介紹的提取感興趣區(qū)域的算法以及通過實(shí)驗(yàn),得出了一種新的提取圖像感興趣區(qū)域的提取算法。因?yàn)檫@一部分并非本人的分工,以下簡單介紹算法的基本步驟。</p><p><b> 算法分八個(gè)步驟:</b></p><p> ?。?)形成高斯金字塔:輸入的原圖經(jīng)過高斯低通濾
93、波器濾波,以2為跨度取樣形成高斯金字塔。其目的是為了讓圖像在不同分辨率下,進(jìn)行更全面的分析與操作。</p><p> ?。?)形成亮度金字塔和色度金字塔:亮度金字塔是對(duì)上一步形成的高斯金字塔的每一層的圖像進(jìn)行彩色到灰度級(jí)的轉(zhuǎn)換的出的圖像金字塔,其金字塔層數(shù)與高斯金字塔的層數(shù)相同。</p><p> 色度金字塔是對(duì)高斯金字塔的每一層的圖像中進(jìn)行紅、綠、藍(lán)、黃四種色度的提取得出的四種金字塔。
94、</p><p> ?。?)亮度圖以及色度圖的相減:對(duì)一步形成的亮度金字塔,和各個(gè)色度金字塔中取出六種組合并相減得出六個(gè)圖像。其六個(gè)組合分別是(1,4),(2,5),(2,6),(3,6),(3,7)(4,7)。</p><p> ?。?)利用高斯函數(shù)進(jìn)行增強(qiáng):對(duì)上一步形成的每一張圖像,進(jìn)行高斯濾波而后將結(jié)果相加到那張圖,迭代若干次。</p><p> (5)在尺
95、度4上進(jìn)行相加:將上一步的出的六張被增強(qiáng)過的圖像在尺度4上進(jìn)行相加處理得出一張亮度圖。該圖像的大小與亮度金字塔中第四層的圖像大小相同。</p><p> ?。?)利用高斯差函數(shù)進(jìn)行增強(qiáng):對(duì)上一步得出的圖像進(jìn)行高斯差函數(shù)濾波,得出一張突出了顯著點(diǎn)的圖像。</p><p> ?。?)形成掩碼(Mask):對(duì)上一步得出的圖像執(zhí)行區(qū)域增長算法,得出一張掩碼圖像。</p><p&
96、gt; ?。?)形成最終結(jié)果:利用上一步形成的掩碼,和原圖進(jìn)行與或操作得到只顯示感興趣區(qū)域的圖像,即最終結(jié)果。</p><p> 圖4-2為本文算法的整體流程:</p><p> 圖4-2:算法流程圖</p><p><b> 4.3界面實(shí)現(xiàn)</b></p><p> 感興趣區(qū)域提取的程序界面,為了更加方便的瀏覽
97、與分析算法的運(yùn)行過程,采用了縮略圖窗口和詳細(xì)查看窗口的并用的布局。界面系統(tǒng)提供了大量的操作接口,使算法在運(yùn)行過程中利用這些操作接口把算法過程描述出來,并使算法和界面完全的分離。</p><p> 下圖展示的是感興趣區(qū)域提取程序的整體界面。界面的視圖部分由以下3個(gè)部分組成</p><p> 縮略圖瀏覽窗口,圖片詳細(xì)查看窗口,控制窗口。</p><p> 圖4-3
98、:感興趣區(qū)域提取軟件界面</p><p> 4.3.1縮略圖瀏覽窗口</p><p> 界面的左側(cè)窗口為縮略圖瀏覽窗口,該窗口主要用來顯示程序運(yùn)行過程中產(chǎn)生的多個(gè)中間結(jié)果,使用戶方便快捷地瀏覽每一個(gè)中間結(jié)果。</p><p> 該窗口在程序中是用CBreviaryView類來實(shí)現(xiàn)的。CBreviaryView類繼承自MFC類庫中的CView類。</p&g
99、t;<p> 圖4-4:CBreviaryView類圖</p><p> 圖4-5:縮略圖瀏覽窗口</p><p> 縮略圖小窗口用來顯示單個(gè)圖片,小窗口在程序中用CRect 列表定位。每一個(gè)圖片添加進(jìn)來的時(shí)候都要指定需要放置的位置。而這樣做是必須的,因?yàn)榇翱诒恢禺嫷倪^程中整個(gè)窗口都會(huì)被檫除掉。窗口重新顯示會(huì)掉用重載的OnPaint函數(shù),如果此時(shí)不確定各個(gè)圖片在窗口中的
100、具體位置,則無法顯示出圖片來,所以程序中小窗口的位置用CRect類的列表來保存。而CRect類型又是多個(gè)Windows設(shè)備畫圖函數(shù)的參數(shù)類型,可以很方便的使用。</p><p> 圖4-6:縮略圖小窗口</p><p> 縮略圖小窗口下面的文字用來簡要介紹縮略圖片。這些文字用CString的列表保存。窗口所要顯示的圖片也是用列表保存,但是該列表保存的是一個(gè)設(shè)備無關(guān)為圖的指針列表。因?yàn)樯?/p>
101、微大一點(diǎn)的位圖圖像,在沒有被壓縮過的情況下,在內(nèi)存中占的空間會(huì)非常大,如果將圖片的副本存在該類中,會(huì)消耗龐大的內(nèi)存空間。因此使用圖片的指針列表來存儲(chǔ)圖片。</p><p> 以上的圖片列表,窗口位置列表,圖片簡介列表在每一個(gè)索引中是一一對(duì)應(yīng)的,一個(gè)圖片有圖片簡介,圖片位置,圖片指針。每一個(gè)圖片的添加或刪除的時(shí)候會(huì)同步的添加或刪除上面三個(gè)列表中對(duì)應(yīng)的部分,保證圖片正確顯示。</p><p>
102、; 滾動(dòng)條的實(shí)現(xiàn)在該類中是最重要的一部分,因?yàn)樗惴óa(chǎn)生的中間結(jié)果會(huì)非常多。在有限的窗口中瀏覽所有的縮略圖必須要實(shí)現(xiàn)滾動(dòng)條。首先為了生成滾動(dòng)條在CBreviaryView類的PreCreateWindow函數(shù)中給窗口類添加了WS_VSCROLL樣式產(chǎn)生了垂直滾動(dòng)條。然后,重載了基類CView的滾動(dòng)條響應(yīng)函數(shù)。滾動(dòng)條運(yùn)動(dòng)的過程中,調(diào)用基類的ScrollWindow函數(shù)使窗口向上或向下滾動(dòng)。這樣做有效地避免了拉動(dòng)滾動(dòng)條時(shí),屏幕閃爍的問題。&
103、lt;/p><p> 鼠標(biāo)選中縮略圖,可使將點(diǎn)中的縮略圖顯示在詳細(xì)瀏覽窗口中。首先添加了鼠標(biāo)左鍵點(diǎn)擊響應(yīng)函數(shù),在響應(yīng)函數(shù)中遍歷整個(gè)圖片位置列表,利用CRect的成員函數(shù)PtInRect函數(shù)判斷點(diǎn)擊點(diǎn)是否在該矩形里,如果有則將該索引存儲(chǔ)起來。并用該索引對(duì)應(yīng)的圖片指針傳給詳細(xì)瀏覽窗口,并在每次重畫的時(shí)候?qū)⒈贿x中的縮略圖的邊緣顏色變成藍(lán)色。值得一提的是,當(dāng)圖片數(shù)目過多而出現(xiàn)滾動(dòng)條的時(shí)候簡單的遍歷CRect列表就變得不可能
104、。因?yàn)镃Rect列表中的位置矩形并不會(huì)因?yàn)闈L動(dòng)條的滾動(dòng)而改變,而實(shí)際上圖片相對(duì)于窗口的位置已經(jīng)改變了,克服這個(gè)問題,利用了滾動(dòng)條的位置來重新設(shè)置窗口坐標(biāo)系的原點(diǎn),而后再遍歷CRect列表。</p><p> CBreviaryView類對(duì)外部提供了幾個(gè)操作接口:</p><p> AddNewItem():該函數(shù)是用來給窗口添加一張新的縮略圖的。添加時(shí)調(diào)用者需要傳進(jìn)指定圖片的指針,還有
105、該圖片的簡介。同時(shí)函數(shù)內(nèi)部根據(jù)已經(jīng)存在的圖片個(gè)數(shù),計(jì)算出該圖片在窗口中的位置,并同時(shí)將圖片指針,圖片簡介,圖片位置添加到圖片列表,圖片簡介列表,圖片位置列表當(dāng)中。</p><p> DeleteItem():是用來刪除末尾的縮略圖。該函數(shù)調(diào)用時(shí)會(huì)使三種列表執(zhí)行pop_back操作。</p><p> DeleteAllItem():是用來刪除所有的縮略圖的,一般該函數(shù)的調(diào)用發(fā)生在對(duì)另外
106、一張圖片進(jìn)行整個(gè)算法操作的時(shí)候,利用vector容器的clear操作清空列表。</p><p> 4.3.2詳細(xì)圖像瀏覽窗口</p><p> 詳細(xì)圖像瀏覽窗口是用來詳細(xì)顯示某個(gè)特定圖片的。</p><p> 圖4-7:詳細(xì)圖像瀏覽窗口</p><p> 該窗口在程序中用PerticularView類來實(shí)現(xiàn)。PerticularVie
107、w類繼承自MFC類庫中的CView類。</p><p> 圖4-8:CPerticularView類圖</p><p> 該類中存儲(chǔ)了一個(gè)特定圖像的指針,用來顯示大圖。并且還存儲(chǔ)了代表該圖像在窗口中顯示位置的矩形CRect對(duì)象。</p><p> SetImage函數(shù),用來設(shè)置顯示在該窗口中的圖像。在縮略圖中點(diǎn)擊某個(gè)圖片的時(shí)候該函數(shù)會(huì)被調(diào)用,并且讓窗口中顯示的
108、圖片自動(dòng)更新。</p><p><b> 4.3.3控制窗口</b></p><p> 控制窗口用來控制算法的執(zhí)行過程,所有用戶消息的觸發(fā)都在該窗口中。</p><p><b> 圖4-9:控制窗口</b></p><p> 該窗口程序中用CControlView類來實(shí)現(xiàn)。CControlV
109、iew類繼承自MFC類庫中的CView類。</p><p> 圖4-10:CControlView類圖</p><p> 窗口中一共有十個(gè)按鈕,其中左邊八個(gè)按鈕與算法執(zhí)行步驟有關(guān),右邊兩個(gè)按鈕于系統(tǒng)設(shè)置有關(guān)。</p><p> 左邊8個(gè)按鈕對(duì)應(yīng)于感興趣區(qū)域提取流程的每一個(gè)步驟。每一個(gè)按鈕都添加了自定義響應(yīng)函數(shù),按鈕被按下時(shí)這些函數(shù)會(huì)調(diào)用主框架窗口中的對(duì)應(yīng)步驟的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 圖像感興趣區(qū)域提取技術(shù)研究—系統(tǒng)實(shí)現(xiàn)---畢業(yè)論文
- 圖像感興趣區(qū)域提取技術(shù)研究—系統(tǒng)實(shí)現(xiàn)---畢業(yè)論文
- 圖像感興趣區(qū)域提取技術(shù)研究---畢業(yè)論文
- 圖像感興趣區(qū)域提取技術(shù)研究.pdf
- 彩色圖像感興趣區(qū)域自動(dòng)提取技術(shù)研究.pdf
- 靜態(tài)圖像感興趣區(qū)域提取關(guān)鍵技術(shù)研究.pdf
- 圖像感興趣區(qū)域提取方法研究.pdf
- 醫(yī)學(xué)X光圖像感興趣區(qū)域提取.pdf
- 基于感興趣區(qū)域的圖像編碼技術(shù)研究.pdf
- 側(cè)掃聲納圖像感興趣區(qū)域提取算法研究.pdf
- 感興趣區(qū)域圖像編碼研究.pdf
- 防火圖像感興趣區(qū)域自動(dòng)提取算法的研究.pdf
- 感興趣區(qū)域圖像壓縮與可見水印技術(shù).pdf
- 基于視頻圖像顯著圖的感興趣區(qū)域提取方法研究.pdf
- 基于感興趣區(qū)域的圖像檢索.pdf
- 感興趣區(qū)域圖像分級(jí)編碼策略.pdf
- 圖像感興趣區(qū)域數(shù)字水印算法研究.pdf
- 基于感興趣區(qū)域的圖像分類研究.pdf
- 基于感興趣區(qū)域的圖像壓縮技術(shù)的研究.pdf
- 基于感興趣區(qū)域的彩色圖像檢索算法研究及系統(tǒng)實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論