2023年全國(guó)碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩32頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p>  畢業(yè)設(shè)計(jì)(論文)說明書</p><p>  學(xué) 院 軟件學(xué)院 </p><p>  專 業(yè) 軟件工程 </p><p>  年 級(jí) 2007 級(jí) </p><p>  姓 名 </p><p>  指導(dǎo)教師

2、 </p><p>  2011年 6月 15日</p><p>  畢業(yè)設(shè)計(jì)(論文)任務(wù)書</p><p>  題目:大規(guī)模數(shù)據(jù)驅(qū)動(dòng)的陰影檢測(cè)</p><p>  學(xué)生姓名 </p><p>  學(xué)院名稱 軟件學(xué)院 </p><p>

3、  專 業(yè) 軟件工程 </p><p>  學(xué) 號(hào) </p><p>  指導(dǎo)教師 </p><p>  職 稱 </p><p><b>  一、原始依據(jù)</b></p><p>  

4、陰影作為場(chǎng)景光照作用下形成的最為顯著的效果之一,為發(fā)現(xiàn)場(chǎng)景屬性,如:物體大小、形狀和運(yùn)動(dòng),提供了有利線索;但它同時(shí)也使視覺識(shí)別任務(wù),如:特征檢測(cè)、物體識(shí)別和場(chǎng)景解析,變得更復(fù)雜。近些年,已經(jīng)有多個(gè)課題組提出方法消除圖片中光照的影響,也有課題組提出方法來移除圖片中的陰影。</p><p>  本課題《大規(guī)模數(shù)據(jù)驅(qū)動(dòng)的陰影檢測(cè)》旨在識(shí)別單張圖片中的陰影,其研究動(dòng)機(jī)主要來自兩個(gè)方面:第一,陰影作為視覺中最普遍存在的場(chǎng)景

5、元素之一,能否對(duì)其進(jìn)行有效識(shí)別對(duì)后續(xù)視覺任務(wù)的完成具有重要的影響,現(xiàn)階段陰影識(shí)別技術(shù)已取得長(zhǎng)足的發(fā)展,但其作為視覺領(lǐng)域的一個(gè)基礎(chǔ)問題仍然是一個(gè)值得研究的開放的話題,有許多難題亟待解決;第二,受現(xiàn)階段大規(guī)模數(shù)據(jù)驅(qū)動(dòng)技術(shù)的激勵(lì),使用大規(guī)模數(shù)據(jù)驅(qū)動(dòng)技術(shù)來解決視覺應(yīng)用中難以參數(shù)化建模的復(fù)雜問題開辟了,相對(duì)于機(jī)器學(xué)習(xí)來說,一種全新的研究思路,呈現(xiàn)出廣闊的研究空間。</p><p>  本課題需要識(shí)別的陰影來自單張日常生活中

6、的圖片,由于日常生活場(chǎng)景的復(fù)雜性必然導(dǎo)致陰影識(shí)別的復(fù)雜性,加之用戶拍攝圖片的環(huán)境、設(shè)備和方式的差異性將進(jìn)一步提升陰影檢測(cè)的難度。</p><p>  本課題的深入研究必須具備兩個(gè)條件:第一,數(shù)據(jù)資源和設(shè)備資源,數(shù)據(jù)資源就是用于大規(guī)模數(shù)據(jù)驅(qū)動(dòng)的圖片,這可以從Flickr、Google、百度等圖片網(wǎng)站上獲取,這些大多是用戶上傳的隨處可得的日常生活中的照片,預(yù)計(jì)需要下載百萬張圖片。設(shè)備資源可以看成是對(duì)大規(guī)模圖片的有效存

7、儲(chǔ)和檢索,由于數(shù)據(jù)量較大,在實(shí)現(xiàn)過程中需要對(duì)數(shù)據(jù)進(jìn)行分布式的存儲(chǔ)和檢索,需要使用4-6臺(tái)商品計(jì)算機(jī);第二,識(shí)別方法,數(shù)據(jù)的獲取可能相對(duì)較容易,如何利用數(shù)據(jù)中的信息才是本課題研究的重點(diǎn),必須充分利用大規(guī)模數(shù)據(jù)中冗余的的場(chǎng)景信息來輔助挖掘單張圖片中的場(chǎng)景信息,這也是大規(guī)模數(shù)據(jù)驅(qū)動(dòng)數(shù)據(jù)的靈魂所在。</p><p>  本課題主要面向?qū)W術(shù)研究,具體應(yīng)用可以在陰影識(shí)別的基礎(chǔ)上進(jìn)一步拓展,在暫不做過多的描述。</p&g

8、t;<p><b>  二、參考文獻(xiàn)</b></p><p>  [1]Jean-Francois Lalonde, Alexei A. Efros, Srinivasa G. Narasimhan: Detecting ground shadows in outdoor consumer photographs[J]. In: European Conference on C

9、omputer Vision, 2010.</p><p>  [2]Jiejie Zhu, Kegan G.G. Samuel, Syed Z. Masood, Marshall F. Tappen: Learning to Recognize Shadows in Monochromatic NaturalImages[J]. In: International Conferenceon Pattern Re

10、cognition, 2010. </p><p>  [3]Bryan C. Russell1 Alexei A. Efros, Josef Sivic1 William T. Freeman Andrew Zisserman: Segmenting Scenes by Matching Image Composites[J]. In: Neural InformationProcessing Systems,

11、 2009.</p><p>  [4]Elena Salvador, Andrea Cavallaro, Touradj Ebrahimia: Cast shadow segmentation using invariant color features[J]. In: Computer Vision and Image Understanding, 2004.</p><p>  [5

12、]Ce Liu, Jenny Yuen, Antonio Torralba: Nonparametric Scene Parsing: Label Transfer via Dense Scene Alignment[J]. In: International Conference on Pattern Recognition, 2009.</p><p>  三、設(shè)計(jì)(研究)內(nèi)容和要求</p>&

13、lt;p>  本課題重點(diǎn)研究單張用戶圖片中陰影的檢測(cè),研究方案為使用大規(guī)模數(shù)據(jù)驅(qū)動(dòng)技術(shù)。</p><p>  研究工作按畢設(shè)進(jìn)度有序進(jìn)行,最終研究成果必須和European Conference on Computer Vision 2010《Detecting ground shadows in outdoor consumer pho-tographs》中發(fā)表的實(shí)驗(yàn)結(jié)果進(jìn)行比較,要求陰影檢測(cè)的查全率和查

14、準(zhǔn)率達(dá)到或超過其公布的實(shí)驗(yàn)數(shù)據(jù)。同時(shí),在整理畢業(yè)論文文集之前,須撰寫英文論文。</p><p><b>  指導(dǎo)教師(簽字)</b></p><p><b>  年 月 日</b></p><p>  審題小組組長(zhǎng)(簽字)</p><p><b>  年 月 日</b

15、></p><p>  天津大學(xué)本科生畢業(yè)設(shè)計(jì)(論文)開題報(bào)告</p><p><b>  摘  要</b></p><p>  陰影常常會(huì)擾亂許多計(jì)算機(jī)視覺算法,如:圖片分割、物體檢測(cè)、移動(dòng)物體追蹤,等。有效的圖片陰影檢測(cè)必將顯著提高這些視覺算法的性能。</p><p>  本論文提出了一個(gè)全新的基于概率統(tǒng)計(jì)方法

16、自動(dòng)檢測(cè)單張戶外圖片地面陰影的方法。不同于前人的工作,我們的方法不依賴任何幾何假設(shè),如:相機(jī)位置、地面/物體幾何屬性;更重要的是,我們摒棄了現(xiàn)在主流的基于機(jī)器學(xué)習(xí)的陰影檢測(cè)框架。該方法基于一個(gè)重要的日常觀察:構(gòu)成戶外場(chǎng)景地面的材料通常是相對(duì)有限的,最常見的包括瀝青、磚塊、石頭、泥土、草地、混泥土,等。同時(shí),大規(guī)模數(shù)據(jù)驅(qū)動(dòng)技術(shù)作為當(dāng)前國(guó)際研究的熱點(diǎn)常被用來解決視覺領(lǐng)域難以參數(shù)化建模的相關(guān)問題,如果用于陰影檢測(cè),則可以有效解決前人工作中遇到

17、的模型選擇、參數(shù)設(shè)置、用戶介入過多等相關(guān)難題。基于以上兩點(diǎn),單張圖片中的地面陰影不會(huì)像常規(guī)陰影那樣大范圍變動(dòng),并且可以巧妙地使用大規(guī)模的無標(biāo)注陰影圖片庫(kù)來有效鑒別。</p><p>  我們的陰影檢測(cè)系統(tǒng)由四個(gè)主要步驟構(gòu)成,包括: (a)從圖片分割邊周圍提取陰影敏感特征;(b)使用大規(guī)模數(shù)據(jù)驅(qū)動(dòng)技術(shù)進(jìn)行陰影判別;(c)使用條件隨機(jī)域最優(yōu)化方法組合檢測(cè)到的陰影邊構(gòu)成連續(xù)的陰影輪廓;(d)結(jié)合現(xiàn)有的單張圖片地面檢測(cè)器

18、。實(shí)驗(yàn)在許多具有不同地面材料和陰影形狀的非常有挑戰(zhàn)行的圖片上的展示了很好的陰影檢測(cè)效果。</p><p>  由于許多視覺應(yīng)用感興趣的物體(如:行人、車輛、標(biāo)識(shí))常常和地面綁連接在一起,我們相信我們提出的自動(dòng)無參陰影檢測(cè)器能找到廣闊的應(yīng)用空間。</p><p>  關(guān)鍵詞:陰影檢測(cè);數(shù)據(jù)驅(qū)動(dòng);支持度;顏色比;松弛度因子;條件隨機(jī)域</p><p><b>

19、  ABSTRACT</b></p><p>  Shadows often confound algorithms designed to solve computer vision tasks such as image segmentation, object detection and tracking, etc. Detecting shadows from images can signi

20、ficantly improve the performance of such vision algorithms.</p><p>  In this paper, we present a novel statistic based algorithm to automatically detect shadows cast by objects onto the ground, from a signal

21、 consumer outdoor photograph. Unlike previous work, our approach does not rely on any geometric assumption, such as camera position, ground surface/object geometry. What's more, we abandoned the current popular machi

22、ne learning based shadow detection framework. Our key observation is that the types of materials constructing the ground in outdoor is relatively </p><p>  Our shadow detecting system consists of a four-tier

23、 process including (a) computing shadow sensitive features around each image edge, (b) identifying shadows using large scale data-driven technology, (c) a CRF-based optimization to group detected shadow edges to generate

24、 coherent shadow contours, and (d) incorporating any existing classifier that is specifically trained to detect ground in images. Our results demonstrate good detection accuracy on many challenging images having differen

25、t ground </p><p>  Since most objects of interest to vision applications (like pedestrians, vehicles, signs) are attached to the ground, we believe our shadow detection system can find wide applicability.<

26、;/p><p>  Key words: shadow detection; data-driven; support ratio; color ratio; looseness factor; CRF</p><p><b>  緒論</b></p><p><b>  研究背景和意義</b></p>

27、<p>  自從電子計(jì)算機(jī)問世以來,隨著硬件和軟件技術(shù)的不斷進(jìn)步,人類對(duì)計(jì)算機(jī)應(yīng)用的要求越來越高。在21世紀(jì)的今天,計(jì)算機(jī)已經(jīng)在我們的生活中無處不在,從衣食住行的各個(gè)方面為我們提供高效便捷的服務(wù)。特別是近二十年來隨著互聯(lián)網(wǎng)和多媒體技術(shù)的高速發(fā)展,計(jì)算機(jī)在我們的生活中占據(jù)著越來越重要的位置,我們獲得的信息量呈幾何級(jí)數(shù)的速度增長(zhǎng),獲取信息的方式也越來越方便,并且信息的表現(xiàn)形式也不再局限于原來的文字和靜態(tài)的圖片,而是包括聲音、視

28、頻、動(dòng)畫等多種媒體形式,所以有人說:我們生活在一個(gè)信息爆炸的時(shí)代,或稱為信息時(shí)代。</p><p>  人類接收信息的主要來源是視覺,占據(jù)了約70%的比重。我們從視覺系統(tǒng)得到的信息就是圖像,簡(jiǎn)言之,圖像是自然界景物的客觀反映和人類視覺系統(tǒng)的主觀感受相結(jié)合的產(chǎn)物。而計(jì)算機(jī)視覺則是希望計(jì)算機(jī)能夠從圖像或圖像序列中獲取對(duì)世界的描述。這種信息的獲取是以準(zhǔn)確的分析和處理數(shù)字圖像為基礎(chǔ)的,也被稱為數(shù)字圖像處理技術(shù)。</

29、p><p>  數(shù)字圖像處理技術(shù)發(fā)展到今天,許多技術(shù)己日臻成熟。在各個(gè)領(lǐng)域的應(yīng)用取得了巨大的成功和顯著的經(jīng)濟(jì)效益。如在工程領(lǐng)域、工業(yè)生產(chǎn)、軍事、醫(yī)學(xué)以及科學(xué)研究中的應(yīng)用已十分普遍。通過分析資源衛(wèi)星得到的照片可以獲得地下礦藏資源的分布及埋藏量;利用紅外線、微波遙感技術(shù)可偵查到隱蔽的軍事設(shè)施;X射線CT己廣泛應(yīng)用于臨床診斷,由于它可得到人體內(nèi)部器官的斷層圖像,因此,可準(zhǔn)確地確定病變的位置,為診斷和治療疾病帶來了極大的方便

30、。在安全保障及監(jiān)控方面圖像處理技術(shù)更是不可缺少的基本技術(shù)。</p><p>  陰影是在自然界中普遍存在的一種物理現(xiàn)象,是由于光源被物體遮擋而產(chǎn)生的。圖像中陰影的存在對(duì)計(jì)算機(jī)視覺領(lǐng)域的相關(guān)問題有不同的影響,這種影響有有利的也有不利的。比如我們可以從陰影中得到物體的幾何信息、場(chǎng)景空間結(jié)構(gòu)、光源方向等,對(duì)三維場(chǎng)景重建、空間物體運(yùn)動(dòng)分析有重要的作用;在虛擬現(xiàn)實(shí)、3D游戲中為物體添加陰影,可以提高場(chǎng)景的真實(shí)感。但是更多的

31、時(shí)候,圖像中的陰影會(huì)對(duì)計(jì)算機(jī)視覺的相關(guān)問題產(chǎn)生不利的影響,如在航空?qǐng)D像中,陰影的存在會(huì)影響后繼的圖像匹配、模式識(shí)別和地物提取等多種遙感圖像處理操作;在醫(yī)學(xué)成像中,陰影會(huì)影響醫(yī)生對(duì)病變圖像的分析;在視頻監(jiān)控中,陰影和運(yùn)動(dòng)目標(biāo)結(jié)合在一起,導(dǎo)致計(jì)算機(jī)對(duì)目標(biāo)物體的提取和追蹤出現(xiàn)錯(cuò)誤。因此,有必要對(duì)圖像中的陰影進(jìn)行檢測(cè)和分析,并根據(jù)需要,進(jìn)而消除或減弱陰影的影響。</p><p><b>  國(guó)內(nèi)外研究進(jìn)展<

32、;/b></p><p>  陰影可以說無處不在,人眼可以快速地識(shí)別出圖片中的陰影,計(jì)算機(jī)算法的識(shí)別效果卻不是很理想。在計(jì)算機(jī)視覺研究的早期,陰影的出現(xiàn)弱化了許多視覺應(yīng)用的效果,包括分割、物體檢測(cè)、場(chǎng)景分析、跟蹤等。盡管現(xiàn)在存在許多標(biāo)準(zhǔn)的方法、軟件和評(píng)估數(shù)據(jù)庫(kù)來完成重要的視覺任務(wù),包括從邊檢測(cè)到人年檢測(cè),但在過去的40年里陰影相關(guān)的研究卻很少。</p><p>  到目前為止,使用多

33、張圖片、標(biāo)有時(shí)間的圖片序列或者用戶輸入的陰影方法已經(jīng)取得了豐碩的成果,但對(duì)單張圖片自動(dòng)進(jìn)行穩(wěn)定可靠的陰影檢測(cè)來說仍然是個(gè)開放的話題[]。這主要是由于戶外陰影的形狀和外貌依賴于多個(gè)隱含因素,如:顏色、光照的大小和方向、投影物體的幾何形狀、被投影物體的形狀和材料等?,F(xiàn)階段單張圖片陰影檢測(cè)的大部分工作都是基于光照不變量。不幸的是,不變量的穩(wěn)定計(jì)算需要高質(zhì)量的圖片(擁有較大的動(dòng)態(tài)變化范圍、較高的強(qiáng)度分辨率,并且相機(jī)參數(shù)、顏色變化能夠準(zhǔn)確的測(cè)量和

34、補(bǔ)償),這樣這些方法就不適合日常生活圖片的處理,如:來自Flickr和Google上的圖片。由于當(dāng)前計(jì)算機(jī)視覺的大量研究工作都是基于日常生活中的圖片,所以提出一套新穎的高效的陰影檢測(cè)方法迫在眉睫。</p><p>  使用大規(guī)模數(shù)據(jù)來解決計(jì)算機(jī)視覺領(lǐng)域難以參數(shù)化建模的相關(guān)難題已經(jīng)成為當(dāng)前國(guó)際上研究的熱點(diǎn)。如:Carnegie Mellon University教授Alexei (Alyosha) Efros長(zhǎng)期致

35、力于計(jì)算機(jī)視覺和計(jì)算機(jī)圖形學(xué)領(lǐng)域的研究工作,其當(dāng)前主要研究興趣就在于利用互聯(lián)網(wǎng)上大量存儲(chǔ)的并且日益增長(zhǎng)的視覺信息,如:數(shù)字相冊(cè)、網(wǎng)絡(luò)攝像頭、電影等,來學(xué)習(xí)、理解和合成周圍的視覺世界;Massachusetts Institute of Technology教授Antonio Torralba及其指導(dǎo)的學(xué)生正在使用隨處可得的視覺信息來幫助識(shí)別場(chǎng)景和物體[]。當(dāng)前國(guó)內(nèi)不少科研團(tuán)隊(duì),如:微軟研究院、清華大學(xué)等,在大規(guī)模圖像和視頻檢索方面進(jìn)行了

36、大量的研究并在基于草圖的視覺檢索、文本視覺信息混合檢索、語義檢索方面取得了顯著的成就。然而,國(guó)內(nèi)在大規(guī)模視覺檢索的基礎(chǔ)上,利用大規(guī)模數(shù)據(jù)驅(qū)動(dòng)技術(shù)解決計(jì)算機(jī)視覺領(lǐng)域相關(guān)難題方面還處在初始發(fā)展階段,見諸發(fā)表的文章也相對(duì)較少。本課題可以看成是使用大規(guī)模數(shù)據(jù)驅(qū)動(dòng)技術(shù)進(jìn)行場(chǎng)景理解方面的一個(gè)新嘗試。</p><p><b>  主要研究?jī)?nèi)容 </b></p><p>  本文將對(duì)

37、單張圖片中的陰影檢測(cè)進(jìn)行研究,在充分分析陰影屬性的基礎(chǔ)上,結(jié)合現(xiàn)有陰影檢測(cè)原理和大規(guī)模數(shù)據(jù)驅(qū)動(dòng)技術(shù),提出了一個(gè)全新的陰影檢測(cè)方法,并通過實(shí)驗(yàn)對(duì)算法進(jìn)行了檢測(cè)和分析。因此本文的主要內(nèi)容有:</p><p>  陰影形成的基本原理,給出陰影的定義,總結(jié)分析陰影的特點(diǎn);</p><p>  常用顏色模型分析和比較;</p><p>  比較現(xiàn)有陰影特征提取方法,并提出自己

38、的陰影特征提取算法;</p><p>  數(shù)據(jù)聚類算法分類和總結(jié);</p><p>  分析現(xiàn)有的陰影檢測(cè)算法的優(yōu)缺點(diǎn)及限制條件,并提出自己的陰影檢測(cè)算法,通過實(shí)驗(yàn)進(jìn)行驗(yàn)證分析。</p><p>  希望通過以上的研究,為以后從事這方面研究的同仁提供一定的啟發(fā)作用。</p><p><b>  基礎(chǔ)知識(shí)</b></

39、p><p><b>  陰影形成原理</b></p><p>  陰影,又稱影子,是一種光學(xué)現(xiàn)象,陰影不是一個(gè)實(shí)體,只是一個(gè)投影。 </p><p>  陰影的產(chǎn)生:是由于物體遮住了光線這一科學(xué)原理。光線在同種均勻介質(zhì)中沿直線傳播,不能穿過不透明物體而形成的較暗區(qū)域,形成的投影就是我們常說的影子。(這里說的光是可見光線)。</p>&

40、lt;p>  產(chǎn)生陰影的條件:陰影形成要光和不透明物體兩個(gè)必要條件。 </p><p>  影子分本影和半影兩種:仔細(xì)觀察電燈光下的影子,還會(huì)發(fā)現(xiàn)影子中部特別黑暗,四周稍淺。影子中部特別黑暗的部分叫本影,四周灰暗的部分叫半影。這些現(xiàn)象的產(chǎn)生都和光的直線傳播有密切關(guān)系。假如把一個(gè)柱形茶葉筒放在桌上,旁邊點(diǎn)燃一支蠟燭,茶葉筒就會(huì)投下清晰的影子 。如果在茶葉筒旁點(diǎn)燃兩支蠟燭,就會(huì)形成兩個(gè)相疊而不重合的影子。兩影相

41、疊部分完全沒有光線射到,是全黑的,這就是本影;本影旁邊只有一支蠟燭可照到的地 方,就是半明半暗的半影。物體在電燈光下能生成由本影和半影組成的影子,也是這個(gè)道理。電燈是由一條彎曲的燈絲在發(fā)光,不只限于一點(diǎn)。從這一個(gè)點(diǎn)射來的光給物體遮住了,從另一些點(diǎn)射過來的光并不一定全被擋住。很顯然,發(fā)光物體的面積越大,本影就越小。如果我們?cè)谏鲜霾枞~筒周圍點(diǎn)上一圈蠟燭,這時(shí)本影完全消失,半影也淡得看不見了。 科學(xué)家根據(jù)上述原理制成了手術(shù)用的無影燈。它將發(fā)光

42、強(qiáng)度很大的燈在燈盤上排列成圓形,合成一個(gè)大面積的光源。這樣,就能從不同角度把光線照射到手術(shù)臺(tái)上,既保證手術(shù)視野有足夠的亮度,同時(shí)又不產(chǎn)生明顯的本影,所以取名無影燈。</p><p><b>  常用色彩模型比較</b></p><p><b>  RGB</b></p><p>  RGB是三個(gè)顏色紅red、綠green、

43、藍(lán)blue的縮寫,RGB屬于加性色系,因?yàn)檫@三個(gè)顏色混合相加可以得到青色,品紅,黃色,白色和所有其他顏色在電視機(jī)、顯示器上使用的所有顏色[]。圖2-1為RGB顏色模型示意圖,(a)加性顏色紅色、綠色、藍(lán)色可以混合出青色、紫紅色、黃色和白色;(b)減性顏色青色、紫紅色、黃色可以產(chǎn)生紅色、綠色和藍(lán)色,還有黑色。</p><p>  圖2-1  主顏色和次主顏色</p><p>  在1930年

44、,CIE(國(guó)際照明委員會(huì)),通過使用紅(700.nm波長(zhǎng))、綠(546.1nm)、藍(lán)(435.8nm)三個(gè)主顏色進(jìn)行顏色匹配實(shí)驗(yàn),標(biāo)準(zhǔn)化了RGB顏色表示。RGB(紅綠藍(lán))是依據(jù)人眼識(shí)別的顏色定義出的空間,可表示大部分顏色。但在科學(xué)研究一般不采用RGB顏色空間,因?yàn)樗募?xì)節(jié)難以進(jìn)行數(shù)字化的調(diào)整。它將 色調(diào),亮度,飽和度三個(gè)量放在一起表示,很難分開。它是最通用的面向硬件的彩色模型。該模型主要用于彩色監(jiān)視器和一大類彩色視頻攝像。</p&

45、gt;<p><b>  XYZ</b></p><p>  由于混合負(fù)光相關(guān)問題的存在,CIE開發(fā)了一個(gè)叫XYZ的新顏色空間,該空間包含了正八分儀中的所有純光譜顏色(Y軸映射到關(guān)照強(qiáng)度,可感知的相對(duì)亮度,純白色映射到等值對(duì)角向量)。RGB到XYZ的變換公式為:</p><p>  當(dāng)我們需要分離光照強(qiáng)度和色度時(shí),最方便的顏色值表示方法是XYZ(光照強(qiáng)度

46、加兩個(gè)最顯著的色度組件)。</p><p><b>  L*a*b</b></p><p>  雖然XYZ顏色空間有許多方便的屬性,這包括分離光照強(qiáng)度和色度,但它事實(shí)上并沒有很好地預(yù)測(cè)人類在光照和色度方面的感知差異。</p><p>  因?yàn)槿祟愐曈X系統(tǒng)響應(yīng)大致是成對(duì)數(shù)形式的(我們能感知到的相對(duì)亮度差異大約為1%),CIE定義了一個(gè)叫L*a*b

47、的顏色空間非線性重映射XYZ空間,這里光照強(qiáng)度和色度差異在感知上更加一致[]。(一個(gè)叫L*u*v的可選的感知激勵(lì)顏色空間在同一時(shí)間被開發(fā)和標(biāo)準(zhǔn)化。)</p><p>  L*光照組件被定義為:</p><p>  Yn是歸一化的白色光強(qiáng)值,并且:</p><p>  是立方根的有限斜率近似,δ=6/29。同樣的方式,a*、b*組件定義為:</p>&l

48、t;p>  本論文中陰影特征的提取正是基于不同的顏色空間,此處的關(guān)于顏色空間的簡(jiǎn)單介紹對(duì)后文陰影特征提取的深入理解能起到很好的鋪墊作用。</p><p><b>  特征提取</b></p><p>  特征提取是計(jì)算機(jī)視覺和圖像處理中的一個(gè)概念。它指的是使用計(jì)算機(jī)提取圖像信息,決定每個(gè)圖像的點(diǎn)是否屬于一個(gè)圖像特征。特征提取的結(jié)果是把圖像上的點(diǎn)分為不同的子集,這

49、些子集往往屬于孤立的點(diǎn)、連續(xù)的曲線或者連續(xù)的區(qū)域。</p><p>  至今為止特征沒有萬能和精確的定義。特征的精確定義往往由問題或者應(yīng) 用類型決定。特征是一個(gè)數(shù)字圖像中“有趣”的部分,它是許多計(jì)算機(jī)圖像分析算法的起點(diǎn)[]。因此一個(gè)算法是否成功往往由它使用和定義的特征決定。因此特征提取 最重要的一個(gè)特性是“可重復(fù)性”:同一場(chǎng)景的不同圖像所提取的特征應(yīng)該是相同的。 </p><p>  常見

50、的特征定義有:邊、角、顏色、紋理、形狀等等。由于本文提取的陰影特征主要基于顏色和紋理,因此在這里我們主要介紹顏色和紋理特征。</p><p>  顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對(duì)應(yīng)的景物的表面性 質(zhì)。一般顏色特征是基于像素點(diǎn)的特征,此時(shí)所有屬于圖像或圖像區(qū)域的像素都有各自的貢獻(xiàn)。由于顏色對(duì)圖像或圖像區(qū)域的方向、大小等變化不敏感,所以顏色特 征不能很好地捕捉圖像中對(duì)象的局部特征。另外,僅使用顏色特征

51、查詢時(shí),如果數(shù)據(jù)庫(kù)很大,常會(huì)將許多不需要的圖像也檢索出來。顏色直方圖是最常用的表達(dá)顏色 特征的方法,其優(yōu)點(diǎn)是不受圖像旋轉(zhuǎn)和平移變化的影響,進(jìn)一步借助歸一化還可不受圖像尺度變化的影響,基缺點(diǎn)是沒有表達(dá)出顏色空間分布的信息。常用的顏色特征提取與匹配方法有:顏色直方圖 、顏色集 、顏色矩、顏色聚合向量、顏色相關(guān)圖[]。 </p><p>  紋理特征也是一種全局特征,它也描述了圖像或圖像區(qū)域所對(duì)應(yīng)景物的表 面性質(zhì)。但由

52、于紋理只是一種物體表面的特性,并不能完全反映出物體的本質(zhì)屬性,所以僅僅利用紋理特征是無法獲得高層次圖像內(nèi)容的。與顏色特征不同,紋理特 征不是基于像素點(diǎn)的特征,它需要在包含多個(gè)像素點(diǎn)的區(qū)域中進(jìn)行統(tǒng)計(jì)計(jì)算。在模式匹配中,這種區(qū)域性的特征具有較大的優(yōu)越性,不會(huì)由于局部的偏差而無法匹配 成功。作為一種統(tǒng)計(jì)特征,紋理特征常具有旋轉(zhuǎn)不變性,并且對(duì)于噪聲有較強(qiáng)的抵抗能力。但是,紋理特征也有其缺點(diǎn),一個(gè)很明顯的缺點(diǎn)是當(dāng)圖像的分辨率變化的 時(shí)候,所計(jì)算出

53、來的紋理可能會(huì)有較大偏差。另外,由于有可能受到光照、反射情況的影響,從2-D圖像中反映出來的紋理不一定是3-D物體表面真實(shí)的紋理[]。</p><p>  在檢索具有粗細(xì)、疏密等方面較大差別的紋理圖像時(shí),利用紋理特征是一種有效的方法。但當(dāng)紋理之間的粗細(xì)、疏密等易于分辨的信息之間相差不大的時(shí)候,通常的紋理特征很難準(zhǔn)確地反映出人的視覺感覺不同的紋理之間的差別。 </p><p>  常用的紋理

54、特征提取方法包括:統(tǒng)計(jì)方法、幾何法、模型法、信號(hào)處理法。</p><p><b>  大規(guī)模數(shù)據(jù)聚類方法</b></p><p>  聚類算法將一系列數(shù)據(jù)聚團(tuán)成多個(gè)子集或簇,其目標(biāo)是建立類內(nèi)緊密、類間分散的多個(gè)簇。換句話說,聚類的結(jié)果要求簇內(nèi)的數(shù)據(jù)之間要盡可能的相似,而簇間的數(shù)據(jù)之間要盡可能不相似。</p><p>  聚類是無監(jiān)督學(xué)習(xí)的一種最

55、普遍的形式。無監(jiān)督也意味著不存在對(duì)文檔進(jìn)行類別標(biāo)注的人類專家。聚類中,數(shù)據(jù)的分布和組成結(jié)構(gòu)決定最后的類別歸屬。</p><p>  聚類算法的一個(gè)關(guān)鍵輸入是距離計(jì)算方法。在數(shù)據(jù)聚類當(dāng)中,距離計(jì)算方法往往采用歐式距離。不同的距離計(jì)算方法會(huì)導(dǎo)致不同的聚類效果。因此,距離的計(jì)算方法是影響聚類結(jié)果的一個(gè)重要因素。</p><p>  扁平聚類算法會(huì)給出一個(gè)扁平結(jié)構(gòu)的簇,他們之間沒有任何顯式的結(jié)構(gòu)來

56、表明彼此的關(guān)聯(lián)性。而層次聚類算法則會(huì)產(chǎn)生層次性的聚類結(jié)果。</p><p>  了解硬聚類和軟聚類之間的差別也相當(dāng)重要。硬聚類計(jì)算的是一個(gè)硬分配過程,即每個(gè)數(shù)據(jù)僅僅屬于一個(gè)簇。而軟聚類算法的分配過程是軟的,即一個(gè)數(shù)據(jù)的分配結(jié)果是在所有簇中的一個(gè)分配。在軟分配結(jié)果中,一個(gè)數(shù)據(jù)可能對(duì)多個(gè)簇都具有隸屬度。作為一種降維方法,隱性語義索引就是一個(gè)軟聚類算法。</p><p>  本文將使用Kmean

57、s[]聚類方法對(duì)提取出的陰影陰影特征進(jìn)行粗略地分簇,下邊簡(jiǎn)要介紹Kmeans原理:</p><p>  Kmeans算法接受輸入量k,然后將n個(gè)數(shù)據(jù)對(duì)象劃分為k個(gè)聚類以便使得所獲得的聚類滿足:同一個(gè)聚類中的對(duì)象高度相似,不同聚類中的對(duì)象相似度較少。聚類相似度是利用各聚類中對(duì)象的均值獲得一個(gè)“中心對(duì)象”(引力中心)來計(jì)算的。</p><p>  Kmeans算法的工作過程說明如下:首先從n個(gè)

58、數(shù)據(jù)對(duì)象任意選擇k個(gè)對(duì)象作為初始聚類中心,對(duì)于剩下的所有對(duì)象,則根據(jù)它們與這些聚類中心的相似度(距離),分別將它們分配給其最相似的(聚類中心所代表的)聚類,然后再計(jì)算每個(gè)新聚類的聚類中心(該聚類中所有對(duì)象的均值)。不斷重復(fù)上述過程知道標(biāo)準(zhǔn)測(cè)度函數(shù)開始收斂為止。一般都采用均方差作為標(biāo)準(zhǔn)測(cè)度函數(shù)。k個(gè)聚類具有一下特點(diǎn):各聚類本身盡可能的緊湊,而各聚類之間盡可能的分開。Kmeans++是對(duì)Kmeans算法的一種改進(jìn),它不同于Kmeans算法的

59、地方是初始聚類中心的選擇不是任意選擇的,而是必須符合一定的關(guān)系,這樣就使得聚類算法所得到的聚類結(jié)果相對(duì)于隨機(jī)選擇初始聚類中心來說更加合理。</p><p><b>  陰影檢測(cè)算法研究</b></p><p>  圖像中陰影的特點(diǎn)和性質(zhì)</p><p>  陰影區(qū)域和其周邊的非陰影區(qū)域具有如下特點(diǎn):</p><p>  

60、由于光線被部分遮擋,陰影區(qū)域具有較低的亮度;</p><p>  一般來說,陰影區(qū)域和非陰影區(qū)域具有不同的色度;</p><p>  陰影不明顯改變?cè)械乇淼募y理特征;</p><p>  陰影與產(chǎn)生陰影的遮擋物具有相似的輪廓;</p><p>  在計(jì)算機(jī)視覺的相關(guān)應(yīng)用中,陰影在數(shù)字圖像中的存在,既有有利的方面又不利的影響。</p&g

61、t;<p><b>  有利之處在于:</b></p><p>  從陰影的形狀可以得到遮擋物體的幾何信息和場(chǎng)景的空間布局;</p><p>  可以利用陰影來確定光源的位置、強(qiáng)弱和大小等信息;</p><p>  在三維虛擬現(xiàn)實(shí)技術(shù)和計(jì)算機(jī)游戲中,加入物體模擬陰影,可以增強(qiáng)觀察者的立體感和空間感,進(jìn)而提高場(chǎng)景的真實(shí)感。</

62、p><p><b>  不利之處在于:</b></p><p>  陰影影響圖像的可視性,例如在航空?qǐng)D片中,陰影區(qū)域的地物特征會(huì)由于陰影的噪聲效應(yīng)而邊模糊,進(jìn)而影響圖像分析;</p><p>  陰影的存在會(huì)降低圖像分割的準(zhǔn)確性,從而導(dǎo)致視頻監(jiān)控、目標(biāo)追蹤、物體識(shí)別、圖像標(biāo)注等計(jì)算機(jī)視覺應(yīng)用出現(xiàn)錯(cuò)誤。</p><p><

63、;b>  陰影檢測(cè)算法流程</b></p><p>  圖3-1  算法流程圖</p><p>  本算法主要分兩大模塊:離線數(shù)據(jù)庫(kù)模塊和在線判別模塊。兩大模塊均包含特征提取。離線數(shù)據(jù)庫(kù)模塊對(duì)提取出陰影特征進(jìn)行了特征提純。在線判別模塊利用數(shù)據(jù)庫(kù)中的特征對(duì)輸入圖片中的每個(gè)特征計(jì)算支持度,這些支持度值進(jìn)一步整合進(jìn)CRF模型得到連續(xù)完整的陰影輪廓。</p><

64、;p><b>  陰影特征提取</b></p><p>  陰影特征提出主要分兩個(gè)步驟進(jìn)行:圖片過分割和特征計(jì)算。</p><p><b>  圖片過分割</b></p><p>  圖像分割就是把圖像分成若干個(gè)特定的、具有獨(dú)特性質(zhì)的區(qū)域并提出感興趣目標(biāo)的技術(shù)和過程。它是由圖像處理到圖像分析的關(guān)鍵步驟。現(xiàn)有的圖像分割

65、方法主要分以下幾類:基于閾值的分割方法、基于區(qū)域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等。近年來,研究人員不斷改進(jìn)原有的圖像分割方法并把其它學(xué)科的一些新理論和新方法用于圖像分割,提出了不少新的分割方法。本文使用的分割算法為經(jīng)典的分水嶺分割算法[]。</p><p>  圖3-2  圖片過分割效果</p><p>  分水嶺算法的概念及原理:</p><

66、p>  分水嶺分割方法,是一種基于拓?fù)淅碚摰臄?shù)學(xué)形態(tài)學(xué)的分割方法,其基本思想是把圖像看作是測(cè)地學(xué)上的拓?fù)涞孛?,圖像中每一點(diǎn)像素的灰度值表示該點(diǎn)的海拔高度,每一個(gè)局部極小值及其影響區(qū)域稱為集水盆,而集水盆的邊界則形成分水嶺。分水嶺的概念和形成可以通過模擬浸水過程來說明。在每一個(gè)局部極小值表面,刺穿一個(gè)小孔,然后把整個(gè)模型慢慢浸入水中,隨著浸水的加深,每一個(gè)局部極小值的影響域慢慢向外擴(kuò)展,在兩個(gè)集水盆匯合處構(gòu)筑大壩,即形成分水嶺。&l

67、t;/p><p>  分水嶺的計(jì)算過程是一個(gè)迭代標(biāo)注過程。分水嶺比較經(jīng)典的計(jì)算方法是L. Vincent提出的。在該算法中,分水嶺計(jì)算分兩個(gè)步驟,一個(gè)是排序過程,一個(gè)是淹沒過程。首先對(duì)</p><p>  每個(gè)像素的灰度級(jí)進(jìn)行從低到高排序,然后在從低到高實(shí)現(xiàn)淹沒過程中,對(duì)每一個(gè)局部極小值在h階高度的影響域采用先進(jìn)先出(FIFO)結(jié)構(gòu)進(jìn)行判斷及標(biāo)注。</p><p>  

68、分水嶺變換得到的是輸入圖像的集水盆圖像,集水盆之間的邊界點(diǎn),即為分水嶺。顯然,分水嶺表示的是輸入圖像極大值點(diǎn)。因此,為得到圖像的邊緣信息,通常把梯度圖像作為輸入圖像,即:</p><p>  式中,f(x,y)表示原始圖像,grad{.}表示梯度運(yùn)算。</p><p>  分水嶺算法對(duì)微弱邊緣具有良好的響應(yīng),圖像中的噪聲、物體表面細(xì)微的灰度變化,都會(huì)產(chǎn)生過度分割的現(xiàn)象。但同時(shí)應(yīng)當(dāng)看出,分水

69、嶺算法對(duì)微弱邊緣具有良好的響應(yīng),是得到封閉連續(xù)邊緣的保證的。另外,分水嶺算法所得到的封閉的集水盆,為分析圖像的區(qū)域特征提供了可能。</p><p>  為消除分水嶺算法產(chǎn)生的過度分割,通??梢圆捎脙煞N處理方法,一是利用先驗(yàn)知識(shí)去除無關(guān)邊緣信息。二是修改梯度函數(shù)使得集水盆只響應(yīng)想要探測(cè)的目標(biāo)。</p><p>  為降低分水嶺算法產(chǎn)生的過度分割,通常要對(duì)梯度函數(shù)進(jìn)行修改,一個(gè)簡(jiǎn)單的方法是對(duì)梯

70、度圖像進(jìn)行閾值處理,以消除灰度的微小變化產(chǎn)生的過度分割。即:  g</p><p>  式中,gθ表示閾值。</p><p>  程序可采用方法:用閾值限制梯度圖像以達(dá)到消除灰度值的微小變化產(chǎn)生的過度分割,獲得適量的區(qū)域,再對(duì)這些區(qū)域的邊緣點(diǎn)的灰度級(jí)進(jìn)行從低到高排序,然后再?gòu)牡偷礁邔?shí)現(xiàn)淹沒的過程,梯度圖像用Sobel算子計(jì)算獲得。對(duì)梯度圖像進(jìn)行閾值處理時(shí),選取合適的閾值對(duì)最終分割的圖像有很

71、大影響,因此閾值的選取是圖像分割效果好壞的一個(gè)關(guān)鍵。缺點(diǎn):實(shí)際圖像中可能含有微弱的邊緣,灰度變化的數(shù)值差別不是特別明顯,選取閾值過大可能會(huì)消去這些微弱邊緣。</p><p>  分水嶺算法最終結(jié)果可以得到:分割區(qū)域、分割區(qū)域鄰接關(guān)系、分割邊界、分割區(qū)域角點(diǎn)等相關(guān)信息,這些信息將用于下一步的特征計(jì)算。</p><p><b>  特征計(jì)算</b></p>

72、<p>  為了確定圖片中的陰影像素,我們選擇確定光照、紋理和奇階導(dǎo)等特征。有別于使用當(dāng)個(gè)像素,我們這里利用過分出來的相似區(qū)域來計(jì)算特征值。</p><p><b>  強(qiáng)度差異[]:</b></p><p>  陰影區(qū)域相對(duì)于非陰影區(qū)域較黑,我們可以從分割圖片中提取強(qiáng)度統(tǒng)計(jì)信息。對(duì)于相鄰像素,我們計(jì)算絕對(duì)強(qiáng)度差值;對(duì)于相鄰分割塊,我們計(jì)算強(qiáng)度直方圖之間的L

73、1范數(shù)。</p><p><b>  局部最大值:</b></p><p>  在局部塊中,陰影具有相對(duì)較小的強(qiáng)度值,因此,局部最大值也會(huì)相對(duì)較小。反過來,非陰影區(qū)域具有較高的強(qiáng)度值,局部最大值也會(huì)相對(duì)較大。這里,我們?cè)诿?個(gè)相鄰像素間計(jì)算局部最大值。</p><p><b>  平滑度:</b></p>&

74、lt;p>  陰影區(qū)域可以看作相鄰區(qū)域的平滑版本,因?yàn)殛幱皟A向于抑制底層表面的局部變化。為了捕獲這個(gè)特征,我們從原始圖片中減去該圖片的平滑版本,這樣對(duì)于剩余圖片,已經(jīng)平滑的區(qū)域?qū)碛休^少的差異,高度變化的區(qū)域?qū)碛休^大的差異。</p><p><b>  梯度相似性:</b></p><p>  陰影邊界處的圖片梯度值分布是恒定的。我們使用相鄰分割區(qū)域梯度直方圖

75、間的L1范數(shù)來捕獲這種相似性。</p><p><b>  紋理相似性:</b></p><p>  觀察顯示陰影邊界處的紋理特性很少改變。我們使用[1]中介紹的方法來度量圖片區(qū)域的紋理特性。該方法首先使用一組有8個(gè)方向、3個(gè)尺度的高斯梯度過濾器過濾圖片集,然后聚類場(chǎng)128個(gè)聚類中心。新圖片中的紋理則使用這些離散中心來表示。我們也使用相鄰分割區(qū)域紋理直方圖間的L1范數(shù)

76、來度量紋理相似度。</p><p><b>  顏色比值:</b></p><p>  描述陰影邊的另一個(gè)有效特征是顏色強(qiáng)度比。在自然光照條件下陰影區(qū)域內(nèi)外的差異性,使得陰影邊界兩側(cè)的顏色強(qiáng)度會(huì)維持一個(gè)相對(duì)穩(wěn)定的比值。由于很難手工決定計(jì)算顏色比的最優(yōu)顏色空間和尺度,我們使用3個(gè)不同的顏色空間(RGB、L*a*b和[2]中提到的顏色空間)和4個(gè)不同的尺度。</p&

77、gt;<p>  對(duì)于邊界上的一個(gè)像素,通過計(jì)算邊一側(cè)的像素加權(quán)和我們得出邊這一側(cè)(比方說,左邊)的強(qiáng)度值。但是選擇哪個(gè)像素點(diǎn)?我們可以使用分水嶺分割,但是它們并沒有延伸太遠(yuǎn)。相反,我們使用方差為δ方的有向高斯衍生過濾器,但只保留大于0的值。我們對(duì)齊過濾器和邊界的方向,這樣過濾器的正權(quán)值位于邊界的左側(cè),和圖片做卷積可以得到fl。把過濾器旋轉(zhuǎn)180度進(jìn)行相同的操作可以獲得像素右側(cè)的像素加權(quán)平均值fr。這樣像素點(diǎn)p處的顏色比為

78、。這個(gè)操作在RGB、LAB、光照不變[2]顏色空間的每個(gè)顏色通道上獨(dú)立進(jìn)行。為了衡量邊的敏銳程度,我們?cè)?個(gè)尺度和大小上計(jì)算每個(gè)過濾器來獲得總共36個(gè)比值。</p><p>  我們也利用[3]中提出的兩個(gè)特征,它們能捕捉邊界兩邊的紋理和強(qiáng)度分布差異。第一個(gè)特征在4個(gè)不同的尺度上計(jì)算紋理直方圖,并使用卡方距離進(jìn)行比較。紋理字典從一個(gè)非重疊的圖片集中計(jì)算得到。第二個(gè)特征在相同的4個(gè)尺度上計(jì)算像素強(qiáng)度偏移差異。<

79、;/p><p>  最后,我們連接從顏色通道計(jì)算得到的最小過濾器響應(yīng)的絕對(duì)值來獲得每個(gè)像素點(diǎn)處最終的,完備的,48維特征向量。邊界特征向量取邊界上所有像素點(diǎn)特征向量的平均值。</p><p><b>  特征提純</b></p><p>  經(jīng)步驟4.1和4.2提取出來的陰影特征保留了原圖片中97%的陰影,然而數(shù)量巨大的陰影特征,使得陰影在提取出來

80、的陰影特征中所在的比例并不高,也就是說純度不夠,這將嚴(yán)重影響邊陰影支持度的計(jì)算。因此,我們對(duì)數(shù)據(jù)庫(kù)陰影特征進(jìn)行了提純。</p><p>  這里我們主要用到了一個(gè)觀察現(xiàn)象:戶外自然圖片中的陰影主要由大型物體倒影而成,陰影輪廓相對(duì)開闊。反過來,非陰影邊界成聚集態(tài)分布。基于這點(diǎn)我們定義松散度因子來衡量這種松散/聚集分布趨勢(shì),計(jì)算公式為:</p><p>  對(duì)于數(shù)據(jù)庫(kù)中的每一張圖片,經(jīng)過分割并

81、提取陰影特征后,我們使用Kmeans對(duì)這些特征進(jìn)行聚類,然后對(duì)每個(gè)聚類計(jì)算松散度因子,然后保留松散度因子較大的幾個(gè)聚類對(duì)應(yīng)的陰影特征。實(shí)驗(yàn)中我們?nèi)【垲悢?shù)k=10,并保留松散度陰影子最大的前3個(gè)聚類。</p><p>  圖3-3  特征聚類示意圖</p><p>  圖3-4  聚類松散度示意圖,圓圈越小表示松散度越低,反之,越大</p><p><b>

82、  支持度計(jì)算</b></p><p>  我們收集了一個(gè)經(jīng)過提純的巨大的特征數(shù)據(jù)庫(kù),這些特征包含了幾乎所有的地面陰影。為了對(duì)輸入圖片中的陰影邊進(jìn)行有效檢測(cè),我們把這個(gè)判斷問題轉(zhuǎn)化為一個(gè)概率問題,這里我們采用高斯窗口估計(jì)。高斯窗口估計(jì)作為模式識(shí)別中最經(jīng)典的概率估計(jì)模型,具有模型簡(jiǎn)易、運(yùn)算量少、易于結(jié)合等相關(guān)特點(diǎn),因而在模式識(shí)別與概率統(tǒng)計(jì)中得到了廣泛應(yīng)用。我們的陰影概率估計(jì)公式[]為:</p>

83、;<p>  此處,N為數(shù)據(jù)庫(kù)中圖片數(shù)目,為第i張圖片中保留的提純聚類數(shù)目。f代表輸入圖片中待判定的特征邊處提取的特征;代表數(shù)據(jù)庫(kù)中第i張圖片中第j條特征邊處提取的特征;代表輸入圖片中對(duì)特征邊f(xié)加權(quán)值;是高斯窗口模型參數(shù)。實(shí)驗(yàn)中我們?nèi)?1, =3。</p><p>  這樣對(duì)輸入圖片中每一條特征邊我們獲得了一個(gè)概率值,將初始的0-1判斷問題轉(zhuǎn)化為了概率問題。</p><p>

84、<b>  構(gòu)建陰影輪廓</b></p><p>  4.4中我們得出了輸入圖片中的每個(gè)特征邊的數(shù)據(jù)庫(kù)支持概率,由于輸入圖片中的特征邊通常有上萬條,數(shù)據(jù)庫(kù)中特征邊更是巨大無比,所以,我們假定輸入圖片中特征邊的支持概率服從正太分布,并且取3范圍內(nèi)的特征邊為強(qiáng)陰影邊。由中心極限定理可以知道,單個(gè)獨(dú)立同分布事件隨著重復(fù)次數(shù)增長(zhǎng)其整體將逐漸趨于正太分布,所以我們這里的假設(shè)是有理論依據(jù)的,同時(shí)我們的實(shí)

85、驗(yàn)結(jié)果也驗(yàn)證了這點(diǎn)。</p><p>  雖然3檢測(cè)取得了較好的效果,但是它只抓住了整體分布的趨勢(shì),并且是孤立地對(duì)待每條特征邊。然而,局部區(qū)域內(nèi)陰影邊界左右的顏色比應(yīng)該是一致的,因?yàn)閳?chǎng)景局部區(qū)域內(nèi)的光照情況是相似的。為此,我們引入條件隨機(jī)域來建模局部邊界之間的更高階依賴關(guān)系。</p><p>  為了建模這些依賴關(guān)系[],我們使用獨(dú)立的邊界作為節(jié)點(diǎn)構(gòu)建圖,用邊連接交叉的邊界。然后我們?cè)趫D上

86、定義條件隨機(jī)域,這個(gè)圖將在給定觀察到的數(shù)據(jù)x的條件下特定標(biāo)簽y(比如每個(gè)邊界的陰影/非陰影賦值)的對(duì)數(shù)似然值表示為一元式和二元式的和:</p><p>  這里B是邊界的集合,E是邊界之間的邊集合, λ和β是模型參數(shù)。特別的,λ是控制兩個(gè)項(xiàng)相對(duì)重要性的重要性。是依賴于λ和β的特定函數(shù),但不依賴y本身。</p><p>  直觀地,我們希望一元式[]懲罰根據(jù)我們的局部分類器不大可能為陰影卻被

87、標(biāo)記為“陰影”的賦值。這可以建模為:</p><p>  我們也希望二元項(xiàng)[]懲罰有相似特征的臨近邊界標(biāo)注不同標(biāo)簽的賦值,這可以記作:</p><p>  這里1(·)是指示函數(shù),β是對(duì)比-正則化常量。實(shí)驗(yàn)中=0.5,=16。</p><p><b>  結(jié)合場(chǎng)景布局</b></p><p>  因?yàn)槲覀円恢笨?/p>

88、慮的是檢測(cè)地面上的陰影,所以,對(duì)于地面概率較低但被標(biāo)記為陰影的特征邊,我們要加大懲罰力度;當(dāng)?shù)孛娓怕瘦^大時(shí),我們讓初始的數(shù)據(jù)庫(kù)概率統(tǒng)計(jì)值決定。這里,我們可以簡(jiǎn)單地修改CRF模型[]中的一元項(xiàng)得到:</p><p><b>  實(shí)驗(yàn)及結(jié)果分析</b></p><p>  圖3-5  實(shí)驗(yàn)結(jié)果,圖片來自數(shù)據(jù)庫(kù)以外</p><p>  圖3-6  實(shí)

89、驗(yàn)結(jié)果,圖片來自數(shù)據(jù)庫(kù)</p><p><b>  結(jié)論</b></p><p><b>  工作展望</b></p><p>  陰影作為日常生活中常見的自然現(xiàn)象,其廣泛存在性使得其牽涉計(jì)算機(jī)視覺應(yīng)用中的方方面面。陰影檢測(cè)作為計(jì)算視覺中的基礎(chǔ)問題,對(duì)其進(jìn)行深入研究具有舉足輕重的意義。</p><p&g

90、t;  本文提出一個(gè)全新陰影檢測(cè)方法,并在多數(shù)高難度圖片上表現(xiàn)出了非常好的效果,這是傳統(tǒng)方法無法企及的。但在后續(xù)工作中我們還可以在如下幾個(gè)方面進(jìn)行改進(jìn)和提高:</p><p>  1、對(duì)于數(shù)據(jù)庫(kù)特征提純,我們只利用了一個(gè)相對(duì)初淺的觀察現(xiàn)象,這個(gè)現(xiàn)象具有較大的局限性,使得整個(gè)提純過程的查全率、查準(zhǔn)率都較低。因此,我們需要提出更好的提純方法。</p><p>  2、在由陰影概率確定強(qiáng)陰影邊的

91、時(shí)候,我們簡(jiǎn)單地取了3范圍內(nèi)的特征邊,這種做法缺乏較強(qiáng)的事實(shí)依據(jù),并且過于絕對(duì)。因此,我們需要尋找更有效的概率陰影判別模型。</p><p><b>  工作總結(jié)</b></p><p>  本次畢業(yè)設(shè)計(jì)歷時(shí)近6個(gè)月,從最初的資料搜索到最終論文成型,其間過程曲折反復(fù),現(xiàn)做如下總結(jié):</p><p>  科學(xué)研究和設(shè)計(jì)是一個(gè)不斷積累的傳承過程,我

92、們?cè)谧龉ぷ鞯臅r(shí)候不可能從零開始憑自己的力量完成全部工作,因?yàn)檫@中間某些路前人已經(jīng)實(shí)踐過并且傳承下來了。我們要做的是首先努力爬到巨人的肩膀上,然后奮力一跳摘取勝利的果實(shí)。</p><p>  相比技術(shù)開發(fā),學(xué)術(shù)論文研究側(cè)重研究全新的問題和未知的領(lǐng)域。在這個(gè)摸索的過程中,我們必然會(huì)遭遇非常強(qiáng)烈的不缺定境況,當(dāng)前是困難的,下一步是不確定的,但再下一步就是光明,我們所要做的是克服眼前的困難、堅(jiān)定不移地超前走。堅(jiān)持很重要。

93、</p><p><b>  參考文獻(xiàn)</b></p><p><b>  致  謝</b></p><p>  從論文選題到搜集資料,從寫稿到反復(fù)修改,期間經(jīng)歷了喜悅、聒噪、痛苦和彷徨,在寫作論文的過程中心情是如此復(fù)雜。如今,伴隨著這篇畢業(yè)論文的最終成稿,復(fù)雜的心情煙消云散,自己甚至還有一點(diǎn)成就感。這篇畢業(yè)論文是展現(xiàn)自我

94、的舞臺(tái),以下的言語便是有點(diǎn)成就感后在舞臺(tái)上發(fā)表的發(fā)自肺腑的誠(chéng)摯謝意與感想: </p><p>  我要感謝,非常感謝我的導(dǎo)師xx老師。他為人隨和熱情,治學(xué)嚴(yán)謹(jǐn)細(xì)心。在閑聊中他總是能像知心朋友一樣鼓勵(lì)你,在論文的寫作和措辭等方面他也總會(huì)以“專業(yè)標(biāo)準(zhǔn)”嚴(yán)格要求你,從選題、定題開始,一直到最后論文的反復(fù)修改、潤(rùn)色,xx老師始終認(rèn)真負(fù)責(zé)地給予我深刻而細(xì)致地指導(dǎo),幫助我開拓研究思路,精心點(diǎn)撥、熱忱鼓勵(lì)。正是xx老師的無私幫

95、助與熱忱鼓勵(lì),我的畢業(yè)論文才能夠得以順利完成,謝謝xx老師。</p><p>  我要感謝,非常感謝xx師兄。正在撰寫學(xué)術(shù)論文的他,在百忙之中抽出時(shí)間幫助我搜集文獻(xiàn)資料,幫助我理清論文寫作思路,對(duì)我的論文提出了諸多寶貴的意見和建議。對(duì)師兄的幫助表示真摯的感謝。</p><p>  我要感謝,非常感謝xx學(xué)長(zhǎng)。他為我在論文寫作規(guī)范方面提供了寶貴的經(jīng)驗(yàn),同時(shí),在答辯技巧方面給予很大的幫助。對(duì)學(xué)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論